策略产品实践笔记
博主微信公众号:价值老猿,博主整理的产品、投资方面的深度思考和实习、秋招相关信息将会持续发布到上面,敬请关注!!!
:内容产品的推荐策略
推荐系统就是筛选排序(筛你喜欢的,排序推送),推荐模型就是通过已知输入输出信息学习规律,进而用输入数据预测未知信息的模型(比如已知用户数与年龄分布为输入,用户收入为输出,学习出一个20岁以上收入增加10,进而根据新的用户数及年龄,预测他们的总收入),推荐系统就是基于推测模型预测用户喜好及优先顺序。
推荐系统策略是其次,数据是关键,美团收购摩拜实现数据的闭环,用户在美团搜索理发店及路径,乘公交车换成单车到底理发店,用美团结算。
推荐系统的指标体系:产品形态,用户,融资、发展阶段不同都会有不同的体系。
一级指标以客观指标为主,次日留存,日活,人均收入,CPM,技术系统时延等,一般1~2个一级指标;
二级指标在客观基础上需要加入主观评估指标,包括内部评估指标(基于平台价值观)和外部评估指标(基于用户价值观)???,一般3~7个
三级指标是细分页面的非大盘指标。
推荐系统的能力边界在哪里?取决于候选集数量,而如何产生更多的候选集数量,则依赖于生产端策略;
推荐系统要想发挥做用的前提:信息过载,用户需求不明。
推荐系统的输入:用户行为,分为显示反馈和隐士反馈,浏览购买点击评分评论等
推荐冷启动:用户冷启动(新用户推什么)、内容冷启动(新内容推给谁)
用户冷启动方法:
(1)定制列表:千人一面热门榜单
(2)注册信息,IP属性,下载渠道,手机型号,注册信息的年龄性别
(3)关系链:通讯录,社交网站好友列表
(4)兴趣页面。
内容冷启动呢?
推荐系统的推荐模式,优劣及适用场景
基于用户协同推荐:找到有相似爱好的用户集合,将这些用户喜欢的推荐给目标用户;内容冷启动很好(上新后只要有用户访问过,就能推荐出去),可解释性较差,并且用户列表增加后开销增大;适用于用户兴趣趋同(新闻兴趣是热点),用户数少于内容数(为什么?)
基于物品协同推荐:找用户喜欢物品相似的物品推荐,注意不是基于物品画像判断相似,而是通过行为画像,判断喜欢A的人大概率喜欢B,可解释性好,开开销相对小,适用于用户个性化强(电商购物兴趣个性化显著),用户数多于内容数(为什么?)
基于兴趣特征推荐:首先得到用户兴趣分类,对应寻找喜欢的物品;模型效果好但是开销大,难以在线推荐
基于上下文推荐:包括时间,地点也算上下文,实时性要求开销大,适用于深度使用的高频产品;
基于物品画像推荐:比如对内容分类进行推荐;标签建立需要大工作量,可解释性和冷启动都很好。
标签体系的搭建方式、设计原则、评估指标:
搭建方式:专家系统标签、用户生产标签。
专家系统标签推荐效果、可解释性更好,但是需要大量资源投入,且实时性不强;
用户生产标签弥补了实时性问题,让流行内容快速纳入标签体系,但是受限于用户自己的语言习惯,可解释性较差。
所以用户标签有一个清理规范问题:主要分为人工审查+用户自查(设定可生产标签的用户等级,设立纪律委员会)
原则:MECE+控制每一层数量不要过多。
如何评估标签系统:两个层次得指标:
召回率和准确率:可以理解为,遗漏率和准确率,就是有多少物品能被打上标签;这些物品打的标签是否准确(双盲一致率)
推荐系统指标:对比使用新标签后的系统表现
芝麻信用分等社交资本的设计思路?
内容产品什么事优质内容?稀缺性如何度量?
高低质量评论的策略设计?
用户对连载内容喜欢程度的度量?
字节电商平台去劣存优的策略设计?
策略设计基本原则:策略做粗,特征做细,先预估后计算(预估目标天花板,拆解目标,计算ROI),先规模后完善,先上游后下游。
什么是策略做粗?比如如何给连载漫画APP做冷启动?
什么是特征做细?内容和用户画像:构建特征-评估特征-维护特征;构建阶段:自动+标注;评估:准确率召回率;维护:设计后台和数据流程,定义监控特征完备度的描述量,为实现平台共享融入中台做准备;
先上游:上海某小区外卖超时率超过其他小区;原因是该小区修路需要绕道,即POI定位不准确导致的,首先要衡量解决POI定位的ROI,再去想其他策略。
先预估:天花板预估方法:分层。比如阅读时长往往是幂律分布,按照0~50小时人数转化率100%。100小时以上人数转化率是0%,进行整体转化率预估。