做推荐的第一步是数据埋点
数据埋点相当于收集用户行为的反馈,缺乏用户反馈优化不了推荐 (产品),也做不了推荐。一方面,要收集曝光/点击/交互,作为训练数据的 label;另一方面,需要做AB实验分析,评估策略/模型/工程优化的效果。
那么,什么是数据埋点呢?能用一句话描述清楚吗?
描述某个时刻,某个用户,在某个产品位置,对某个目标对象,做的某个动作;这个整体也称为事件,一条埋点数据就描述了一个事件的发生。
埋点的工程实现还是蛮有挑战的,首先,这是个高并发且IO密集型场景,需要高可用,保证数据不丢失;其次,很多人不清楚埋点的本质,以及哪些数据适合(需要)通过埋点获取,数据质量往往问题很严重;最后,数据量大,然而使用方希望准实时地拿到反馈结果。
#大数据#
那么,什么是数据埋点呢?能用一句话描述清楚吗?
描述某个时刻,某个用户,在某个产品位置,对某个目标对象,做的某个动作;这个整体也称为事件,一条埋点数据就描述了一个事件的发生。
埋点的工程实现还是蛮有挑战的,首先,这是个高并发且IO密集型场景,需要高可用,保证数据不丢失;其次,很多人不清楚埋点的本质,以及哪些数据适合(需要)通过埋点获取,数据质量往往问题很严重;最后,数据量大,然而使用方希望准实时地拿到反馈结果。
#大数据#