新媒易动态
NEWS CENTER
NEWS CENTER
2023-09-19
依据用户特征提供个性化的界面——千人千面的原理便是利用深度学习模型(XGB梯度上升模型)。例如依据用户数据来学习用户或许的偏好类型,然后推荐对应偏好的商品、榜单等卡片款式。
这儿的用户数据包括电商APP中用户注册信息数据和用户打开APP后的操作行为数据。
算法侧会依据用户的注册信息对用户或许的偏好进行打分并推荐分值最高的那一类偏好款式。
用户看到对应的各类款式后会有相应的行为数据(比如点击)反应到算法,算法再依据反应回的用户行为数据不断地优化模型里的权重值。
履行流程咱们可分为算法线和规划线两条线,其间算法线交互同学需要重视的是前两个步骤,也便是数据收集和数据预备,而规划线则需要咱们做款式输出、将素材上传到后台并打标,以及上线后的数据复盘并依据数据优化款式。
1)数据预备
在收集数据前需要要和算法同学明确咱们的建模指标是什么?即基于什么样的用户行为数据输入让机器去学习(比如点击PV或者曝光PV)。
而数据预备阶段需要咱们对历史数据按照必定份额进行切割,一般是70%作为练习集、30%作为验证集和测验集。练习集的作用是让模型对初始权重值进行练习;而验证集则是用模型和学习来的权值来进行预测,验证学习来的权值是否是最优解;测验集则是评价模型的终究性能,比如评价模型的准确率、召回率等等。
打个比如练习集就像是学生的课本,学生依据课本里的内容来把握知识。验证集就像是作业,经过作业可以知道 不同学生学习情况、前进的速度快慢。而终究的测验集就像是考试,考的题是往常都没有见过,考察学生举一反三的能力。
2)款式输出
规划线则是咱们规划同学比较擅长的部分了。在履行规划线时,咱们首先要对现有各类型卡片的信息结构做拆解和归类,再依据前面定义的用户类型对款式做相应规划(强化某类偏好信息的可视度)。
以feed流的商品卡片为例,关于价格偏好的款式咱们会以价格波动曲线的款式来表达,而关于品质偏好的款式咱们则会强化好评率信息的表达。