阿里MIND网络:天猫首页是如何给用户做多兴趣embedding的?

Viewed 27

在推荐系统的召回和精排阶段,表征用户兴趣是很关键的因素。一般做法是为每个用户生成1个embedding,而阿里MIND网络提出为每个用户生成多个embedding以表征同一用户的不同兴趣,且已部署在天猫首页主流量位置。

**MIND模型输入包含三组特征:userprofile,userbehavior和label对应的targetitem。**对于userprofile,将所有id特征(如性别、年龄)转换成embedding。通过多兴趣提取器层,对用户行为序列embedding得到多个兴趣Capsule,这些兴趣Capsule表达用户多样的兴趣分布,不同的兴趣Capsule表示用户兴趣的不同偏好,以此得到用户的多个兴趣embedding。

得到用户的多个兴趣embedding后,对于targetitem,可通过attention机制来生成最终用户的embedding。在训练阶段,目标是在vu(用户多兴趣embeddings)的情况下,用户是否会和ei(目标item对应的embedding)交互。在serving阶段,可以提前计算好每个用户对应的多个embedding并保存起来,同时取出与这些embedding最相似的embeding索引起来,作为用户兴趣的候选集。

为了使胶囊网络适合做聚类,MIND网络还做了一些修改。例如bij初始化的时候用了正态分布;bilinearmappingmatrix是共享的;每个用户最终的兴趣embedding个数根据用户交互序列的个数和超参数K来计算。通过这些方式,天猫首页利用MIND网络实现了对用户做多兴趣embedding。

0 Answers