[发明专利]一种音频类产品的实时多召回策略的融合方法有效
申请号: | 201911211991.7 | 申请日: | 2019-12-02 |
公开(公告)号: | CN110942376B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 雷鸣 | 申请(专利权)人: | 上海麦克风文化传媒有限公司 |
主分类号: | G06Q30/0601 | 分类号: | G06Q30/0601 |
代理公司: | 上海九泽律师事务所 31337 | 代理人: | 周云;卢双双 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 类产品 实时 召回 策略 融合 方法 | ||
1.一种音频类产品的实时多召回策略的融合方法,其特征在于:包括如下步骤:
S1:实时触发推荐
需要制定相应的实时触发条件,基于用户发生实时有效收听行为或实时搜索点击行为进行触发,有效收听标准是用户收听专辑超过60s或者用户收听专辑时长是该专辑的所有节目平均时长的一半以上,搜索点击行为指的是用户通过搜索框搜索关键词后,得到搜索列表后,点击专辑,则触发推荐;
S2:确定召回策略
由步骤S1中的触发推荐根据相关度实时召回策略A,根据播放热度实时召回策略B,根据Embedding实时召回策略C,根据新鲜度实时召回策略D,根据ALS离线召回策略E;
S3:多策略融合
对步骤S2中的相关度实时召回策略A、播放热度实时召回策略B、Embedding实时召回策略C、新鲜度实时召回策略D、ALS离线召回策略E进行ABtest,制定覆盖率、PTR播放率指标,得到各个召回策略效果的优劣,根据结果优劣得到各个召回策略的优先级,对于优先级高的召回策略召回的专辑,排在前面,目标数量设定偏大,优先级次之的召回策略的专辑排在后面,目前数量偏小,并且需要和之前优先级高的召回专辑进行去重,依次类推得到最终的融合召回集。
2.根据权利要求1所述的一种音频类产品的实时多召回策略的融合方法,其特征在于:所述相关度实时召回策略A主要是通过四块内容进行结合得到的结果:协同过滤、专辑标签相似度、专家意见、主播相似度。
3.根据权利要求1所述的一种音频类产品的实时多召回策略的融合方法,其特征在于:所述播放热度实时召回策略B通过计算每日活跃用户最近90天的播放专辑次数分类目进行统计,可以获得每个类目按照播放次数从大到小排序的专辑列表。
4.根据权利要求1所述的一种音频类产品的实时多召回策略的融合方法,其特征在于:所述Embedding实时召回策略C通过获得用户最近半年的播放专辑序列,调用Word2Vec的模型,得到专辑向量,从而得到每个专辑的相关专辑列表。
5.根据权利要求4所述的一种音频类产品的实时多召回策略的融合方法,其特征在于:所述Embedding实质是一种映射,从语义空间到向量空间的映射,同时尽可能在向量空间保持原样本在语义空间的关系,所述Word2Vec模型是一群用来产生词向量的相关模型。
6.根据权利要求1所述的一种音频类产品的实时多召回策略的融合方法,其特征在于:所述新鲜度实时召回策略D通过Bandit算法得到用户对各个类目的偏好,获得属于该用户偏好类目的新上线专辑作为实时召回集。
7.根据权利要求6所述的一种音频类产品的实时多召回策略的融合方法,其特征在于:所述Bandit算法通过赋予音频类产品一个Beta分布,而不是单一的值,每次排序时通过采样随机获得一个排序值。
8.根据权利要求7所述的一种音频类产品的实时多召回策略的融合方法,其特征在于:所述Beta分布是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数。
9.根据权利要求1所述的一种音频类产品的实时多召回策略的融合方法,其特征在于:所述ALS离线召回策略E通过获取每天活跃用户最近90天的播放日志,得到用户的Implicit-score-data格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海麦克风文化传媒有限公司,未经上海麦克风文化传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911211991.7/1.html,转载请声明来源钻瓜专利网。