+高级检索
基于策略记忆的深度强化学习序列推荐算法研究
DOI:
作者:
作者单位:

青岛科技大学

作者简介:

通讯作者:

基金项目:

国家自然科学基金项目(面上项目,重点项目,重大项目),山东省重点研发计划项目


Research on Deep Reinforcement Learning Sequential Recommendation Algorithm based on Policy Memory
Author:
Affiliation:

Qingdao University of Science and Technology

Fund Project:

the National Natural Science Foundation of China,Shandong Provincial Key RESEARCH and Development Plan Project Funding

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    序列推荐旨在从用户-项目的交互中进行动态的学习和建模,对用户的兴趣变化做出预测,从而提高推荐的准确性,改善用户体验。然而大多数用户-项目的序列并不总是顺序相关的,而是有更灵活的顺序甚至存在噪声。为解决这一问题本文将用户的历史交互存入记忆网络,使用一个策略网络将用户当前的行为模式更细致的划分为短期偏好、长期偏好以及全局偏好,并引入注意力机制生成相应的用户记忆向量,利用深度强化学习算法识别对未来收益较大的项目。在用户和项目的交互中不断更新强化学习网络策略以提高推荐准确性。在两个公共的数据集的实验中表明,本文所提出的模型优于先进的基线。

    Abstract:

    The purpose of sequential recommendation is to learn and model dynamically from the user-project interaction, and predict the change of user interest, so as to improve the accuracy of recommendation and user experience. However, most user project sequences are not always sequential, but have more flexible order and even noise. In order to solve this problem, this paper stores the user's historical interaction into the memory network, uses a strategy network which divides the user's current behavior pattern into short-term preference, long-term preference and global preference. Then we use the attention mechanism to generate the corresponding user-memory vector, and use deep reinforcement learning algorithm to identify projects with greater future benefits. In the interaction between users and projects, reinforcement learning network strategy is constantly updated to improve the accuracy of recommendation. The experiments of two common data sets show that the model proposed in this paper is superior to the advanced baseline.

    参考文献
    相似文献
    引证文献
文章指标
  • PDF下载次数:
  • HTML阅读次数:
  • 摘要点击次数:
  • 引用次数:
引用本文
历史
  • 收稿日期: 2021-06-29
  • 最后修改日期: 2021-09-13
  • 录用日期: 2021-09-16
  • 在线发布日期:
  • 出版日期:
作者稿件一经被我刊录用,如无特别声明,即视作同意授予我刊论文整体的全部复制传播的权利,包括但不限于复制权、发行权、信息网络传播权、广播权、表演权、翻译权、汇编权、改编权等著作使用权转让给我刊,我刊有权根据工作需要,允许合作的数据库、新媒体平台及其他数字平台进行数字传播和国际传播等。特此声明。
关闭