4月15日,中国计算机学会(CCF)推荐的A类国际学术会议SIGIR 2021论文接收结果公布。高瓴人工智能学院师生有10篇论文被录用,其中长文9篇,学院主要作者论文7篇,Resource论文1篇,并有多篇短文录用。SIGIR是人工智能领域智能信息检索方向最权威的国际会议。第44届国际计算机学会信息检索大会(The 44rd International ACM SIGIR Conference on Research and Development in Information Retrieval, SIGIR 2021)计划于2021年7月11日-7月15日以线上会议形式召开。这次会议共收到720篇长文投稿,仅有151篇长文被录用,录用率约21%。
附:论文介绍
论文题目:Counterfactual Reward Modification for Streaming Recommendation with Delayed Feedback
作者:张骁,贾浩男,苏函晶,王文瀚,徐君,文继荣
通讯作者:徐君
论文概述:推荐系统中普遍存在用户延迟反馈问题。例如,在优惠券推荐场景中,用户对所推荐优惠券的反馈通常包含即时领取和延迟核销两部分。用户的延迟反馈问题会使得收集到的用户历史数据中存在标签缺失或标签错误的情形,导致学习到的推荐模型存在偏差,对推荐效果造成了负面影响。该问题在推荐模型需要频繁更新、训练样本收集时间较短的流式场景中尤为突出。本文提出了一种可自动修正用户反馈的反事实批量化赌博机算法(Counterfactual Bandit with Delayed Feedback,CBDF)。CBDF将延迟反馈下的推荐问题归约为序列决策问题并应用批量化赌博机建模。对于延迟反馈,CBDF在序列决策中的每一幕中,应用反事实采样方法修正用户反馈,生成修正后的奖励值,并应用批量化赌博机策略实现在线推荐。理论分析表明所提出的奖励修正方法是统计无偏的,并且学习到的推荐策略序列较最优策略具有亚线性的后悔界。在人工数据、公开数据和腾讯实际产品数据上的实验结果表明:所提出的CBDF较已有推荐算法具有较高的CVR和CTCVR,且具有较高的计算效率。