高瓴人工智能学院2篇论文被CCF A类会议KDD录用
5月16日,中国计算机学会推荐的A类国际学术会议KDD2021论文接收结果公布。高瓴人工智能学院师生有2篇论文被录用。国际数据挖掘与知识发现大会是数据挖掘领域的国际顶级会议。2021年共有1541篇有效投稿,其中238篇论文被接收,接收率为15.44%。
2021年1月至今,高瓴人工智能学院已发表或被录用CCF A类国际期刊或和会议论文49篇、CCF B类期刊和论文8篇,以人大师生为第一作者或通讯作者发表的论文数量为52篇。
论文题目:Approximate Graph Propagation
作者:王涵之,何明国,魏哲巍,王思博,袁野,杜小勇,文继荣
通讯作者:魏哲巍
论文概述:节点邻近度的高效计算在众多图挖掘和表示学习问题中都有着广泛的应用,例如社区发现、图神经网络应用中的节点分类问题等。但是,现有工作普遍只着眼于某一特定的邻近度指标,而缺乏一种通用的算法同时支持绝大多数节点邻近度指标的高效计算。本篇论文将多种节点邻近度指标归纳为一种通用的计算范式,针对该通用范式提出了一种可以高效计算绝大多数节点邻近度指标的算法AGP。通过严格的理论分析,我们证明了AGP算法可以在近似最优的时间复杂度下完成所有符合该通用范式的邻近度指标的计算,例如Personalized PageRank、Heat Kernel PageRank、transition probability、Katz、图神经网络中的特征传播过程等。我们以社区发现和图神经网络应用中的节点分类场景为例,借助大量的实验证明了AGP算法的有效性。特别地,在以GNN为基础的节点分类问题中,AGP成功将多种GNN模型的支持数据大小扩展到了目前最大的公开数据集Papers100M,AGP可以在半小时内单机单卡完成Papers100M上的训练过程。
论文题目:Data Poisoning Attack against Recommender System Using Incomplete and Perturbed Data
作者:Hengtong Zhang,田长鑫,Yaliang Li,Lu Su,Jing Gao,Nan Yang,赵鑫
论文概述:最近的研究表明,推荐系统由于其开放性,它们很容易受到数据投毒攻击。在数据投毒攻击中,攻击者通常会通过一组受控制的用户将精心设计的用户—项目交互数据注入推荐模型的训练集,以便根据需要修改模型参数。因此,现有的攻击方法通常需要完全访问训练数据,从而推断物品的特征,并为受控制的用户制造虚假交互。但是,由于攻击者数据收集能力的有限和推荐服务方隐私保护机制的干扰,攻击者无法实现对训练数据的完全访问,这导致这种攻击方法在实践中可能并不可行。在本文中,我们提出了两种新的对抗攻击方法来处理训练数据的不完整性和扰动。首先,我们提出了一个双层优化框架,结合概率生成模型来寻找训练数据中未被显著干扰的用户—物品交互,并利用这些交互数据来制造虚假的用户—物品交互。此外,我们逆转了推荐模型的学习过程,并在此基础上开发了一种简单而有效的方法,该方法可以结合上下文特定的启发式规则来处理数据的不完整性和扰动。我们在两个数据集上对三种典型推荐模型进行了大量实验,实验结果表明,所提出的方法比现有方法具有更好的攻击性能。
来源:高瓴人工智能学院