高瓴人工智能学院2篇论文被VLDB 2021和VLDB Journal录用

高瓴人工智能学院教授魏哲巍作为通讯作者的2篇论文被国际顶级期刊会议VLDB 2021和VLDB Journal录用。VLDB是数据管理与数据库领域的三大国际顶尖学术会议之一,VLDB Journal是数据库领域的顶级国际期刊。二者均被中国计算机学会(CCF)推荐为A类国际会议/期刊。

论文题目: Massively Parallel Algorithms for Personalized PageRank(VLDB 2021)

作者:侯冠豪,陈星光,王思博,魏哲巍

通讯作者:王思博,魏哲巍

论文概述:Personalized PageRank(PPR)是一种图节点邻近度的衡量方式,被广泛应用于社交推荐、个性化搜索、社区发现等领域。随着大数据时代的到来,超大规模图数据上的PPR计算问题往往无法在单机上完成。本篇论文重点关注于PPR的并行计算问题,基于Massively Parallel Computing(MPC)模型,在固定机器负载的前提下,设计了一种通讯轮数(rounds)更少的并行PPR算法Delta-Push。此外,该算法还可以根据机器数的变化,进一步调整通讯轮数。大量实验表明,Delta-Push的性能好于现有并行PPR算法。

论文题目: ExactSim: Benchmarking Single-Source SimRank Algorithms with High-Precision Ground Truths(VLDB Journal)

作者:王涵之(博士生),魏哲巍,刘钰,袁野,杜小勇,文继荣

通讯作者:魏哲巍

论文概述:SimRank作为图节点相似度衡量方向的代表性算法,在链接预测、网络分析等领域均有广泛应用。然而,目前唯一能够精确计算单源SimRank的方法Power Method受限于其高昂的计算复杂度而无法应用于大规模图集,近年来提出的多种SimRank近似算法也因为精确结果的缺乏而无法得到科学的性能评估。本篇论文详细调研了现有的支持大规模图数据的单源SimRank近似算法,分析了其无法实现精确查询的原因。基于这一分析,本篇论文提出了首个支持大规模图集上单源SimRank精确计算的算法ExactSim,并且通过严格的理论证明保证这一结果以高概率达到10^(-7)的误差精度。此外,本篇论文首次使用ExactSim计算得到的单源SimRank精确结果,评估了现有近似算法的性能表现,探寻了大规模真实图和合成图上SimRank的分布情况和密度性质。


来源:高瓴人工智能学院