信息学院人工智能与媒体计算(AIMC)实验室在AI顶级刊物T-PAMI上发表研究成果

信息学院人工智能与媒体计算实验室关于短视频检索的研究成果近日在国际期刊 IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI) 上发表。T-PAMI是人工智能、计算机视觉等领域的顶级刊物,2019年影响因子达17.9,是计算机领域影响因子最高的刊物之一。

随着短视频应用的普及和短视频用户的快速增长,短视频检索正成为学术界和工业界共同关心的研究课题。在这篇名为Dual Encoding for Video Retrieval by Text的论文中,作者提出了一种新的对偶编码网络对文本查询和短视频进行跨模态表征学习(cross-modal representation learning)和语义相关度匹配,并通过混合空间学习(hybrid space learning)构建了兼具匹配精度和匹配结果可解释性的公共空间,在多个公开评测集上达到了业界领先水平。AIMC团队的信息学院副教授李锡荣为该论文的第一通讯作者。

论文信息:Dong et al., Dual Encoding for Video Retrieval by Text, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021, https://ieeexplore.ieee.org/document/9354593


来源:信息学院