信息学院人工智能与媒体计算实验室(AIMC Lab)关于图像篡改检测的论文被国际期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI)录用。T-PAMI是人工智能、计算机视觉、模式识别等多个领域的顶级期刊,也是计算机学科影响因子最高的刊物之一(2020年影响因子16.389)。论文共同一作是来自AIMC实验室的两位硕士生董程博和陈欣茹。该论文由信息学院李锡荣副教授指导。
研究图像篡改检测(image manipulation detection) 对于数字媒体取证(digital media forensics)和网络空间可信信息共享(trustworthy information sharing)等具有重要意义。本文提出了一种新的基于多视角(multi-view)、多尺度(multi-scale) 监督的图像篡改检测深度神经网络:MVSS-Net。为了兼顾模型在篡改图像检测上的灵敏度和在真实图像上的特异度,MVSS-Net 设计多视角特征学习提取语义无关的篡改边界特征和噪声分布特征,并采用多尺度监督对像素位分割、边界预测和图像级分类进行约束,在多个公开评测集上达到了业界领先水平。
本文是课题组ICCV 2021论文(Image Manipulation Detection by Multi-View Multi-Scale Supervision) 的期刊扩展版。相比会议版本,本文受格式塔理论启发,设计了一种名为卷积广义平均池化(ConvGem) 的新模块,有效解决了之前将像素级预测转换为图像级预测时存在的若干技术缺陷,使得模型综合性能得到进一步提升。