5月1日,中国计算机学会(CCF)推荐的A类国际学术会议ICML 2025论文接收结果公布。中国人民大学高瓴人工智能学院师生有19篇论文被录用。国际机器学习大会(The International Conference on Machine Learning,简称ICML )是机器学习和人工智能领域的顶级国际学术会议。ICML 2025将于2025年7月13日-7月19日在加拿大温哥华举办。
论文介绍
论文题目:Rethinking the Bias of Foundation Model under Long-tailed Distribution
论文介绍论文题目:Rethinking External Slow-Thinking: From Snowball Errors to Probability of Correct Reasoning作者:甘泽宇,廖芸,刘勇通讯作者:刘勇论文概述:测试时扩展(test-time scaling,常被称为“慢思考”)已被证明能够增强大语言模型(LLM)的多步推理能力。然而,尽管该方法被广泛使用,其背后的机制仍缺乏深入理解。本文从理论角度探讨了外部慢思考方法的作用机理。我们首先基于推理过程的全新建模分析了LLM推理过程中的“雪球误差”效应,并用信息论将其与正确推理的概率联系起来。在此基础上,我们证明外部慢思考方法可被理解为通过多次采样降低错误概率的策略。进一步,我们对当前流行的外部慢思考方法(从简单的BoN到复杂的MCTS)进行了对比分析,阐明其差异与内在关联。研究发现,这些方法的有效性并非主要取决于具体框架的设计,而扩大搜索范围或提升模型内部推理能力可能带来更长期的性能提升。
论文介绍
论文题目:Position: Spectral GNNs Rely Less on Graph Fourier Basis than Conceived
论文题目:UniMoMo: Unified Generative Modeling of 3D Molecules for De Novo Binder Design
作者:孔祥哲,张子申,张梓婷,矫瑞,马剑竹,黄文炳,刘凯,刘洋
通讯作者:黄文炳,刘凯,刘洋
论文概述:靶向特异性分子(如小分子、肽和抗体)的设计��������对于生物学研究和药物研发至关重要。现有的生成方法局限于单一分子域,既无法满足多样化的治疗需求,也难以利用跨域可迁移性来提升模型性能。本文提出了首个能够通过单一模型设计多分子域结合剂的框架——��������三维分子统一生成模型(UniMoMo)��������。具体而言,UniMoMo将不同分子的表征统一为��������块状图(graphs of blocks)��������,其中每个"块"对应一个标准氨基酸或分子片段。基于这一统一表征,UniMoMo采用��������几何隐扩散模型��������实现三维分子生成:其核心包括一个��������迭代式全原子自动编码器��������(将分子块压缩为隐空间点),以及一个��������E(3)等变扩散过程��������。通过对肽、抗体和小分子的广泛基准测试,我们的统一框架展现出优于现有单域模型的性能,凸显了多域联合训练的显著优势。
论文介绍
论文题目:Reviving the Cooperation Dynamics in Multimodal Transformer