人大高瓴2名学子获批国家自然科学基金青年学生基础研究项目
信息来源:人大高瓴人工智能学院 发布时间:2025年12月19日
近日,2025年国家自然科学基金青年学生基础研究项目(博士研究生)评审结果公布,中国人民大学高瓴人工智能学院2位博士生董冠霆、郑晨宇申报的项目成功获得资助。
国家自然科学基金青年学生基础研究项目(博士研究生)设立于2023年,是国家自然科学基金委加强优秀青年人才培养的创新之举。采用“推荐+评审”制,包括个人申请、校内选拔、基金委通讯评审、基金委会议评审等多轮具有竞争性的选拔环节。
1
大语言模型驱动的深度信息
获取方法研究
个人简介
董冠霆,高瓴人工智能学院2024级博士生,导师为文继荣教授与窦志成教授。研究方向聚焦于深度搜索智能体、智能体强化学习等前沿领域。以第一/共同第一作者身份在ICLR、NeurIPS、ACL、WWW等国际顶级会议发表论文10余篇;获授权国家发明专利2项。其研究成果受到国内外同行广泛关注,谷歌学术引用量已达9000余次。在理论研究的同时,积极推动成果向实践转化,个人GitHub项目累计获得星标6000余枚,并在字节跳动Seed、阿里通义千问、快手快意大模型等核心基座大模型团队实习。曾获两次国家奖学金、北京市优秀毕业生等荣誉。
项目简介
大语言模型是当前人工智能研究的热点,尽管它在自然语言处理任务中表现优异,但由于无法准确存储世界上所有知识,大语言模型常会生成不符合真实世界的“幻觉”内容。引入信息检索系统检索“外部”知识对大语言模型进行增强是解决这一问题的有效途径。然而,随着互联网信息量的激增与大数据的普及,当前检索增强方法在复杂语义理解、深层次网络信息挖掘与海量信息整合方面均表现出明显的局限性。因此,本课题旨在探索大语言模型驱动的深度信息获取方法。首先,我们将设计一个面向深度信息获取的通用推理框架,并在此基础上实现智能体训练的全链路优化和深度信息获取的推理技术改进。这些方法旨在提升大语言模型与检索系统的协同效能,实现高效的深度信息获取。本研究聚焦于人工智能的前沿问题,力求突破现有信息检索技术的瓶颈。该技术不仅能够为各学科研究提供更高效的信息获取途径,加速科研进展,还将在金融、医疗等实际应用领域创造显著的经济和社会效益。
2
面向规模扩展的大模型优化
理论与算法研究
郑晨宇,高瓴人工智能学院2023级博士生,导师为李崇轩副教授。主要从事深度学习和生成模型的基础理论研究,已以唯一第一作者身份发表NeurIPS 3篇,ICML 1篇,相关成果被机器之心等专业媒体报道,并落地于字节跳动的实际大模型应用。基于上述研究,入选中国人民大学“拔尖创新人才培育资助计划”。在学术服务方面,长期担任TPAMI/NeurIPS/ICML/ICLR等顶刊顶会的审稿人,并被评为NeurIPS 2025 Top Reviewer。
随着大模型在人工智能多个领域的快速发展,模型规模扩展已成为提升性能的重要路径,但其扩展过程仍高度依赖经验探索,缺乏系统的理论支撑。该项目围绕大模型规模扩展中的关键基础问题,聚焦大模型在规模扩展条件下的学习与优化机制,探索影响模型高效扩展的核心因素。项目将从理论分析与实验验证相结合的角度,系统研究模型规模增长过程中普遍存在的共性问题,力图为大模型的高效、稳定训练提供理论依据与方法参考,为可扩展、可通用的人工智能系统做出贡献。
近年来,人大高瓴人工智能学院深耕研究生拔尖创新人才培养,以高水平培养体系为核心,深化科教融合与创新平台建设,推动人才培养与前沿科研、国家战略需求精准对接。未来,学院将持续厚植育人沃土,优化科研生态与支持机制,为青年学子搭建学术成长与创新实践的广阔平台,助力他们面向世界科技前沿与国家重大需求开展原创性研究,为实现高水平科技自立自强注入青春动能。
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号