榜样风采 I研究生国家奖学金获得者专访 :陈晓栋 胡建勇
信息来源:中国人民大学信息学院 发布日期:2026年1月26日
近日,教育部发布公告,公布2024-2025学年度研究生国家奖学金获奖学生名单,我院谢冬晨、许骞、陈晓栋、吕筱玮、马泽尧、赵文昊、胡建勇、范梅浩、陈思蓓、陆齐、王硕、杜盼、官佳薇、李好洋等14位同学荣获研究生国家奖学金!
青春铸魂,榜样领航。为发挥优秀学子的示范引领作用,凝聚奋进力量,学院特推出2024-2025学年国家奖学金获得者系列专访。通过挖掘他们在逐梦路上的坚守与探索、突破与成长,展现信院学子“敢为人先,科技报国”的精神风貌。愿这些滚烫的青春故事,能为每一位追梦人注入前行动力,激励全院同学在青春赛道上书写属于自己的精彩篇章!
陈晓栋:求精务实,致效于行
陈晓栋,共青团员,信息学院2024级电子信息专业硕士研究生,师从张静教授。他的研究方向聚焦于高效大语言模型,致力于通过模型压缩、剪枝与蒸馏等技术,在保障性能的同时显著降低存储与推理成本。研究生阶段,他以出色成绩获得学业一等奖学金,并保持平均学分绩点3.88。至今已以主要贡献者身份在ACL、ICLR等人工智能顶级会议上发表多篇论文。
在ICLR会议上
自入学以来,陈晓栋已完成了多项具有创新性的工作,其中首个创新工作是SP³,一种基于L0 Mask的训练时结构化剪枝方法,该方法通过引入可学习的掩码机制,在训练过程中智能识别并剔除冗余结构,在 Bert 和 TinyLlama 等多个模型上均取得了领先的性能表现。这一成果已发表于ACL 2024 Findings。
ICLR会议上讲解Poster
深耕学业:筑牢根基,追求卓越
陈晓栋完成的另一项重要工作是 LLM-Streamline,该方法通过分析层间输入与输出的余弦相似度,精准识别模型中的冗余层,并采用轻量级蒸馏模型进行替代。在 Llama3.1-70B 上的实验表明,该方法能够减少 30% 的层数与参数量,同时保持 96.5% 的原始性能。目前,这项创新性工作已被 ICLR 2025 接收为 Spotlight 论文。
ICLR会议上Poster展示
科研探索:聚焦前沿,敢为人先
随着研究的深入,他发现剪枝后的模型通常需要后训练来恢复性能。为了系统性地解决这一问题,他与团队成员们合作提出了P² Law,即“压缩后模型恢复训练的Scaling Law”。通过大量实验,他们发现了恢复训练过程中的两个关键规律:模型规模与损失下降速度的负相关关系,以及训练损失与剪枝率之间的幂律关系。基于这些发现构建的Scaling Law,能够为不同规模的数据集、剪枝率和模型参数量提供最优的后训练策略指导。该项研究成果已被ACL 2025主会接收。
在蚂蚁集团 InclusionAI 实验室实习期间,陈晓栋主导研发了一种面向混合专家模型的创新压缩方法MoBE,通过秩分解和基底矩阵重参数化技术,突破了传统 SVD 方法对低秩假设的依赖。在 Qwen3-235B、DeepSeek-V3 等前沿模型上的实验证明,MoBE 能够在压缩 25%-30% 参数量的情况下,保持 98% 以上的模型性能。
回望一路的科研旅途,陈晓栋认为,高效研究需要在效率与性能间找到平衡。未来他计划继续研究高效大语言模型,开发轻量化且性能强大的模型架构,推动其在资源受限环境中的应用,同时他也期待与更多学界和工业界的研究者开展深入合作。他感谢一直以来导师的引领、团队的支持,也感谢始终专注向前的自己。他将坚持以“研究更高效、更快、更小的大语言模型”为宗旨,在人工智能领域稳步前行。
胡建勇:向光而行,破土而生
胡建勇,共青团员,中国人民大学信息学院2023级管理科学与工程专业硕士研究生,师从余力教授。研究方向聚焦推荐系统与大语言模型,致力于提升多模态能力与序列推荐效果。曾获国家奖学金、优秀毕业生、学习优秀奖学金等多项荣誉,并以主要贡献者身份在CCF A类期刊TOIS上发表论文。参与国家自然科学基金、北京市社科基金等多项国家级科研项目。
刚接触科研时,面对海量文献与持续迭代的模型体系,胡建勇曾陷入方向抉择的困惑:如何在纷繁复杂的研究领域中锚定具有核心价值的科学问题?“做科研要深入浅出,自己先研究透彻才能让其他人一目了然。”
基于此,胡建勇将研究聚焦于短视频多模态推荐领域,针对短视频场景下的视觉、文本等多模态特征展开专项建模。为解决模态间信息异构性与交互不足的问题,他引入蒸馏学习与对比学习双机制:通过蒸馏学习实现模态信息的提纯与增强,保留关键特征的同时降低冗余;借助对比学习强化跨模态特征的关联性与判别性,促进不同模态间的深度交互与语义对齐。
在研究过程中,他通过大量实证分析发现,不同平台的多模态信息(包括但不限于视觉内容表征、文本语义信息、模态交互模式等)在用户兴趣建模中存在显著异质性影响,这种差异直接作用于用户兴趣的捕捉精度与演化预测效果。最终该研究成果被TOIS期刊接收。
在校园之外,胡建勇也曾在苹果(中国)公司、美团公司进行实习,负责数据科学和推荐算法相关的工作。在苹果供应链团队为解决用户在线反馈问题,搭建了基于LLM的社交媒体平台客户反馈分析应用,将线上热搜转化为可支持供应链优化的业务语言。在美团,针对外卖场景,他主要参与了跨域学习和生成式推荐相关的工作,面向不同场域的用户兴趣,通过蒸馏学习方式进行多目标模型的迁移学习。在千万用户级的应用场景提升了推荐模型效果和用户使用体验。
学习之余,胡建勇亦积极参加校园学生工作。他曾是信息学院研究生会与校研究生会的宣传骨干,参与运营“中国人民大学研究生会”“信火相传info”等多个校园公众号,也负责策划时尚生活、摄影展览、舞会联谊等多场重大活动,累计发布推文73篇,仅在“RUC春日摄影展”活动中便征集作品近500份。在他看来,科研需要严谨,宣传则讲究“网感”,如何在学术推送中讲述既有高度又有温度的故事,是一个值得深思的问题,也是宣传必备的能力。
回望两年的来时路,代码、公式、像素和字符填满他的世界。胡建勇在科研中学会“把未知变成已知”,在宣传中“把已知讲成故事”,在实习里把故事写进真实的商业世界。展望未来,他想继续做一个“算法世界的手艺人”,左手用论文拓宽人类知识的边界,右手用代码改善普通人们的每一次点击与选择。
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号