榜样力量 I研究生国家奖学金获得者专访: 马泽尧 吕筱玮
信息来源:中国人民大学信息学院 发布日期:2026年1月28日
在小说阅读器中沉浸阅读 近日,教育部发布公告,公布2024-2025学年度研究生国家奖学金获奖学生名单,我院谢冬晨、许骞、陈晓栋、吕筱玮、马泽尧、赵文昊、胡建勇、范梅浩、陈思蓓、陆齐、王硕、杜盼、官佳薇、李好洋等14位同学荣获研究生国家奖学金!
青春铸魂,榜样领航。为发挥优秀学子的示范引领作用,凝聚奋进力量,学院特推出2024-2025学年国家奖学金获得者系列专访。通过挖掘他们在逐梦路上的坚守与探索、突破与成长,展现信院学子“敢为人先,科技报国”的精神风貌。愿这些滚烫的青春故事,能为每一位追梦人注入前行动力,激励全院同学在青春赛道上书写属于自己的精彩篇章!
马泽尧:表格求索,代码寻真
马泽尧,共青团员,中国人民大学信息学院2023级计算机应用技术专业学术型硕士研究生,师从张静教授。研究生期间,他连续两年荣获校一等奖学金,并获评“三好学生”称号。科研方向聚焦于大语言模型的表格处理与代码生成,致力于攻克实际应用中的关键瓶颈。目前,他已以第一作者身份在人工智能顶级会议发表长文3篇,合作发表论文6篇,其主导构建的表格操作评测基准SpreadsheetBench被OpenAI ChatGPT Agent官方项目引用。其研究成果在学界与社区均获得积极反响:Google Scholar引用达229次,开源项目获GitHub 308星标,相关模型与数据集月均下载超千次。
在科研探索中,马泽尧始终关注真实世界场景下的技术挑战。为解决大模型的训练数据稀缺问题,他参与了基于合成数据增强的TableLLM框架,一方面通过对现有TableQA数据进行思维链扩展,提升模型对查询类任务的理解能力;另一方面针对复杂操作设计一套基于原子操作符的合成策略,并引入代码-文本双路径交叉验证机制,系统化构建高质量、多样化的训练语料。实验表明TableLLM在多项表格任务上性能媲美GPT-4o,在开源社区上获得了广泛关注。
马泽尧同时也意识到,缺乏贴近现实的评测标准是制约领域发展的关键。为此,他从海量Excel用户论坛中提炼真实难题,历经采集、过滤、对齐与用例构建四阶段,打造出综合性评测基准SpreadsheetBench。该基准因其高度的现实复杂性与挑战性,被OpenAI采纳为核心评估工具,并揭示出即使是当前最先进的大模型,也仅能解决45.5% 的真实问题,清晰指明了未来研究的方向。
在代码生成领域,马泽尧同样致力于提升模型的可靠性与效率。针对传统方法中验证环节的不足,他提出了CodeRM框架,通过训练轻量级高精度测试生成模型与动态资源分配策略,显著提升了代码生成的准确率,以较小模型实现了媲美超大模型的性能。他进一步探索竞赛编程场景,设计出无需完整测试用例的间接验证机制,有效突破了传统验证瓶颈。此外,他还参与了通义千问Qwen3-Coder的代码数据合成与强化学习训练工作,为提升大模型的代码能力贡献了力量。
从定义问题到创新方法,从系统实现到产生社区影响,马泽尧在科研的道路上一步步地坚定向前。回望来路,他始终坚信,真正有价值的研究,源于对真实世界需求的深刻理解与不懈求解。未来,他将继续深耕于人工智能领域,致力于推动大模型在复杂任务中的实用化与可靠化,在智能探索的道路上留下自己的足迹。
吕筱玮:钻研图理,探索智能
吕筱玮,中共党员,中国人民大学信息学院2023级计算机软件与理论专业硕士研究生,师从王永才教授。他目前在Inlab实验室进行研究,研究方向涵盖图结构挖掘、大语言模型与强化学习等。研究生阶段以出色成绩获得一等学业奖学金,并曾获本科生国家奖学金及ACM ICPC亚洲区域赛铜奖等多项荣誉。至今已以第一作者身份发表CCF A类会议论文1篇、B类期刊1篇、C类期刊1篇,并累计参与完成11篇论文,谷歌学术引用量达146次。
在导师王永才教授的指导下,吕筱玮专注于图结构挖掘的核心领域。他以第一作者身份发表于WWW 2025 Oral的论文《Coreness Maximization through Budget-Limited Edge Insertion》,针对社交网络中如何有限添加连接来最大化整体参与度的实际问题,提出将其形式化为一个基于图论的预算约束核度最大化问题。他证明了该问题的计算复杂性,并设计了一个高效的贪心算法框架,通过协同优化局部顶点与顶点组的增益来选择待插入的边。实验验证表明,他所提方法在核心度提升效果上显著优于基线算法,且保持了较高的运行效率。
吕筱玮的科研成果不仅限于上述WWW 2025 Oral论文。他还以第一作者在TCS期刊发表了理论计算机科学相关研究,并以第三作者参与了SIGMOD数据库顶级会议的论文工作。他也在CCKS会议上发表了多智能体强化学习相关论文,并在360智脑实习期间参与研发轻量化推理模型Light-R1,被ACL 2025 Industry Track接收,对应仓库收获了超过740个星标。值得一提的是,在本科阶段,他就已涉足计算机视觉领域,围绕语义分割开展研究,并参与了多篇SCI期刊论文的发表。
在学校之外,吕筱玮将科研创新与工业实践紧密结合,在百度研究院、360智脑及阿里妈妈广告技术部的多段实习中,将理论研究成果转化为具有实际影响力的技术产品。在360智脑期间,他参与主导开发的360-llama-factory训练框架,已成功应用于多个知名模型与项目,其GitHub仓库获得超过540个星标。在阿里妈妈,他创新性地将用户行为轨迹作为一种模态与大语言模型融合,推进了AIGB项目落地;在百度研究院,他则专注于多模态大模型的研究,负责基于LLaVA-Next的海报布局智能生成任务。
在一路的科研旅途上,吕筱玮始终以一名学徒的心态自省,保持着对知识的渴求与对新问题的探索欲。他坚信,在人工智能飞速发展的浪潮中,通用人工智能必将深刻赋能千行百业,甚至引领新一轮的工业革命。他希望未来能亲自见证和参与这一伟大进程,在人工智能领域深耕,贡献自己的一份力量。
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号