媒体文章 I杜小勇 :建设数据治理交叉学科, 培养数据领域创新人才
信息来源: RUC明理新声 发布日期:2026年3月31日
RUC Mingli
近期,由明理书院院长、数据工程与知识工程教育部重点实验室主任杜小勇撰写的文章《建设数据治理交叉学科,培养数据领域创新人才》,在《教育家》杂志发表。该文系统阐述了数据要素学科的分类以及数据治理作为交叉融合复合学科的核心地位,为面向国家战略需求重构高校相关专业体系、多路径培养数据领域创新人才提供了极具指导意义的实践方案。
《教育家》杂志是由《光明日报》主管、光明日报出版社主办的高端教育人物主流期刊与新媒体刊物。杂志依托《光明日报》在知识界、教育界等领域的权威影响力,传承“光明”血脉,始终坚持“思想深度、理论高度并重”的一贯风格。以“传播有力的思想,影响有追求的师者”为宗旨,杂志以广大教师为主要读者,采用每期专设议题的模式,深入报道教育政策、反映教改经验、展示一线成果并弘扬优秀教育者事迹。
建设数据治理交叉学科,培养数据领域创新人才
杜小勇|中国人民大学明理书院院长,数据工程与知识工程教育部重点实验室主任
《关于加强数据要素学科专业建设和数字人才队伍建设的意见》(以下简称《意见》)明确指出,数据要素学科专业建设和数字人才队伍建设,承担着培养深化数据要素市场化配置改革和数据赋能人工智能高质量发展所需各类人才的重大使命,是统筹推进数字中国、数字经济、数字社会规划和建设的重要基础。同时,要求以国家数据战略为牵引,健全数据要素学科专业。
什么是数据要素学科专业?《意见》提及了建设数据科学与工程、数字经济与管理等数据要素相关学科专业。笔者认为,数据要素学科分以下三类情形:第一类是伴随大数据、人工智能等数字技术的发展和应用,已经在高校设立的数据科学与大数据技术、人工智能、数字经济、数据管理等专业,这些学科专业的内涵与数据要素息息相关,但需要从深化数据要素价值释放和数据要素赋能人工智能高质量发展的高度,去升级甚至重构其知识体系和课程体系;第二类是受数字化转型影响的传统学科专业,需要不断改革现有课程体系和教学模式,这类学科专业数量众多,但切忌把学科的数字化转型当作数据要素学科本身;第三类是逐步形成并发展起来的数据要素核心学科。本文将重点探讨第三类情形。
数据治理是数据要素学科的核心
数据作为第五生产要素是一次重大的理论创新,体现了党和政府对数据价值的重视。2022年、2023年,《关于构建数据基础制度更好发挥数据要素作用的意见》和《数字中国建设整体布局规划》两份文件的接连印发,标志着数据要素从宏观顶层设计正式进入全方位、系统性的推进落地阶段。无论从数据的全生命周期视角,还是从数据要素价值释放过程的视角,数据治理都是其中至关重要的内容。
梅宏院士主编的《数据治理之论》提出了数据危机的概念和数据治理的三维框架。数据危机将催生一个新的学科,这就是数据治理。数据治理是对数据要素进行全生命周期的管理、控制与价值释放的体系化活动。它以数据要素为对象,在确保数据安全的前提下,通过建立规则体系,理顺参与各方的权责,形成多方参与、良性互动、共建共享共治的数据流通模式,能够最大限度地释放数据要素的价值。从治理主体来看,包括国家、行业和组织三个层次;从治理内容来看,包括资产地位确立、管理体制机制、开放与共享、安全与隐私保护四个维度;从治理工具来看,包括制度法规、标准规范、支撑技术和应用实践四个方面。
数据治理是一门交叉融合的复合学科
首先,数据的本质属性决定了数据治理必须是多维复合的。数据具有技术属性:其采集、存储、传输、计算、安全依赖于计算机科学和数据科学等技术学科,其治理须奠定可用性、完整性、安全性等技术基础。数据具有经济属性:数据是生产要素,其确权、估值、交易、分配涉及经济学和管理学等,其治理旨在建立产权制度、市场规则与收益机制,促进数据要素市场化配置。数据具有社会与法律属性:其承载个人信息、公共利益与国家秘密,关乎隐私、安全、伦理与主权,其治理需法学、公共管理、社会学、伦理学的介入,以平衡发展与安全、效率与公平、创新与监管。
其次,数据要素的基础性决定了数据治理必然是多学科深度融合的。让数据管得住、流得动、用得好,需要计算机科学、数据科学和人工智能提供治理的“工具箱”,如数据模型、质量标准、隐私计算、区块链溯源等技术手段。解决数据为何用、为谁用、如何高效用,需要经济学与管理学构建治理的“动力机”,研究数据要素的产权理论、定价机制、市场设计、组织形态与商业模式。为数据使用划定行为边界,需要法学与公共管理奠定治理的“规则基”,聚焦个人信息保护、网络安全、跨境流动监管、公共数据开放等法律框架与政策体系,提供制度保障。确保数据服务于人的全面发展和社会的包容进步,需要社会学与伦理学校准治理的“方向盘”,关注数据应用中的数字鸿沟、算法歧视、社会公平、公民权利与伦理困境。
最后,时代挑战凸显多学科协同的紧迫性。当前实践中的诸多挑战普遍具有跨学科特征。例如:“发展与安全”的统筹,如何既释放数据价值又筑牢安全屏障,需要技术与制度设计的协同创新;“效率与公平”的平衡,面对数据驱动增长可能加剧垄断与分化,治理需引入社会公平视角,设计普惠包容的规则;“创新与合规”的协同,前沿技术快速迭代,倒逼法律与伦理规范动态适应,呼唤“治理—技术”的同步演进。
可见,数据治理不是单一领域的专业议题,而是数字时代的一项基础性、系统性工程。它要求打破学科壁垒,构建跨学科的融合治理框架。培养兼具技术洞见、经济思维、法律素养与人文关怀的复合型人才,是有效应对数据危机挑战,充分释放数据要素价值,扎实推进数字中国建设的必由之路。
多路径培养数据治理人才
路径一:面向国家战略需求重构或升级现有相关专业。
当前高校在数据科技相关人才培养方面,整体仍停留在“以计算为中心”的传统路径。既有培养模式以计算效率与算法优化为导向,侧重数据处理能力训练,却忽视了数据作为生产要素的组织方式与价值实现机制,难以适应“以数据为中心”的新要求。具体而言,随着数据跨部门、跨区域、跨主体的流通需求日益凸显,数据流通与治理所需的跨域协同能力尚未在人才培养体系中得到系统体现,数据确权、可信流通与合规监管等关键能力培养明显不足。更为重要的是,在人工智能快速发展的背景下,以大模型为代表的生成式人工智能对高质量数据的依赖不断增强,但当前的培养体系在数据语义融合、数据质量治理、面向大模型的数据准备等方面仍相对滞后,难以支撑数据与智能深度融合的发展趋势。
面向数据要素化配置的新阶段,高校亟须推进数据科技人才培养模式的系统性重构,加快实现从“以计算为中心”向“以数据为中心”的转型。以中国人民大学数据科学与大数据技术专业为例。在课程体系方面,围绕数据要素价值实现全过程,突破传统以计算与算法为主线的课程结构,在培养方案中模块化设置“数据汇聚与管理”“数据流通与治理”“数据分析与利用”“数据安全与合规”等核心课程群,强化“大数据技术栈”的体系化教学,突出以跨域协同为核心的数据能力培养导向。在教学体系方面,推动数据科学与人工智能的深度融合。依托典型数据应用场景,建设基于真实数据集的案例库与项目库,系统推进项目驱动与任务导向教学,将数据处理、分析与决策过程嵌入教学全过程,强化学生的数据问题建模、分析与决策支持能力。在实践体系方面,重构产教融合与协同育人机制。围绕数据要素流通与跨域协同等关键场景,推动实践教学由模拟训练向真实场景转变。同时,构建“课程—项目—竞赛”贯通的实践培养体系,将数据确权、可信流通、隐私保护与合规监管等关键问题纳入实践环节,形成面向真实问题的训练机制,强化学生的数据问题建模与解决能力,提升其应对复杂数据场景的实践能力。
路径二:面向不同专业的学生开设数据治理微专业。鼓励所有学生通过选修微专业来快速学习数据治理的有关知识,以具备从事数据领域工作的基本能力。以中国人民大学“智能数据治理”微专业为例,学校围绕典型公共数据的应用,走通从数据供给到数据流通应用的全过程,实现数据价值的高效释放,帮助学生开发属于自己的数据治理智能体,以提升其数据治理应用和研究的能力。
路径三:面向本科生的科研实践有针对性地开设“创研课程”。“创研课程”是中国人民大学的一项创新,基于学生开展研究性学习的实践需求,拟定课程方案,由相关专业的教师进行授课与指导。明理书院秉持“学生主导、学科交叉”的理念,围绕国家战略需求,设立了“数据+X”“AI+X”等多个学生创新实验室,学校为其设立“育研”项目,给予经费支持,同时依托创新实验室开设“创研课程”,以新模式培养数字人才。
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号