中国人民大学人工智能治理研究院主办“ 人工智能价值对齐的理论与实践” 专题学术研讨会
信息来源:RUC人工智能治理研究院 发布日期:2025年09月30日
2025年9月27-28日,中国人民大学人工智能治理研究院主办的“人工智能价值对齐的理论与实践”专题学术研讨会顺利召开。来自哲学、法学、心理学、计算机科学、政治学、管理学等多个学科,中国人民大学、北京大学、清华大学、北京师范大学、浙江大学、中国科学院心理学研究所、中国科学院自动化研究所、微软亚洲研究院等十余所高校和科研机构的二十余位学者共聚一堂,与在场的几十名同学一起,从多个角度共同探讨人工智能的价值对齐问题。本次活动也是中国人民大学88周年校庆学术月的活动之一。
中国人民大学人工智能治理研究院院长、哲学院教授刘玮首先介绍了人工智能治理研究院的核心理念与建设目标,以交叉学科的方式探讨人工智能价值对齐问题的理论与现实意义,并向参会的学者和学生表示热烈欢迎和衷心感谢。
第一场讨论
27日上午的第一场讨论由中国人民大学法学院教授、未来法治研究院执行院长张吉豫主持。
中国科学院自动化研究所研究员、人工智能伦理与治理研究中心主任、北京前瞻人工智能安全与治理研究院院长曾毅首先作了题为《超级协同对齐,共赴共生社会》的报告。他从计算机科学与伦理学的交叉视角指出,鉴于人工智能在数学原理上无法保证绝对安全,必须通过主动为其建构道德与利他动机,而非仅依靠被动监管,来实现人机价值对齐,最终推动AI从工具演变为共生伙伴,引领文明新形态。
中国人民大学哲学院教授刘永谋的报告《AI价值对齐的限度》从技术哲学的角度入手,认为人工智能的价值对齐从根本上说是一种功能有限性的对齐,“对齐什么”的问题难以澄清,因为人类本身缺少统一的价值观,人类价值观始终处于不断变化之中,以及各种规则总是存在实然与应然之间的偏差,我们要对“价值对齐”进行严格的范围限定和制度约束。
北京师范大学法学院教授、数字法学研究中心主任汪庆华在《生成式人工智能的责任机制和伦理对齐》的报告中指出,人工智能的价值对齐离不开法律层面的相关落地,大语言模型可能带来一系列法律问题,包括稀释相关权利、侵犯隐私权和著作权以及模型幻觉所带来的合同违约等,而对此的法律解决方式仍然有待探索,若仅采取惩罚式监管,可能对技术人员提出过高要求,因此法律行业需探索切实可行的措施,在维护用户合法权益的同时,不阻碍人工智能行业的健康发展。
第二场讨论
第二场讨论由中国人民大学高瓴人工智能学院教授窦志成主持。
北京师范大学心理学部认知神经科学与学习国家重点实验室暨IDG/麦戈文脑科学研究院汪寅教授的报告《人类共识之基:跨越古今中外的道德概念表征空间》从“道德概念”出发,通过古今中外文本的大数据对比和实证研究,阐明了人类对道德概念进行表征的三维理论框架,为人工智能的价值对齐提供了重要的参照系,同时表明不同时代、不同文明的道德概念确实存在一些差异。
清华大学计算机科学与技术系黄民烈教授在题为《大语言模型的超级对齐》的报告中指出,人工智能的价值对齐的发展需要经历“价值对齐-超级对齐-智能对齐”的上升过程,其核心是人类在面对日益强大甚至超越自己智能的AI时,能否进行有效的监督和控制,而这不仅是一个计算机科学的技术问题,更是对伦理学和道德心理学等学科提出了要求,需要首先确定道德是什么,并以计算机能接受的、可计算量化的语言进行输入,才能使得AI拥有对其行为后果的关心和责任。
北京大学哲学系教授周程的报告《价值对齐需要明确对象:关于“算法”语义膨胀的粗浅思考》从概念辨析和历史考察入手,指出“算法”一词已经成为了一种“万能解释的修辞”和“现代神话”,我们有必要澄清“算法”一词的语义内涵,充分理解算法、模型、架构的不同含义以及它们之间的多层次关系,这样才有可能制定更准确、更具有可操作性的治理政策。
第三场讨论
27日下午的第三场讨论由北京师范大学心理学部认知神经科学与学习国家重点验室暨IDG/麦戈文脑科学研究院教授刘超主持。
浙江大学哲学学院教授李恒威做了题为《情感机器的构建与价值对齐——基于“以生命为核心”的意识理论》报告,他认为意识作为一种高级的内稳态调节机制,能够帮助机器在开放环境中增强智能与适应性。他提出,通过在情感机器中植入类似生物体内稳态的调节机制,机器可以形成内在的目标和驱动力,更有效地应对不确定的挑战。
中国科学院心理研究所研究员古若雷在《群际偏见、共情、人智社会》报告中指出,在人类与智能体共存的未来社会,群际偏见与情感共鸣将是重要议题。如何提升人类与AI之间的共情联系,减少社会对新技术的排斥,成为了人智社会和谐共存的关键。他提出只有通过情感共鸣,才能促进人类与AI之间的理解与接纳。
中国人民大学哲学院教授王小伟的报告《从技术到伦理:情感陪伴类人工智能的价值对齐挑战》分析了情感陪伴AI的价值对齐问题:一方面,用户需求的多样性与文化差异使得价值目标高度情境化;另一方面,情感模拟容易生成“合成的他者”,引发依赖与伦理风险。他提出,情感陪伴类AI的设计应以人类尊严、情感真实性和社会公共善为核心,以确保技术发展符合伦理规范。
清华大学心理与认知科学系副教授伍珍在报告《大语言模型的亲社会行为:价值对齐与情绪机制》中展示了先进的大语言模型(LLMs)能够有效模拟人类亲社会行为,并且其情感机制与人类表现出一定的相似性;LLMs在执行惩罚决策时,表现出较强的公平价值观,但其情感反应的灵活性和情境适应性相对较弱。她强调,通过增强LLMs的情感动态机制,可以进一步优化其在亲社会行为中的表现,提升AI在伦理和情感对齐方面的效果。
第四场讨论
第四场讨论由中国人民大学信息资源管理学院教授闫慧主持。
微软亚洲研究院研究员姚菁在《文化价值观对齐》的报告中讨论了如何使大语言模型与多元的文化价值观进行对齐。她介绍了基于心理学和社会科学的基本价值体系,并以此构建了一个k维价值空间。她提出了一种新的算法,可精准且可解释地实现不同文化和个人价值观的对齐,提升用户体验并减缓社会冲突的潜在风险。
中国人民大学国际关系学院讲师张扬和博士生刘冠宏做了题为《AI会按下核按钮吗?威慑理论再审视》的报告,探讨了人工智能在全球战略安全中的潜在作用。作者提出,核威慑的“恐怖平衡”依赖于理性决策,但随着军事技术和情报处理的进步,AI技术可能成为核决策中的关键因素。他们利用大语言模型构建了核威慑博弈论模型,模拟国际危机中的核决策行为,分析AI参与核决策的可能性与风险。
对外经济贸易大学法学院教授张欣做了《算法公平的类型构建与制度实现》报告,分析了我国现行算法公平规范中的存在的不足,并提出通过反歧视法理和差异化的受保护特征清单,构建可操作且有预测性的算法公平治理框架。在法律、伦理与科技的内在共识基础上,通过建立全面的算法影响评估机制,推动算法公平的法治化进程,为社会提供更为公平和公正的AI治理解决方案。
第五场讨论
28日上午,第五场讨论由中国人民大学哲学院教授张霄主持。
中国人民大学信息资源管理学院教授闫慧在题为《论“四有”AGI的修养》的报告中提出通用人工智能要实现可持续发展,应成为“有理想、有道德、有文化、有纪律”的“四有新人”。报告聚焦当前人工智能在隐私保护、知识产权、可及性、信息准确性、问责机制与非恶意设计等方面的潜在风险,探讨了构建信息伦理治理框架的必要路径,强调AGI的发展必须与社会价值体系相协调。
中国人民大学法学院教授、未来法治研究院执行院长张吉豫以《企业人工智能科技伦理治理挑战及制度建设》为题,深入分析了企业在推动AI技术落地过程中面临的伦理治理难题,她指出企业作为AI系统的主要部署者,应在产品设计阶段嵌入权利保障、公平性、隐私保护等法律价值,通过科技伦理审查、风险评估、算法备案等制度工具,实现赋能型治理。
中国人民大学高瓴人工智能学院副教授王希廷在题为《大模型对齐:探索基本价值观对齐与精准神经元控制》的报告中,探讨了大模型如何准确理解和反映人类基本价值观。她提出,在宏观层面应构建普适的基本价值观体系,在微观层面则需通过神经元级别的精准控制实现模型的行为一致性、可解释性与安全性,为构建可信赖的AI系统提供技术支撑。
北京师范大学心理学部认知神经科学与学习国家重点实验室暨IDG/麦戈文脑科学研究院教授刘超做了题为《从见义勇为的人类到向善的AI——利他行为的心理与脑机制研究及其在人工智能价值对齐中的应用》的报告。他结合虚拟现实、脑成像与计算建模等前沿技术,探讨人类利他与合作行为的心理与神经机制,并尝试将这些研究成果应用于AI系统的价值对齐设计,推动人工智能向善发展,提升其在复杂社会情境中的道德判断与行为能力。
第五场讨论结束后,会议进入圆桌讨论环节。由中国人民大学哲学院教授、人工智能治理研究院院长刘玮主持,邀请与会学者与媒体代表共同交流讨论。
中国人民大学法学院张吉豫教授指出,人工智能治理需要法治的“硬支撑”,也应注重与其他治理路径的协同,推动“以人为本、智能向善”的制度落地。北京师范大学心理学部刘超教授强调心理学在AI价值对齐中发挥“人性锚点”作用,推动“利他”“共情”等人类独特价值嵌入AI系统。浙江大学哲学学院李恒威教授提出,AI是一面镜子,映照出人类文明升级的紧迫性,价值对齐的终极对象不是机器,而是人类自身。微软亚洲研究院的姚菁研究员从技术角度分析了人工智能价值对齐的未来,展望人机共生的未来社会。中国人民大学国际关系学院张扬老师指出,AI价值对齐已不仅是伦理议题,更是国际竞争与制度博弈的新场域,需警惕算法殖民与文化霸权风险。中国人民大学高瓴人工智能学院的王希廷副教授肯定了跨学科交流和合作对于人工智能治理研究的重要意义。中国人民大学哲学院王小伟教授强调人性的复杂性对于人工智能价值对齐工程的挑战,呼吁哲学参与人工智能治理研究的重要意义。
刘玮院长在总结中表示,本次研讨会聚焦人工智能价值对齐的核心议题,涵盖哲学、法律、技术、心理、政治、管理等多个维度,体现了人工智能治理研究的交叉性与前瞻性,推动了跨学科合作与理论实践的深度融合。今后,中国人民大学人工智能治理研究院将继续致力于搭建高水平学术交流平台,推动人工智能治理体系与治理能力现代化。
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号