数字时代的科学与技术I 统计学院教授易丹辉 :让数据说话—— 数字时代的统计学
信息来源: RUC明理新声 发布时间:2025年11月3日
数字时代的科学与技术
2025
明理书院2025—2026学年秋季学期“数字时代的科学与技术”系列讲座第五讲邀请了统计学院教授易丹辉担任主讲,主题为《让数据说话——数字时代的统计学》。内容分为三大部分:数字时代的特征、统计学的基本框架与方法论、以及面对大数据的统计应对策略。
首先,易丹辉指出我们已进入一个以数字技术为核心规则的时代,数据不仅是数值,而是包括文字、图像、声音等多模态信息。数字化不仅改变了政府、农业、交通等各个领域的运作方式,也重塑了人与人、人与机器之间的连接方式。数据呈现出永久性、可复制性、即时性、高效性、动态性和倾向秩序性等特征,数据规模庞大、结构复杂、维度高、非线性强,传统分析方法面临巨大挑战。
在这样的背景下,统计学作为“收集、分析、呈现和解释数据的科学与艺术”,其重要性愈发凸显。易丹辉强调数据来源多样,可以来源自实验、调查、网络、出版物等。中国人民大学、北京大学等高校建立了丰富的数据平台,如CGSS、CFPS、CHARLS等,为研究提供了数据来源。
易丹辉进一步探讨了量变与质变的关系,提出在异质性背景下构建模型的必要性。从一元线性回归到多元回归、分位回归、广义线性模型(如Logistic回归、泊松回归),再到时间序列分析、面板数据模型、固定效应与多水平模型,统计学不断拓展其建模能力,以适应现实世界的复杂性。结构方程模型、因子分析、聚类分析、判别分析、对应分析等多元统计方法也被引入,用于探索消费者行为、共享单车布局、用户画像等实际问题。
进入大数据时代,已有的统计方法与机器学习深度融合。机器学习作为统计学习的延伸,涵盖监督学习、无监督学习、强化学习等多种范式,广泛应用于文本挖掘、图像识别、信用评估、医疗诊断等领域。深度学习作为机器学习的前沿方向,通过卷积神经网络、自编码器、深度置信网络等模型,实现对复杂数据模式的自动提取,推动人工智能迈向更高层次。
尽管技术日新月异,但统计思维始终是核心。无论使用何种算法,最终目标都是“让数据说话”,而关键在于“如何说”:选择正确的数据、采用科学的方法、得出合理的结论。统计不仅是工具,更是一种思维方式——在混乱中寻找秩序,在差异中发现共性,在量变中识别质变。
最后,易丹辉回归教育本质,呼吁在人大这样的学术殿堂中,学生应培养“用自己的眼睛观察、用自己的脑子思考”的能力,追求“平凡不平庸,普通且伟大”的成长路径。健康不仅是无病状态,更是身心与社会适应的和谐统一。在数字时代,统计学不仅是理解世界的钥匙,更是塑造未来的力量。量的积累终将带来质的飞跃,而统计,正是这一过程的见证者与推动者。
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号