中国人民大学统计与大数据研究院2022级博士研究生肖翔的论文“Robust Estimation of Change Points in Linear Spline Models with Missing Data”已被国际统计学期刊Scandinavian Journal of Statistics接收发表。该论文由肖翔在导师杨光宇助理教授、清华大学张敏教授共同指导下完成,此前还在“2025 年统计学及相关学科发展研讨会暨博士研究生学术论坛” 中斩获一等奖。
为解决这一问题,本文在含缺失数据的线性样条模型中,创新性提出逆概率加权(IPW)估计量、双重稳健的增广逆概率加权(DR-AIPW)估计量两种新的变点估计方法,并对基于插值的结果回归(OR)估计量展开考察。研究从理论上证明了各类估计量的相合性和渐近正态性,并依托半参数理论验证了 DR-AIPW 估计量的最优性;针对实际应用场景,构建了对参数分步进行迭代的 IPW、DR-AIPW 及 OR 算法,为方法的落地提供了可行路径。经模拟研究与真实数据分析验证,论文提出的估计方法展现出优异的数值表现,为含缺失数据场景下的变点估计问题提供了新的解决方案,丰富了线性样条模型的理论与应用体系。
作者简介
肖翔,中国人民大学统计与大数据研究院2022级直博生。研究方向为变化点和阈值分析、生存数据分析。
杨光宇,中国人民大学统计与大数据研究院助理教授、副研究员、博士生导师。主要研究方向包括变点和阈值估计,半参数统计理论,生存分析等领域。文章发表于Journal of the American Statistical Association、Biometrics、Lancet Respiratory Medicine、Journal of Heart and Lung Transplantation等期刊。
张敏,清华大学长聘教授、万科讲席教授、博士生导师。长期从事生物统计方法学及其在健康医疗领域的应用研究,主要研究方向包括半参数模型与方法、因果推断、最佳个体化治疗规则学习、临床试验、生存分析与竞争风险模型、纵向队列数据分析、机器(统计)学习以及基因与组学分析等。已在统计学和医学期刊发表论文120余篇,相关成果发表于 Journal of the American Statistical Association、Annals of Applied Statistics、Biometrics、Biostatistics、Journal of the American Medical Association、Lancet Respiratory Medicine 等统计与医学领域重要期刊。现任 Biometrics 副主编、The International Journal of Biostatistics 编委、Journal of Heart and Lung Transplantation 副主编,并担任泛华统计协会董事。