数韵风华 青年说 I 用数学语言解码生命奥秘—— 青年教师董康宁的科研探索之路
信息来源:中国人民大学数学学院 发布日期:2026年4月16日
编者按
人大数学学院的青年教师们,既承前辈学者的严谨治学之风,深耕基础研究、勇探交叉领域,让数学之韵在创新中生生不息;亦怀新时代教育者的开阔视野,以趣味化表达拆解知识壁垒,用个性化引导点亮学生理想。
“数韵风华·青年说”将透过文字,捕捉青年教师在科研与教学中的闪光瞬间,感受数学之美与青春之力的碰撞,见证他们如何以初心育桃李、以匠心赴前程。
在数学与生命科学不断交汇的当下,数据与算法正成为理解复杂生命系统的重要工具。青年学者董康宁深耕生物信息学与人工智能交叉领域,从数学建模出发,走向空间转录组学等前沿方向,在真实生物问题中不断检验与发展算法方法。围绕空间结构解析与多切片数据整合等关键问题,他持续推进图神经网络等技术的应用与创新,在复杂数据中探寻生命组织的内在规律。以理性的推演回应生命的复杂性,他以持续探索回应未知,也在跨学科的边界上开辟新的可能。
从数学出发:走向生命科学的交叉探索
“本科学习基础数学时,我逐渐对数据分析和计算机应用产生了浓厚兴趣。”回望起点,董康宁的转向并非一蹴而就,而是在兴趣驱动下的自然延伸。保研至中科院后,在张世华研究员的指导下,他正式进入生物信息学领域,也由此开启了跨学科探索的第一步。
真正的转折发生在2020年。一次与中科院基因组所团队合作研究涡虫再生机制的经历,让他切身感受到传统方法的局限。“当时我们发现,经典聚类方法难以有效利用空间信息。”他回忆道。面对这一问题,团队引入图神经网络,开发新的分析算法,使数学模型能够更贴近生物组织的真实结构。“那一刻,我真正感受到,数学不仅可以解释世界,也可以回应生命科学的具体需求。”
此后几年,董康宁团队在空间转录组学方向持续深耕,取得了一系列具有影响力的成果。其提出的 STAGATE 算法(发表于 Nature Communications,引用已超700次),基于图注意力自编码器,有效提升了空间聚类结果与真实组织结构的一致性;随后发展的 STAligner 算法(引用超130次),进一步实现了多切片数据的整合分析,为三维空间重构提供了关键技术支撑。
但这些成果背后,并非一帆风顺。“最大的挑战其实是算法的泛化能力。”董康宁坦言,早期模型在不同数据集上的表现并不稳定。为了解决这一问题,团队花费半年时间不断迭代优化,并与生物学研究者反复讨论验证路径,最终通过扎实的生物学证据说服了审稿人,也让方法更加稳健可靠。
在教学之中:拓展科研问题的研究边界
步入独立科研阶段后,董康宁的研究边界并未止步于既有方向,而是在科研与教学的互动中不断延展。入职第一年,他将大量精力投入课程建设。在《机器学习》课堂上,与学生的讨论与碰撞,意外激发出新的研究灵感,逐渐发展为一个关于“聚类集成学习的多尺度一致性优化”的研究框架。“教学反哺科研,是一个很惊喜的收获。”他说。这种双向促进,也让他的研究视角更加开放而富有层次。
相比技术难题,科研过程中的心理波动同样值得被正视。博士期间的一次投稿经历,让董康宁印象深刻——审稿人提出需对算法流程进行大幅修改,这意味着几乎所有实验结果都要推翻重做。“当时确实有些低落,甚至会有抵触情绪。”他坦言。转变来自导师的一次耐心交流。导师用一个下午时间,逐条梳理审稿意见,帮助他重新理解同行评审的意义。“审稿人愿意花时间提出具体建议,本身就是对工作的重视。”从那以后,他逐渐将修改视为推动研究成熟的重要环节,建设性的批评,不是阻力,而是科研走向严谨与完善的必经之路。
面向未来3至5年,董康宁将目光投向更具挑战性的交叉领域:一是跨物种进化视角下的组学数据分析,探索不同生命系统之间的共性规律;二是尝试将代数拓扑方法引入单细胞三维基因组研究,以新的数学工具刻画复杂空间结构。“科研的本质是探索未知。”他说,“而对生命复杂性的敬畏,正是我持续前行的动力。”
谈及科研成长,董康宁给出了几条简洁而务实的建议。在他看来,好的研究往往始于一个扎实的问题意识。选题上,应尽量聚焦具体且可验证的科学问题,真正找到尚未被解决的研究空白,而不是停留在宏观而模糊的方向判断。在论文写作中,他强调“读者导向”的重要性——不仅要表达清楚思路,更要让图表具备自解释能力,使读者在最短路径内理解工作的核心贡献。而在科研心态上,他认为精益求精尤为关键,需要不断追问:所做的工作,是否真正回应了最初的问题,是否在已有基础上实现了实质性的推进。
代表作:
[1] Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder(Nature Communications, 2022)
[2] Integrating spatial transcriptomics data across different conditions, technologies and developmental stages
(Nature Computational Science, 2023)
[3] Spatiotemporal transcriptomic atlas reveals the dynamic characteristics and key regulators of planarian regeneration
(Nature Communications, 2023)
[4] Network diffusion for scalable embedding of massive single-cell ATAC-seq data(Science Bulletin, 2021
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号