学术讲座I“ 青年数据科学家工作坊” 第7讲—— 编程实战训练营
信息来源:中国人民大学统计学院 发布日期:2026年5月26日
在小说阅读器读本章去阅读在小说阅读器中沉浸阅读 为进一步丰富覆盖本研的“五训”体系,统计学院发起“青年数据科学家工作坊”。工作坊以线上线下结合形式开展,包含沙龙与训练营两种形式。沙龙邀请数据科学行业从业校友分享技能要点,解读统计思维在业务场景中的价值。训练营邀请国内外编程领域专家讲解实用技术,帮助大家提升实战能力。
训练主题
推荐召回的深度架构与工程服务化
训练目标
掌握模型模块化训练方法,打通从模型产出到线上毫秒级调用的全链路
内容简介
(1)从One-hot稀疏灾难讲起,解释Embedding的本质。
(2)介绍数据管道以及高度模块化的“luz”包。
(3)用torch实现经典矩阵分解(MF),展示如何以更优雅的方式完成训练。
(4)讲解双塔结构的业务意义,用户侧特征与物品侧特征分离,并实现该算法。
(5)引入用户和商品特征,重构双塔模型,观察模型效果变化。
(6)演示如何提取训练好的Embedding向量,并讨论使用向量数据库实现毫秒级的线上检索召回。
(7)彩蛋(Optional):拓展分享《用4元钱成本训练一个带有思考链的JEPA本地大语言模型》
主讲人简介
刘思喆,国内最大统计社区“统计之都”理事会成员,拥有23年R语言使用经验,是国内早期R语言的布道者之一。具备横跨彩票、电信、电商、教培、餐饮等多行业的算法与数据科学实战经验。曾任塔斯汀数智中心总经理、51Talk首席数据科学家,以及京东推荐平台部高级经理(京东技术名人堂成员)。著有《深度学习与生成式AI——R torch核心算法与实战》《153分钟学会R》,并译有《R语言核心技术手册》。
时间
2026年5月29日(周五)19:00
报名方式
如您有意参加,欢迎扫描下方二维码进群,并提前完成最新版R语言以及R的torch包安装(见“阅读原文”链接),会议信息将在群内通知。
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号