一周热点 Top7 I 3. 23— 3. 30
信息来源:人大高瓴人工智能学院 发布日期:2026年4月1日
在小说阅读器中沉浸阅读 「硅基温度·一周热点 Top7」栏目是一份面向AI研究者与科技从业者的精选周报。
我们以理性与洞察,追踪全球范围内最具影响力的AI事件——从模型架构突破到算力体系演进,从产业生态变迁到政策监管动向,每周甄选七则关键节点,为你呈现大模型时代的真实温度与演化脉络。
01
NeurIPS陷“制裁风波”
CCF强烈反对,学术中立性遭质疑
顶会 NeurIPS 近期因限制部分中国受制裁机构投稿,引发学界震动。中国计算机学会 第一时间发布声明,直指这一做法“将学术问题政治化”,违背科研应有的开放与平等原则,并敦促立即纠正。同时,CCF提出明确反制倡议,包括拒绝投稿、拒绝审稿以及停止学术服务支持,甚至表示若问题持续,可能将NeurIPS移出其推荐会议目录。对此,NeurIPS方面回应称,该限制源于必须遵守美国美国财政部外国资产控制办公室相关制裁规定。但这一解释并未平息争议,反而引发全球学界对“法律合规”与“学术自由”边界的广泛讨论。换句话说,这不仅是一次投稿规则调整,更是一次对学术共同体基本原则的冲击。
一句话总结:当合规要求碰上学术自由,NeurIPS事件正把AI顶会推向一场价值立场的考验。
(图片来自中国计算机学会官网)
02
轻量沙盒替代Docker
北大用“系统级隔离”重构SWE Agent训练环境
这项来自北大的工作,核心在于解决一个很实际的问题——训练SWE Agent为什么非得依赖笨重的Docker?他们提出的SWE-MiniSandbox,本质上是用操作系统原生能力,替代传统容器。具体来说,它通过chroot切换根目录、挂载命名空间隔离文件系统,再配合终端级隔离,实现了接近容器的安全与独立性,但成本更低。同时,他们设计了一套环境预缓存流水线,把环境体积压缩到原来的5%,准备时间也缩短到25%,显著提升实验效率。更关键的是,在SWE-bench Verified评测中,这种“无容器方案”的训练效果并没有打折。换句话说,它在保证性能的同时,大幅降低了训练门槛。
一句话总结:用操作系统原生隔离能力,做出了一个更轻、更快、几乎不输Docker的SWE训练环境。
项目主页
https://lblankl.github.io/SWE-MiniSandbox/
代码链接
https://github.com/lblankl/SWE-MiniSandbox
论文链接
/https://arxiv.org/abs/2602.11210
03
LeCun押注世界模型新范式
1500万参数、单GPU训练,实现秒级规划
Yann LeCun 推出的LeWorldModel(LeWM),可以理解为一种更“像人类思考”的AI路径:不再直接学动作,而是先学会“理解世界”。它基于JEPA架构,从原始像素中学习环境的变化规律,再去预测“如果这样做,会发生什么”。有意思的是,它把模型结构压缩到极简——只有编码器和预测器两个核心模块,并且只用两个损失函数就能稳定训练,不需要复杂技巧。这使得整个系统非常轻量:1500万参数、单GPU几小时即可完成训练。在机器人任务中,它不仅效果超过传统端到端方法,还能在1秒内完成决策规划,速度提升高达48倍。换句话说,它用更简单的方式,实现了更快、更强的决策能力。
一句话总结:用“先理解世界再行动”的思路,LeWM把高效规划带入了轻量级模型时代。
(图片来自LeWM主页)
https://le-wm.github.io/
https://github.com/lucas-maes/le-wm
https://arxiv.org/pdf/2603.19312v1
04
Claude Mythos意外泄露
Anthropic最强模型曝光,但因“太强”选择谨慎发布
AI公司 Anthropic 最近因为一次低级但严重的CMS配置错误,把自家“最强模型”Claude Mythos直接泄露到了公网。大约3000份未发布文件被公开,其中最关键的信息是:这不是简单升级,而是一个全新层级(代号Capybara),整体能力直接超越现有旗舰Opus 4.6,在编程、学术推理和网络安全上都有显著跃升 。更值得注意的是,官方自己也承认这是一次“能力阶跃”,甚至担心其网络攻击能力被滥用,因此没有选择立即开放,而是先提供给少数安全机构测试 。换句话说,这次泄露不仅曝光了一个更强的模型,也揭示了前沿AI已经开始进入“能力与风险同时失控”的阶段。
一句话总结:Claude Mythos不仅是性能跃迁,更标志着AI正式进入“强到需要被限制”的新阶段。
(图片由Nano Banana Pro生成)
05
OpenAI关停Sora转向“超级应用”
为新模型Spud与IPO腾挪算力与资源
OpenAI 近期做出一项颇为激进的调整:全面关停Sora相关产品线,包括独立应用、开发者接口以及在 ChatGPT 内嵌的视频功能。表面上看是产品收缩,但更深层的逻辑,其实是资源重分配——为下一代大模型Spud腾出算力与工程资源。据 Sam Altman 的表态,公司接下来将集中精力在三件事上:融资、供应链优化,以及以前所未有的规模建设数据中心。这一系列动作背后,是一个更宏大的目标——打造类似“超级应用”的统一AI入口,并为潜在IPO铺路。目前OpenAI估值已高达7300亿美元,市场普遍预期其最快将在今年启动上市进程。换句话说,这不仅是一次产品调整,更是一次围绕算力、模型和资本的全面战略转向。
一句话总结:关停Sora只是表象,OpenAI真正的目标是为下一代模型和IPO重构整个资源与产品体系。
(图片来自于X)
其他链接
https://x.com/soraofficialapp/status/2036546752535470382
06
Maven AI进入美军核心体系
战场决策加速自动化,AI军事化引发伦理争议
Palantir 的 Maven AI 正在从“辅助工具”走向“体系核心”。根据曝光的五角大楼备忘录,这一系统已被列为跨军种核心记录项目,并由 美国国防部 统一推进,管理权从 国家地理空间情报局 转交至首席数字与人工智能办公室,意味着其战略地位显著提升。简单来说,Maven的作用是把战场上的海量数据——包括卫星、无人机等信息——快速整合,然后自动完成目标识别、优先级排序,甚至辅助生成打击决策,大幅压缩决策链条。这种能力一旦规模化部署,将改变传统“人主导”的作战模式。不过,问题也随之而来:当AI越来越接近决策核心,其可靠性、误判风险以及伦理边界都成为争议焦点。与此同时,围绕供应链安全与技术控制,不同AI公司的参与资格也开始被严格审视。
一句话总结:Maven的升级不仅是技术进步,更标志着战争正迈入“算法参与决策”的新阶段。
https://github.com/palantir
https://www.reuters.com/technology/pentagon-adopt-palantir-ai-as-core-us-military-system-memo-says-2026-03-20/
07
Cursor“套壳风波”引爆开源争议
Kimi K2.5成隐形底座,中国模型走向全球舞台
AI编程工具 Cursor 新发布的Composer 2原本主打“自研最强模型”,却很快被开发者发现异常——通过API抓包,模型ID直指 Kimi K2.5。随后社区进一步验证,其分词器与Kimi完全一致,基本坐实“基座复用”。事件迅速发酵,甚至引来 Elon Musk 等业内人士关注。面对质疑,Cursor联合创始人最终承认:确实基于Kimi K2.5,并在此基础上进行了继续预训练和强化学习优化,同时就未标注来源公开致歉。有意思的是,Kimi团队并未强硬追责,而是将其视为开源生态的一种合作实践。这一事件的真正意义在于,它用一次“争议”验证了Kimi K2.5在多模态、长上下文和代码能力上的全球竞争力,甚至已被 Cloudflare 等企业采用。
一句话总结:从“套壳争议”到全球采用,Kimi K2.5正在成为开源大模型的关键基础设施。
相关链接
https://cursor.com/cn/blog/composer-2https://huggingface.co/moonshotai/Kimi-K2.5
关于「硅基温度」系列文章
我们希望在当前信息爆炸、浅阅读盛行的环境中将大模型相关的知识冷凝萃取,输出专业、深度、高质量的硬核文章。我们期待与你一起在浮躁的时代静下心来,共品一杯“思想冷萃”。
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号