当Token同时站在语言、 智能与经济的交汇点 I人大高瓴魏哲巍教授做客CGTN解析Token经济
信息来源:人大高瓴人工智能学院 发布日期:2026年4月18日
来源:ALGO Lab
当聊天机器人变成了昼夜不息的数字劳工,当每一次“思考”都开始被明码标价,一个新的经济学命题悄然浮现——Token,正在成为AI时代的核心计量与结算单位。
近日,中国人民大学高瓴人工智能学院副院长魏哲巍教授应邀参加中国国际电视台(CGTN)Digital & Global Business视频播客节目录制,与主持人王天禹、徐一及印度籍记者Ankit同台对谈。节目时长近一小时,围绕备受关注的“Token经济”议题展开,内容从相关技术脉络延展至全球产业格局。
完整节目:https://weixin.qq.com/sph/AQFYByOfqc
01
从OpenClaw讲起:
AI正在获得“行动能力”
节目一开场,记者徐一通过一个视频介绍了OpenClaw。她拿着塑料龙虾玩具说道:
“OpenClaw 是一个天才的名字。Claw(龙虾的钳子)象征手,AI 过去一直被比喻成大脑。现在,AI 终于有手了。”
备受关注的OpenClaw,正是这波Token经济讨论的直接导火索。徐一坦言,在今年 3月之前,她对“Token”的印象还停留在比特币;直到她花了 25美元尝试部署OpenClaw,才第一次真切地感受到AI智能体(Agent)消耗Token的速度。
Ankit作为前软件工程师,也正在尝试部署OpenClaw,试图让它每天自动生成一份新闻简报。而王天禹则出于“开放本地权限可能带来的安全风险”选择暂时观望。这正是智能体时代用户共同的纠结点:既想提升效率,又要警惕风险和代价。
魏哲巍老师对此也深有共鸣:
“作为一个 AI 老师,我其实挺挣扎的。按理说我应该装 OpenClaw。但它等于给大模型公司开了一道通往你整台电脑的大门——所有邮件、所有文件都暴露了。事实上,我的一些学生正在基于通义千问做类似的 Agent 框架,叫QwenPaw。但对我来说,风险是同等的。”
02
为何Token成为焦点?
从对话工具到智能体
Token 并不是新概念,它已经在学术圈存在了十几年。真正的变化是它从技术后台走到了定价前台。魏老师用一条时间线复盘了这段历史:
“我有学生在用 Claude Pro,$20 一个月的套餐,结果第一个任务就把当月额度用完了。”
而OpenClaw则将这一问题进一步推到台前:它本身不提供底层模型能力,需要通过API调用各家基础模型,于是按Token计费成了唯一合理的结算方式。
也正是在节目录制前两天,一条重磅新闻出炉:Anthropic宣布Claude Pro与Max订阅用户不得再用包月额度通过OpenClaw等第三方Agent框架调用Claude,若继续使用须改走按量付费的API。
“原因很直接——Token消耗量已经远超订阅模式所能承受的范围。”
03
三个关键词:
Token背后的底层逻辑
面对徐一“那 API 到底是什么”的追问,魏老师用形象的比喻介绍道:
“想象你走进一家餐厅,你不会冲进后厨自己炒菜。你会坐下、看菜单、点菜,服务员把订单递进厨房,厨师做好,服务员再把菜端出来。API 就是那个服务员。——你不需要知道厨房里发生了什么,餐厅按菜收费,API 就按 Token 收费。”
API 是订阅制过渡到 Token 经济的前提。可以说,没有 API,就没有 Token 经济。
针对 Ankit 提出的“黄仁勋为什么说推理到了拐点”,魏老师给出了另一个生动的比喻:
“训练就像上学——读书、做作业、考试,昂贵但一次性完成。推理就像毕业后上班——每天都在用学到的东西解决实际问题。”
“过去几年,AI的资金主要投入在训练上。但从2025年开始,推理的成本正在全面超越训练——因为几亿用户每天都在高强度使用模型做推理。”
Ankit 追问:“那我们是不是可以不再训练了?”魏老师给出了具体的回答:
“不不不,是两条并行的线。模型公司必须一边继续训练更强的模型,一边投入资源服务用户——这是一场极难的平衡。训练和推理之间的资源分配,就是黄仁勋所说的‘拐点’。”
王天禹把“上下文窗口”类比成“记忆力”,魏老师顺势展开:
“4 个人开会,你能清楚追踪每个人之间的互动;400 个人开会呢?追踪任意两人之间的关联,复杂度是二次方爆炸的。Transformer 的注意力机制正是如此——上下文扩大 10 倍,算力成本涨 100 倍。这不只是工程问题,更是一道根本性的学术难题,也是我们学院正在主攻的方向之一。”
顺带,魏老师也对网上流传的一种说法作了澄清。Ankit 提到有“写查询要像原始人一样节省 Token”的梗图,魏老师认为不能过于当真:
“这种说法可能有些夸大了。一般聊天场景里,单次对话消耗的 Token 往往不算多,很难说是真正的‘负担’——与其过度纠结字数,不如把问题写清楚,通常更容易得到满意的回答。”
04
Token 到底是什么?
“智元”“模元”“词元”?
关于 Token 的中文译名,中国业界曾有一场不小的争论:
最终,中国计算机学会(CCF)定名“词元”,强调其语言学根源。
“这场争论本身就说明了问题——Token 同时站在了语言、智能与经济的交汇点上,没有哪一个译名能完全概括它。”
至于为什么不用字母,也不用完整单词?
“'Artificial' 是 10 个字母,如果按字母算,一个词 10 个Token,太浪费;如果按完整单词算,run/running/runner/rerun光英文就上百万,更别说中文。所以Token是两者之间的较为理想的折中:常用词保持完整,罕见词拆成有意义的子单元。'tokenization' 就会被拆成' token' + 'ization'。”
这里藏着一个值得中文用户关注的现实:“人工智能”四个汉字在GPT-4的分词器里可能变成3–4个Token,而英文"artificial intelligence"只需要2个。同义,成本近乎翻倍。所幸DeepSeek、通义千问、GPT-4o都在为中文做深度优化,这道鸿沟正在缩小。
05
五层蛋糕:AI 的资金,
究竟流向何方?
谈到Token的定价,魏老师借用了黄仁勋近期提出的“AI五层蛋糕”模型:
徐一近期在深圳的采访也讲述了一个具有代表性的应用层案例:
“我去走访了罗湖的‘一人公司(OBC)’孵化社区,有一间办公室里只有一个真人创始人,旁边摆着两台电脑——那就是他的AI协作伙伴。我问他用几个Claw bot?他说三个。”
魏老师也以编程场景为例说明了这一变化:
“过去我们说一个优秀的程序员一天写 400行代码就算高产了。今天,用Claude Code或通义灵码,一天写1万行也不罕见——而且质量更高。”
由此可见,Token 经济的价值锚点不在 Token 这一计数符号本身,而在模型与上层链路最终交付的可用成果;Token 主要充当精细化计量与结算用的中介单位。
06
价格回调:
免费时代走向终结?
节目录制期间,市场正发生一件耐人寻味的事:过去两年高喊“算力普惠”的大模型厂商们,集体开始涨价。腾讯、阿里、Minimax、Kimi陆续结束免费试用,部分模型服务价格出现数倍上涨,主要云计算平台也相继调价。
徐一问:“AI 的免费时代,是不是终结了?”
魏老师给出了三个层次的解释:
“我看到一个有趣的说法——现在电脑里的内存比黄金还贵。GPU 里那种 HBM(高带宽内存)全球只有两三家供应商,价格快速上涨,直接推高了 Token 的成本。”
“需求在一年里增长了许多倍。中国单日Token消耗量已经十分庞大;但GPU供给的增速远远跟不上。简单的经济学规律:供不应求,价格自然上升。”
“你不可能每天免费送出万亿个Token。之前的免费和低价,本质上是VC的资金在补贴。当所有人都意识到这不可持续,行业就会集体回到理性定价。”
07
Sora的启示:
并非所有AI都用Token
谈到 OpenAI 近期关停 Sora 的新闻,魏老师做了一个非常重要的技术澄清:
“Sora这种视频生成模型,其实不是用Token计算的,而是一种叫Diffusion(扩散)的模型架构:从一张随机噪声图出发,一步一步‘演化’成最终画面。它的成本体现在迭代步数上,而不是Token。”
那为什么它还是关停了?魏老师从机会成本的角度进行了解释:
“每一块跑Sora生成视频的GPU,都是一块没能跑Claude Code的GPU。编程Agent的每小时GPU产出的经济价值,远高于C端视频生成。当算力稀缺时,市场会自动把它引向最有价值的用途。Sora没有输给技术,而是在GPU资源竞争中让位于编程智能体。”
不过,文字、图像、音频与视频共享同一套底层架构,未来视频生成效率有望大幅提升。Sora作为独立产品或许已被关停,但AI视频生成前景依然广阔。
08
中国优势:
把电力变成Token
谈到中国 AI 的独特优势,魏老师给出了两个结构性判断:
“中国拥有全球最具竞争力的电力成本之一——四川云南的水电,西北的风光电。而且我们有电力盈余,超过一半是绿色能源。”
“传统的电力出口很难做,你不可能拉一根电缆横跨太平洋。但通过 API 卖 Token,本质上就是把中国的电力以算力的形式出口出去。这可能会成为一种全新的‘能源贸易’形态。”
主持人王天禹也补充说,他此前走访过多个中国水电站和风光电基地:
“AI 竞赛的最终阶段,其实是能源竞赛——这是黄仁勋的原话。”
“目前,闭源模型在Agent任务上有明显优势。因为训练一个能胜任智能体工作的通用大模型非常难。但这恰恰是学术界可以发力的地方。一旦我们在开源Agent训练上取得关键突破,让小型开源模型接近大模型的性能水平,很多公司会迅速转向自部署,现有竞争格局将随之发生显著变化。DeepSeek、通义千问、GLM——中国的开源AI社区已经非常活跃。”
09
关于具身智能:
前景尚不明朗的议题
节目后期, Ankit抛出了一个问题:Token和边缘 AI、具身智能机器人之间,到底是什么关系?
这一次,魏老师非常坦诚:
“说实话——我不知道。人形机器人现在真的没有‘大脑’,它们会跳舞,那是提前编程好的动作,不是自己学出来的。自动驾驶用的是 VLA(视觉-语言-动作)模型,中间并没有一个大模型像司机一样思考。”
“归根结底,这仍是一个研究问题——我们还不知道,如何训练出一个既能同时处理文本、图像、视频,又能在物理世界中行动的多模态模型。大家都在全力尝试,但目前还看不到足够明确的信号,能够说明哪条路径就是正确答案。一旦我们找到像当年GPT-3那样的关键框架,突破或许很快就会出现。”
10
全球视角:
被低估的“南方”市场
印度记者 Ankit 贡献了一个经常被忽略的维度:
“印度刚刚举办了全球 AI 峰会,80 多个国家签署了宣言。这次讨论的重点从‘安全’转向了‘应用’。全世界还有几十亿人完全没被 AI 服务过。非洲几乎是空白。无人驾驶发展这么多年,也还只在旧金山跑。”
“印度有 22 种官方语言,上百种实际使用的语言。而现有 AI 模型几乎都是在英文数据上训的。印度必须训练自己的本土模型,不然就服务不了自己的人民。这背后是 $3000 亿的投资承诺和 $400 亿的深科技承诺。”
可见,全球议程正从“安全”更多转向“应用”与本土化部署,而真正制约普惠落地的,往往是多语种数据、基础设施与可及性等现实门槛,以及规模庞大、长期未被有效触达的人群。中美“算力霸权”的议题虽受瞩目,但Token经济若要走向纵深,更离不开全球数以十亿计、尚未被充分触达与服务的用户群体。
结语:当技术与经济学相遇
节目尾声,三位主持人和魏老师分别给出了他们的感言。
徐一和 Ankit 不约而同地感慨:
“我们希望 AI 是来帮助我们的,而不是让我们为了给 AI Agent 付账单而更拼命地工作。”
王天禹半开玩笑地说:
“我最近在想——什么时候,我们的工资会用 Token 来发?”
而魏老师给出的感言,也许正是为什么人大高瓴人工智能学院要参与这场讨论的最好注脚:
“Token 经济不仅讲了一个技术故事,同时也在讲一个经济学故事,这是两个学科交汇之处。而我认为,这正是最激动人心的部分。”
从OpenClaw所代表的AI行动能力拓展,到Claude调整OpenClaw接入策略的商业考量;从深圳一人公司借助AI协作提升效率,到通过算力服务将能源与模型能力打包输出的新思路……这一场Token经济的讨论,折射的不只是AI的技术迭代,更是一次贯通能源、芯片、算法、产业、经济学诸环节的系统性命题。
高瓴人工智能学院依托中国人民大学深厚的人文社科底蕴,天然具备“经济学 × 人工智能”的独特DNA。我们既研究神经网络、大模型与智能体的前沿技术,也思考算力定价、Token经济与产业演化的底层逻辑,开展算力与Token经济学理的研判与传播,以在这一轮技术变革中贡献兼具技术纵深与经济洞察的学理分析与公共阐释。
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号