当Token变成劳动力，人就变成了接口

梁萧

56 分前

本文来自微信公众号：动察Beating ，作者：律动编辑部

1876年，费城世博会。巴西皇帝佩德罗二世拿起贝尔发明的电话，听到另一头传来的声音，惊呼：「天哪，它会说话！」

一百五十年后，2026年3月18号，圣何塞会议中心。穿黑色皮夹克的黄仁勋站在GTC大会的舞台上，也说了一句让人惊的话。

「十年后，NVIDIA大概有7.5万名员工。他们会非常非常忙，因为要和750万个AI agent一起工作。」

台下笑了。

7.5万人，750万个agent，1:100。

黄仁勋自己也笑了，补了一句：「它们会全天候工作。希望我们的人不用跟它们比。」

掌声散了，这个数字被当天更花哨的芯片发布和合作协议淹没了。但我们再把它单独拎出来想一会儿，这有可能是整场大会最重要的一句话之一。

不止有黄仁勋。三个月前，另一个人把同一种未来描述得更具体。

2026年1月，拉斯维加斯CES。麦肯锡CEO Bob Sternfels坐在台上报数字。

「我们现在有4万名人类员工，大约2.5万个AI agent。」不到两年前，这个数字还是几千。那2.5万个agent过去半年生成了250万张图表。

250万张图表。过去这活儿是刚入职的分析师干的。二十三四岁，顶着世界名校光环，凌晨三点对齐坐标轴。

那是每一个麦肯锡新人的起点，用最机械的劳动换一张通往合伙人之路的门票。

如今这张门票的前半段被agent接管了。Sternfels说：AI让某些岗位增长了25%，也让另一些岗位缩减了25%。公司被整整齐齐地劈成两半，扩张的一半和收缩的一半。

NVIDIA的故事和麦肯锡的故事讲的是同一件事。

1:100的世界里，干活的是Token驱动的agent，人是连接在agent上面的接口。

外挂的遥控器不在你手里

GTC那一周，黄仁勋做客All-In Podcast，说了一句杀伤力更大的话。

「假设你有一个年薪50万美元的工程师。如果他没有消耗至少25万美元的Token，我会非常担忧。」

主持人追问NVIDIA是否在为工程团队花20亿美元买Token，黄仁勋答：「我们正在努力。」

一个不烧Token的工程师，50万也不值50万。

NVIDIA的方案很直接，往薪酬包里塞Token。黄仁勋在GTC主题演讲上说，未来NVIDIA每个工程师都会有一笔年度Token预算，大约是基本工资的一半。

一个base几十万美元的工程师，额外拿到相当于半个base的推理算力配给，总包里三分之一是纯粹的燃料。

一个拿满额Token预算的人，等于全天候有十几个AI agent帮他写代码、跑测试、搜文献、做仿真。一个只有免费版API额度的人，还在靠双手敲键盘。两个人简历可能一模一样，产出差5到10倍。

这在硅谷已经不是理论了。

今年3月，Business Insider报道了一个变化：工程师面试时开始问「这个岗位配多少Token预算？」Theory Ventures的合伙人Tomasz Tunguz把Token预算叫工程师薪酬的「第四支柱」，排在底薪、奖金、股权后面。

OpenAI总裁Greg Brockman的话更直接：你能调用多少推理算力，将越来越决定你的整体生产力。

黄仁勋在GTC演讲里自己也说了：「有多少Token跟着我的岗位走？这已经是硅谷的招聘工具了。」

1950年代，底特律汽车工人的工资在全美名列前茅。真正让他们过上中产生活的，是亨利·福特发明的流水线。工人站在线上，线动人不动，每个人的产出被机械臂放大了几十倍。一个底特律工人的生活水准远超同期的手工匠人，手艺未必更好，但他脚下踩的是一条更粗的流水线。

2026年的Token预算，就是1950年的流水线。

但有一个区别。

底特律工人离开福特，可以去通用，可以去克莱斯勒，流水线哪儿都有。工会能跟资方谈判，要求更好的线速和更安全的环境。

Token预算不一样。公司给你那天你是超人，收回那天你变回路人。股票能套现带走，技能能跟着你跳槽。Token预算什么都不是，就是外挂，开关在公司手里。

硅谷已经有了一个新词来形容这种处境，叫「GPU饥渴」。

顶级AI研究员跳槽，薪资差距已经排到第二位了，排第一的是算力。跑不了实验，部署不了agent，能力被配额卡死。「你们给多少Token」有时候排在股票前面。股票是一张可能跌的远期支票，Token预算是今天就能兑现的生产力。

而不用AI的人，直接出局。

Goldman Sachs估算AI可能自动化美国25%的工时。Mercer调查说65%的高管预期两到三成的员工会因AI被重新配置。两组数字叠在一起，结论很清楚：有Token的人产出爆炸，没有Token的人被优化掉。

分界线是Token配额，和人的能力，关系越来越小。

Token吞吐量就是估值

个人的价值由Token配额决定。公司呢？

2026年3月初，一家叫MiniMax的上海公司发了上市以来的第一份年报。全年营收7900万美元，调整后净亏损2.5亿2.5亿。按传统财务指标看，这是一家烧钱的小公司，营收只有Accenture一个季度的零头。

但资本市场不这么看它。

MiniMax的CEO闫俊杰在财报电话会上说了一句话，比整份财报都重要：「公司的价值，由智能密度乘以Token吞吐量决定。」

Token吞吐量，不是营收增速，不是用户数，不是毛利率。

支撑这句话的数据很硬。2026年2月，MiniMax的M2系列模型日均Token消耗量，比两个月前的12月涨了6倍。编程场景的Token消耗涨了10倍。在AI模型聚合平台OpenRouter上，MiniMax的M2.5两周消耗了4.55万亿Token，把美国的模型全部挤下去，一家上海公司第一次登上全球Token消耗排行榜的榜首。

《南华早报》报道这件事时用了一个说法：中国的开源模型终结了美国开发者长达一年的市场统治。终结靠的是什么？Token消耗量。谁的Token被烧得最多，谁就是赢家。

这个逻辑放到OpenAI身上也成立。OpenAI的API平台每分钟处理60亿Token，两年涨了20倍。年消费超10万美元的企业客户，一年翻了将近7倍。Barclays分析师Ross Sandler拆了一遍数据后得出结论：OpenAI在消费端的Token消耗量是Google Gemini的两倍以上。

Token消耗量，成了给AI公司排座次的硬通货。

更有意思的是这件事在公司内部的样子。纽约时报最近报道了一个叫「tokenmaxxing」的现象：Meta和OpenAI的工程师在内部排行榜上比拼谁消耗的Token多。

Token预算正在变成标配福利，就像十年前的免费午餐和牙科保险。一个在爱立信斯德哥尔摩办公室工作的工程师告诉纽约时报，他花在Claude上的钱可能比他工资还高，但公司买单。

TechCrunch上周的一篇文章算了一笔账：一个工程师下午写篇文章可能用掉1万Token，但一个跑着agent集群的工程师，一天能在后台烧掉几百万Token，一个字都不用打。

两年前，每百万Token的价格是33美元。现在，9美分。跌了99.7%。价格越便宜，烧得越猛。烧得越猛，越离不开。

闫俊杰在电话会上的预判是：未来市场对Token的需求，可能会增长一到两个数量级。

这就是2026年给一家公司定价的新方式。不看你赚了多少钱，看你的Token被烧了多少。MiniMax亏2.5亿，但Token吞吐量的增长曲线陡得吓人，资本市场愿意下注。你可以把它类比成2006年的YouTube，一毛钱收入没有，但带宽消耗量在指数增长，Google愿意花16.5亿买它。

当年YouTube烧的是带宽。今天MiniMax烧的是Token。计量单位变了，逻辑没变。

产能等得起，债务等不起

GTC同一周还发生了一件事。

3月18号，Stripe发布了Machine Payments Protocol。说白了：AI agent可以自己花钱了。

一个agent需要一组数据，自己付费下载。需要算力跑推理，自己按秒买。需要调用另一个agent的API，自己结账。整个过程不需要人类点确认。Visa为这个协议适配了信用卡支付，Coinbase做了agent专属钱包，Mastercard在开发Agent Pay。

Token的消耗从此多了一个来源。过去只有「人调度agent」这一种场景。现在agent自己也在消耗Token，而且在用Token赚来的钱去买更多Token。Stripe联合创始人John Collison用了一个词：洪流。

黄仁勋在台上给了对应的数字：NVIDIA要把Token生成速率从2200万拉到7亿，350倍。

这是在建一整张公路网，赌车流量会指数增长。

6000亿美元的基建赌注，需要一个前提：全世界对Token的消耗量，要大到能撑起回本。这个前提目前还只是一个假设，而且是一个非常昂贵的假设。

2025年最后一个季度，科技公司发行了创纪录的1087亿美元债券。进入2026年，头几周又是1000亿。

Morgan Stanley和JPMorgan预估未来几年AI相关企业借债总量可能达到1.5万亿美元。据Goldman Sachs估算，AI资本开支已经占到美国GDP的3%左右。

华尔街最先嗅到风险的一批人已经开始买保险了。信用违约互换的交易量在升。花几十个基点的保费，赌的是这些公司可能还不上钱。Citi的信用策略主管Daniel Sorid在一次投资人会议上说了一句：「作为信用投资者，面对这种规模的转型，需要这么大的资本投入，让人本能地感到不安。」

Google创始人Larry Page在公司内部说过一句更极端的话，Page多次对Google员工说：「我宁愿破产也不愿输掉这场竞赛。」

它精确地描述了一个囚徒困境：每一家巨头都在赌对手会继续投入，所以自己不能停。停下来的人直接出局。

乐观的一面有硬数据。Token生成速率拉高350倍。Stripe刚让agent自己花钱。McKinsey两年内从几千个agent扩到2.5万个。如果agent经济全面起飞，Token消耗的增长曲线确实可能拐成指数级。

但有一个日期让很多人睡不好觉。2026年下半年，续约悬崖。

2024到2025年，企业花的是「创新预算」。CEO需要在财报会上说一句「我们在拥抱AI」，价格不太敏感，效果不太苛求，花的是姿态的钱。2026年下半年，第一批试点项目到续约节点。创新预算花完了，CTO让出了桌子对面的位置，CFO坐了过来。CFO只认一个数字：ROI。

如果大量试点被砍，Token的终端消耗会突然出现缺口。上游6000亿砸出来的产能，数据中心建好了，电力接通了，芯片上架了，变成闲置产能。

这种事历史上发生过。

2000年，电信公司花万亿美元铺海底光缆。泡沫破裂，全球90%的光缆暗在海底，闲了将近十年。直到Netflix开始流媒体、iPhone引爆移动互联网，光缆才被一根一根点亮。光缆没白铺。铺光缆的朗讯、北电、世通都破产了。基础设施还在，建设者不在了。

2012年，中国光伏。无锡尚德、江西赛维把组件价格打穿全球成本线。产能严重过剩，行业血洗三年。需求后来确实来了，光伏今天是地球上增长最快的能源。尚德破产了。赛维破产了。先行者躺在了黎明前最后一段黑暗里。

贝尔发明电话后，Western Union拒绝以10万美元买下专利。十年后Western Union愿意出2500万美元，贝尔不卖了。三十年后电话网络覆盖了全美国。但铺网络的那些小公司，大多没活到电话普及的那一天。赢家是后来靠收购和垄断吃下一切的AT&T。

基础设施的故事永远是这个版本。方向几乎总是对的，但时间差会杀人。

回到Token。前面讲的那个结构，Token变成劳动力，人变成接口，Token配额定义一切，成立的前提是Token被持续、大量、加速地消耗。工程师的10倍产出靠Token供给撑着，砍掉就归零。OpenAI的8400亿估值靠算力承诺撑着，协议终止就缩水。6000亿的基建靠终端消耗增长撑着，增速一放缓就是空转。

每一层依赖下一层。消耗增速比建设增速慢两三年，整条链上所有人的定价都会松动。

你靠着哪条铁路

2023年有卡就是爹。2026年有Token就是爹。

听起来像换了个词，底下的变化比大多数人意识到的要深。

GPU是资产，买到了就是你的，锁在机房里，别人拿不走。

Token是流量。你的10倍产出、你的高估值、你在谈判桌上的筹码，全部建立在一股持续的、不属于你的供给上。水龙头一关，一切归零。

当Token变成真正干活的劳动力，人就变成了接在Token上面的接口。好的接口能让Token发挥更大价值，判断力、审美、经验，这些东西还在。但一个接口能做多少事，首先取决于它被接入了多少Token。

1870年代的美国农民发现，种出好小麦还不够，得在铁路边上。1950年代的手工匠人发现，手艺再好也拼不过流水线上的工人。2026年的工程师正在发现，代码写得再漂亮，没有Token预算，一切都是空转。

当Token变成真正的劳动力，人就变成了接口。接口本身的好坏还重要，但接口值多少钱，首先取决于谁在给它供电。