站点图标 博海拾贝

当Token变成劳动力,人就变成了接口

本文来自微信公众号: 动察Beating ,作者:律动编辑部

1876年,费城世博会。巴西皇帝佩德罗二世拿起贝尔发明的电话,听到另一头传来的声音,惊呼:「天哪,它会说话!」

一百五十年后,2026年3月18号,圣何塞会议中心。穿黑色皮夹克的黄仁勋站在GTC大会的舞台上,也说了一句让人惊的话。

「十年后,NVIDIA大概有7.5万名员工。他们会非常非常忙,因为要和750万个AI agent一起工作。」

台下笑了。

7.5万人,750万个agent,1:100。

黄仁勋自己也笑了,补了一句:「它们会全天候工作。希望我们的人不用跟它们比。」

掌声散了,这个数字被当天更花哨的芯片发布和合作协议淹没了。但我们再把它单独拎出来想一会儿,这有可能是整场大会最重要的一句话之一。

不止有黄仁勋。三个月前,另一个人把同一种未来描述得更具体。

2026年1月,拉斯维加斯CES。麦肯锡CEO Bob Sternfels坐在台上报数字。

「我们现在有4万名人类员工,大约2.5万个AI agent。」不到两年前,这个数字还是几千。那2.5万个agent过去半年生成了250万张图表。

250万张图表。过去这活儿是刚入职的分析师干的。二十三四岁,顶着世界名校光环,凌晨三点对齐坐标轴。

那是每一个麦肯锡新人的起点,用最机械的劳动换一张通往合伙人之路的门票。

如今这张门票的前半段被agent接管了。Sternfels说:AI让某些岗位增长了25%,也让另一些岗位缩减了25%。公司被整整齐齐地劈成两半,扩张的一半和收缩的一半。

NVIDIA的故事和麦肯锡的故事讲的是同一件事。

1:100的世界里,干活的是Token驱动的agent,人是连接在agent上面的接口。

外挂的遥控器不在你手里

GTC那一周,黄仁勋做客All-In Podcast,说了一句杀伤力更大的话。

「假设你有一个年薪50万美元的工程师。如果他没有消耗至少25万美元的Token,我会非常担忧。」

主持人追问NVIDIA是否在为工程团队花20亿美元买Token,黄仁勋答:「我们正在努力。」

一个不烧Token的工程师,50万也不值50万。

NVIDIA的方案很直接,往薪酬包里塞Token。黄仁勋在GTC主题演讲上说,未来NVIDIA每个工程师都会有一笔年度Token预算,大约是基本工资的一半。

一个base几十万美元的工程师,额外拿到相当于半个base的推理算力配给,总包里三分之一是纯粹的燃料。

一个拿满额Token预算的人,等于全天候有十几个AI agent帮他写代码、跑测试、搜文献、做仿真。一个只有免费版API额度的人,还在靠双手敲键盘。两个人简历可能一模一样,产出差5到10倍。

这在硅谷已经不是理论了。

今年3月,Business Insider报道了一个变化:工程师面试时开始问「这个岗位配多少Token预算?」Theory Ventures的合伙人Tomasz Tunguz把Token预算叫工程师薪酬的「第四支柱」,排在底薪、奖金、股权后面。

OpenAI总裁Greg Brockman的话更直接:你能调用多少推理算力,将越来越决定你的整体生产力。

黄仁勋在GTC演讲里自己也说了:「有多少Token跟着我的岗位走?这已经是硅谷的招聘工具了。」

1950年代,底特律汽车工人的工资在全美名列前茅。真正让他们过上中产生活的,是亨利·福特发明的流水线。工人站在线上,线动人不动,每个人的产出被机械臂放大了几十倍。一个底特律工人的生活水准远超同期的手工匠人,手艺未必更好,但他脚下踩的是一条更粗的流水线。

2026年的Token预算,就是1950年的流水线。

但有一个区别。

底特律工人离开福特,可以去通用,可以去克莱斯勒,流水线哪儿都有。工会能跟资方谈判,要求更好的线速和更安全的环境。

Token预算不一样。公司给你那天你是超人,收回那天你变回路人。股票能套现带走,技能能跟着你跳槽。Token预算什么都不是,就是外挂,开关在公司手里。

硅谷已经有了一个新词来形容这种处境,叫「GPU饥渴」。

顶级AI研究员跳槽,薪资差距已经排到第二位了,排第一的是算力。跑不了实验,部署不了agent,能力被配额卡死。「你们给多少Token」有时候排在股票前面。股票是一张可能跌的远期支票,Token预算是今天就能兑现的生产力。

而不用AI的人,直接出局。

Goldman Sachs估算AI可能自动化美国25%的工时。Mercer调查说65%的高管预期两到三成的员工会因AI被重新配置。两组数字叠在一起,结论很清楚:有Token的人产出爆炸,没有Token的人被优化掉。

分界线是Token配额,和人的能力,关系越来越小。

Token吞吐量就是估值

个人的价值由Token配额决定。公司呢?

2026年3月初,一家叫MiniMax的上海公司发了上市以来的第一份年报。全年营收7900万美元,调整后净亏损2.5亿2.5亿。按传统财务指标看,这是一家烧钱的小公司,营收只有Accenture一个季度的零头。

但资本市场不这么看它。

MiniMax的CEO闫俊杰在财报电话会上说了一句话,比整份财报都重要:「公司的价值,由智能密度乘以Token吞吐量决定。」

Token吞吐量,不是营收增速,不是用户数,不是毛利率。

支撑这句话的数据很硬。2026年2月,MiniMax的M2系列模型日均Token消耗量,比两个月前的12月涨了6倍。编程场景的Token消耗涨了10倍。在AI模型聚合平台OpenRouter上,MiniMax的M2.5两周消耗了4.55万亿Token,把美国的模型全部挤下去,一家上海公司第一次登上全球Token消耗排行榜的榜首。

《南华早报》报道这件事时用了一个说法:中国的开源模型终结了美国开发者长达一年的市场统治。终结靠的是什么?Token消耗量。谁的Token被烧得最多,谁就是赢家。

这个逻辑放到OpenAI身上也成立。OpenAI的API平台每分钟处理60亿Token,两年涨了20倍。年消费超10万美元的企业客户,一年翻了将近7倍。Barclays分析师Ross Sandler拆了一遍数据后得出结论:OpenAI在消费端的Token消耗量是Google Gemini的两倍以上。

Token消耗量,成了给AI公司排座次的硬通货。

更有意思的是这件事在公司内部的样子。纽约时报最近报道了一个叫「tokenmaxxing」的现象:Meta和OpenAI的工程师在内部排行榜上比拼谁消耗的Token多。

Token预算正在变成标配福利,就像十年前的免费午餐和牙科保险。一个在爱立信斯德哥尔摩办公室工作的工程师告诉纽约时报,他花在Claude上的钱可能比他工资还高,但公司买单。

TechCrunch上周的一篇文章算了一笔账:一个工程师下午写篇文章可能用掉1万Token,但一个跑着agent集群的工程师,一天能在后台烧掉几百万Token,一个字都不用打。

两年前,每百万Token的价格是33美元。现在,9美分。跌了99.7%。价格越便宜,烧得越猛。烧得越猛,越离不开。

闫俊杰在电话会上的预判是:未来市场对Token的需求,可能会增长一到两个数量级。

这就是2026年给一家公司定价的新方式。不看你赚了多少钱,看你的Token被烧了多少。MiniMax亏2.5亿,但Token吞吐量的增长曲线陡得吓人,资本市场愿意下注。你可以把它类比成2006年的YouTube,一毛钱收入没有,但带宽消耗量在指数增长,Google愿意花16.5亿买它。

当年YouTube烧的是带宽。今天MiniMax烧的是Token。计量单位变了,逻辑没变。

产能等得起,债务等不起

GTC同一周还发生了一件事。

3月18号,Stripe发布了Machine Payments Protocol。说白了:AI agent可以自己花钱了。

一个agent需要一组数据,自己付费下载。需要算力跑推理,自己按秒买。需要调用另一个agent的API,自己结账。整个过程不需要人类点确认。Visa为这个协议适配了信用卡支付,Coinbase做了agent专属钱包,Mastercard在开发Agent Pay。

Token的消耗从此多了一个来源。过去只有「人调度agent」这一种场景。现在agent自己也在消耗Token,而且在用Token赚来的钱去买更多Token。Stripe联合创始人John Collison用了一个词:洪流。

黄仁勋在台上给了对应的数字:NVIDIA要把Token生成速率从2200万拉到7亿,350倍。

这是在建一整张公路网,赌车流量会指数增长。

6000亿美元的基建赌注,需要一个前提:全世界对Token的消耗量,要大到能撑起回本。这个前提目前还只是一个假设,而且是一个非常昂贵的假设。

2025年最后一个季度,科技公司发行了创纪录的1087亿美元债券。进入2026年,头几周又是1000亿。

Morgan Stanley和JPMorgan预估未来几年AI相关企业借债总量可能达到1.5万亿美元。据Goldman Sachs估算,AI资本开支已经占到美国GDP的3%左右。

华尔街最先嗅到风险的一批人已经开始买保险了。信用违约互换的交易量在升。花几十个基点的保费,赌的是这些公司可能还不上钱。Citi的信用策略主管Daniel Sorid在一次投资人会议上说了一句:「作为信用投资者,面对这种规模的转型,需要这么大的资本投入,让人本能地感到不安。」

Google创始人Larry Page在公司内部说过一句更极端的话,Page多次对Google员工说:「我宁愿破产也不愿输掉这场竞赛。」

它精确地描述了一个囚徒困境:每一家巨头都在赌对手会继续投入,所以自己不能停。停下来的人直接出局。

乐观的一面有硬数据。Token生成速率拉高350倍。Stripe刚让agent自己花钱。McKinsey两年内从几千个agent扩到2.5万个。如果agent经济全面起飞,Token消耗的增长曲线确实可能拐成指数级。

但有一个日期让很多人睡不好觉。2026年下半年,续约悬崖。

2024到2025年,企业花的是「创新预算」。CEO需要在财报会上说一句「我们在拥抱AI」,价格不太敏感,效果不太苛求,花的是姿态的钱。2026年下半年,第一批试点项目到续约节点。创新预算花完了,CTO让出了桌子对面的位置,CFO坐了过来。CFO只认一个数字:ROI。

如果大量试点被砍,Token的终端消耗会突然出现缺口。上游6000亿砸出来的产能,数据中心建好了,电力接通了,芯片上架了,变成闲置产能。

这种事历史上发生过。

2000年,电信公司花万亿美元铺海底光缆。泡沫破裂,全球90%的光缆暗在海底,闲了将近十年。直到Netflix开始流媒体、iPhone引爆移动互联网,光缆才被一根一根点亮。光缆没白铺。铺光缆的朗讯、北电、世通都破产了。基础设施还在,建设者不在了。

2012年,中国光伏。无锡尚德、江西赛维把组件价格打穿全球成本线。产能严重过剩,行业血洗三年。需求后来确实来了,光伏今天是地球上增长最快的能源。尚德破产了。赛维破产了。先行者躺在了黎明前最后一段黑暗里。

贝尔发明电话后,Western Union拒绝以10万美元买下专利。十年后Western Union愿意出2500万美元,贝尔不卖了。三十年后电话网络覆盖了全美国。但铺网络的那些小公司,大多没活到电话普及的那一天。赢家是后来靠收购和垄断吃下一切的AT&T。

基础设施的故事永远是这个版本。方向几乎总是对的,但时间差会杀人。

回到Token。前面讲的那个结构,Token变成劳动力,人变成接口,Token配额定义一切,成立的前提是Token被持续、大量、加速地消耗。工程师的10倍产出靠Token供给撑着,砍掉就归零。OpenAI的8400亿估值靠算力承诺撑着,协议终止就缩水。6000亿的基建靠终端消耗增长撑着,增速一放缓就是空转。

每一层依赖下一层。消耗增速比建设增速慢两三年,整条链上所有人的定价都会松动。

你靠着哪条铁路

2023年有卡就是爹。2026年有Token就是爹。

听起来像换了个词,底下的变化比大多数人意识到的要深。

GPU是资产,买到了就是你的,锁在机房里,别人拿不走。

Token是流量。你的10倍产出、你的高估值、你在谈判桌上的筹码,全部建立在一股持续的、不属于你的供给上。水龙头一关,一切归零。

当Token变成真正干活的劳动力,人就变成了接在Token上面的接口。好的接口能让Token发挥更大价值,判断力、审美、经验,这些东西还在。但一个接口能做多少事,首先取决于它被接入了多少Token。

1870年代的美国农民发现,种出好小麦还不够,得在铁路边上。1950年代的手工匠人发现,手艺再好也拼不过流水线上的工人。2026年的工程师正在发现,代码写得再漂亮,没有Token预算,一切都是空转。

当Token变成真正的劳动力,人就变成了接口。接口本身的好坏还重要,但接口值多少钱,首先取决于谁在给它供电。

退出移动版