在英伟达GTC 2026大会上,黄仁勋描绘了一幅令人振奋的图景:数据中心正从传统的文件仓库,转型为生产Token的工厂,他掷地有声地指出,Token的吞吐量和生成速度,将直接决定一家AI公司明年的收入规模,这番话并非遥远的幻想,而是对AI行业商业模式深刻变革的精准把握。
Token正如同新时代的电力和石油,其战略价值与刚性需求日益凸显,越来越多的人意识到,卖API、卖会员、卖广告,远不如直接出售Token来得有前景,这套逻辑迅速在全球AI行业引发共鸣,并催生了“Token经济”的热潮——它给原本单调的商业模式披上了一层充满想象力的外衣,撑起了资本市场的乐观情绪。
今年以来,多家国内外头部AI公司完成上市或获得巨额融资,背后都少不了这一新概念的加持,狂欢之下隐忧浮现:Token经济正被简单等同于“Token需要涨价”,随着智能体替代传统聊天机器人,AI服务的算力成本指数级攀升,多数AI公司选择通过提高Token售价来构建看似更可持续的盈利模式,资本追捧AI公司,也基于同一条逻辑线:普通企业Token消耗量的持续增长,将为AI公司带来稳定且不断升值的未来。

涨价似乎成了必然,国内,字节、阿里、腾讯旗下云服务平台,以及智谱等新兴势力,要么宣布上调价格,要么取消了性价比高的基础套餐;国外,OpenAI频频提价,Anthropic也提高了Claude Code的收费标准,引发大量用户吐槽,表面上,面对旺盛需求,涨价确实能带来立竿见影的效果,但这同时埋下了供需矛盾的隐患:AI公司雄心勃勃要涨价,而众多普通企业却愈发感到负担沉重,期望着价格能保持平稳甚至下降。
不断走高的Token,正成为许多企业难以舍弃却又苦不堪言的“AI负重”,依托强势地位强行涨价,就像是在走一条单行线——只能在风平浪静的竞争环境中才能维持,但日新月异的变化,恰恰是AI行业最大的常态,管理学大师塔勒布在《反脆弱》中提醒我们,世界充满不可预测的“黑天鹅”事件,自ChatGPT横空出世以来,AI行业已多次经历“黑天鹅”的震动,每一次都掀起了变革浪潮,AI公司不能指望环境一成不变,必须培养“反脆弱”的能力:脆弱者在波动中灭亡,强韧者只能复原,而反脆弱者则能从混乱、压力与不确定性中获得成长。
对于Token的定价,行业存在两种截然不同的态度,一部分AI公司认为Token还很“便宜”,仍有上浮空间,智谱在今年2月宣布GLM Coding Plan涨价30%,理由是用户规模和调用量快速提升。“因为不愁卖,所以涨价”的商业逻辑,并不具备长期可持续性,任何充分竞争的领域,最终都会走向供需平衡,跑得快的公司能抢占先机,但也只能在短期内拥有定价权;一旦市场回归理性,涨价的空间便会收窄直至消失。
价格上涨还掩盖了许多AI公司业务单一的短板,这些企业将生产和销售Token作为唯一重心,而客户除了调用API和MaaS,还需自主搭建Agent矩阵、编排工作流完成业务适配,只懂卖Token的公司难以培养客户忠诚度,更难构建用户生态——对手一旦提供更便宜、性能更优的产品,客户就会果断离开。

另一派则认为Token仍然太贵,DeepSeek就是典型代表,4月底发布的V4预览版,性能出众,完全有理由像同行一样定价更高,然而出乎多数人意料,V4不仅没涨价,甚至部分输出的价格比前代更低,发布48小时后,DeepSeek又将V4 Pro和Flash的缓存命中率输入价格下降了90%,OpenRouter的数据显示,处理等长文本任务时,DeepSeek V4的输出价格比GPT、Claude、Gemini等便宜了99%,通过全新的混合注意力架构等技术,V4将长文本下的计算消耗降低了近73%,KV缓存占用也压缩到了前代的10%。
采用类似策略的还有商汤科技,近期推出的日日新SenseNova 6.7 Flash-Lite,主打轻量化多模态处理,通过原生多模态架构,省去了传统模型中“语言+视觉”的拼接中间层,使得参数量更小,推理过程中的Token消耗也大幅度下降——在信息搜索等场景中,削减幅度甚至可达60%,商汤还开启了免费试用:开发者首月即可获得1500次无门槛调用配额,商汤的路线非常清晰:既要降低单位Token的价格,让企业“用得起”;也要降低Token总消耗,让企业“用得起”,这两家AI公司主攻“技术降本”策略,试图激发客户的持续使用意愿,而不是单纯靠提价赚快钱。
把Token成本打下来,既是定价的博弈,考验的更是技术根基,一些公司死磕SOTA(最前沿能力),OpenAI、Anthropic力争引领通用人工智能;但也有不少公司选择不同赛道,DeepSeek并不沉迷于刷榜单,更关注“AI+生产力”,V4在智能体任务、知识处理和推理方面表现突出,并在报告生成、代码辅助、逻辑推理等多个生产力场景下实现了行业领先,Val《评估平台指出,代码生成上V4已碾压其他开源模型,成为生产力场景中的实际领先者。
商汤同样不走寻常路,而是以办公技能集(Skills)为核心突破口,除了迭代新模型,还配套全面开发了适用于办公场景的AI Skills,实现了覆盖不同需求状态的高效Agent搭建,一家大型蔬菜企业希望分析最近三年的近90万条销售数据:SenseNova前置做“数据审计”,确认准确后方才开展财务指标对照,最终自动输出“建立动态定价机制”“调整品类结构”等五项精准建议,直接服务于管理决策,相比于DeepSeek,商汤选择了更“分节奏”的打法:先把相对稳定的高频场景(如数据分析、PPT生成、深度搜索)做深做透,这类场景业务流程清晰、容错率高、即时性低,入手门槛低;之后再切入更高层次的实时智能营销、具身智能等“高热”场景,以及金融、教育等专业领域里纵深发展。

抓住了从易到难的场景演进,AI公司实质上就抓住了“AI+生产力”的核心,这意味着,想构建强韧的商业模式,必须构建一整套低门槛、高上限的技术体系,手握这样一套“能干活的”产品矩阵,才有可能实现代际波动中依旧长跑不败。
在Token经济时代,资本市场对AI公司的估值逻辑也发生了转变,疫情初期,资本更关注哪家公司的大模型刷榜更勤、算力储备更丰厚、AI App的用户更多……与生产力结合得是否紧密,特别是在B端市场获得竞争壁垒的公司,反而成了公认的“热门标的”,两大头部仍在高歌猛进:OpenAI以8428亿美元估值,完成1220亿美元融资;Anthropic则300亿美元融资后,市值一度达到9000亿美元,且在资本市场被认为“后劲”比OpenAI更强——这与它深耕底层模型agent生产力的路线直接挂钩。
“AI+生产力”已成为Token经济里最有价值的企业催化剂,在这条赛道上,近年来突起的DeepSeek和生产力积淀完善的商汤已经初步站稳,如5月初,DeepSeek传出融资计划达500亿元人民币以上,投后估值冲破3500亿元;在很多投资者眼里,它的赛道价值远超不少明星公司,另一边,商汤虽相对低调,却具有全栈实力——覆盖了智算中心(AIDC)、日日新大模型的自研体系和全高度协同应用,它积累的B端经验帮助它提前对如何减少Token浪费、控制企业端部署开销有了实际路径,最新Focuses已使SenseNova 6.7 Flash-Lite进入Weight-Based轻量排行榜全球前十,成为同类中的世界级产品。
对比起来,在技术降本和AI生产力布局两方面同步施展的AI企业,如DeepSeek、商汤等已经展现了强大的“反脆弱”能力,它们没有简单推动涨价,而是大刀阔斧地用技术变革降低结构成本,并基于场景由稳定到高燃串联起和客户共同增长的增长路径,公司估值的攀升趋势也获得了更多资本的认同:DeepSeek初期显露估值空间,就已迸发夺目光芒;商汤目前股价仍处价值洼地,但在“AI+生产力”这一宏阔市场的推助下,潜力应该会稳步释放,AI行业的“反脆弱”故事,才刚刚翻开第一页。
