今年年初,硅谷掀起了一股被称为“Tokenmaxxing”的热潮,这个词形象地描述了企业疯狂消耗AI计算资源的现象。许多科技公司的CEO们纷纷鼓励员工尽可能多地使用AI工具,甚至将AI的利用率推向极限。然而,这股热潮在短短几个月后便遭遇了现实的沉重打击——高昂的账单如潮水般涌来,让不少公司措手不及。
据行业内部消息,Uber(优步)在短短几个月内就耗尽了全年的AI预算,这一消息在硅谷引起了广泛关注。Uber作为全球领先的出行平台,其AI技术广泛应用于路线优化、自动驾驶研究和客户服务等领域。然而,过度依赖AI和盲目扩张算力使用,导致其成本迅速失控。类似的情况并非孤例。一些公司不得不削减对Claude(一款由Anthropic公司开发的AI助手)的企业许可,部分部门的订阅被直接取消,甚至Meta(脸书母公司)也悄悄叫停了内部公布的AI使用排行榜。
这股“Tokenmaxxing”风潮的背后,反映了硅谷在AI投资上的狂热与泡沫。2023年以来,随着ChatGPT等生成式AI的爆发,企业纷纷押注AI技术,认为这将是下一个增长引擎。CEO们期望通过大规模部署AI来提升生产力、降低成本,甚至实现业务转型。现实却远没有想象中那么美好:AI模型的运行需要消耗大量的计算资源,而这些资源并非无偿的。每调用一次大型语言模型,背后都是真金白银的支出。
数据显示,训练和运行一个大型AI模型所需的计算成本正在急剧上升。以GPT-4为例,其单次训练成本就高达数亿美元,而日常推理成本更是以指数级增长。对于企业来说,一旦AI使用量超出预期,预算就会迅速被掏空。Uber的案例就是一个典型的教训:这家公司原本计划将AI用于优化核心业务,但由于缺乏有效的成本控制,最终导致预算超支数倍。
这种“疯狂烧钱”的模式并不可持续。行业分析师指出,企业在拥抱AI的同时,必须重新审视其成本结构。硅谷的风险投资机构开始提醒被投企业,要谨慎评估AI项目的投入产出比。一位不愿具名的投资人表示:“我们不能简单地认为AI是万能药。企业需要制定明确的预算上限,并建立成本监控机制,否则就会像Uber那样陷入财务困境。”
Meta叫停内部AI排行榜的决定,同样折射出企业心态的变化。此前,Meta内部曾设立一个排行榜,鼓励员工比拼各自团队使用AI的频率和效果。这种做法一度被视为激励创新的有效手段,但也助长了无谓的资源浪费。员工为了在排行榜上获得更高的排名,往往会刻意增加AI的调用量,而不管这些调用是否真正对业务有帮助。Meta最终意识到,这种内卷式的竞争只会推高成本,并不会带来实质性的收益提升。
在AI布道者眼中,Tokenmaxxing本来是一种“积极探索”的象征。理论上,AI的使用上限几乎是无限的,只要能带来哪怕微小的效率提升,就值得投入。然而,这种逻辑忽略了经济学的基本原则:资源的稀缺性和边际效益递减。当AI的滥用达到一定程度时,其带来的附加价值远不及消耗的成本。
这一趋势也引发了更深层次的思考:AI是否会成为企业的新“成本黑洞”?类似的历史曾在上世纪90年代末的互联网泡沫中上演。那时,企业一窝蜂地建网站、烧钱做广告,最终却导致大批公司破产。如今,AI领域的投资热潮似乎正在重蹈覆辙。不同的是,AI的技术迭代速度更快,投资额也更大,一旦泡沫破裂,后果可能更加严重。
从行业角度来看,AI的长期价值毋庸置疑,但企业需要找到更聪明的使用方式。一些领先的公司已经开始探索“成本意识化”的AI策略。例如,通过优化模型架构来降低推理成本,或者采用混合架构,将部分任务从昂贵的云端模型迁移到本地或边缘设备进行处理。此外,一些公司正在开发专门的“轻量级AI”,专门处理简单、高频的任务,而将复杂任务留给高性能模型。
还有企业家建议,企业应该建立多层次的AI使用权限。比如,对高价值任务开放顶级模型,而对常规任务则使用更便宜的替代方案。这种“分级管理”的策略,有助于在保持AI效率的同时控制成本。毕竟,并不是每一个查询都需要调用GPT-4这样的大模型;许多场景下,更小、更便宜的模型也能胜任。
回到Uber的案例,这家公司并非没有意识到成本问题。其内部曾考虑过采用自研AI模型来降低成本,但短期的“Tokenmaxxing”热潮让团队迷失了方向。最终,Uber被迫重新调整策略,收紧AI的使用权限,并引入预算限额。这一调整虽然短期内影响了部分业务线的效率,但从长期看,却避免了更大的财务风险。
Meta的战略调整则更为彻底。除了停止排行榜,该公司还在内部推广“成本透明化”文化,要求每个AI请求都附带成本标签。员工在使用AI时,会像打车一样看到“预估费用”,从而自然形成节约意识。这种做法的效果已经初步显现:Meta的AI相关支出在最近一个季度开始趋于平稳。
行业观察人士认为,Tokenmaxxing的退潮可能是一个积极的信号。它意味着AI行业正在从盲目扩张走向理性成熟。企业不再仅仅关注“能否用AI”,而是开始思考“如何用得更好”。这种思维的转变,将推动AI技术向更可持续的方向发展。
可以肯定的是,AI不会因为成本问题而停止进步。相反,成本压力往往会催生技术创新。历史上的许多突破,都是在资源有限的背景下被倒逼出来的。在未来,我们很可能看到更多专注于效率优化的AI技术出现,比如更高效的训练算法、更低成本的硬件,以及更智能的计算调度系统。
总而言之,Tokenmaxxing的热潮已经落幕,但它为整个科技行业敲响了警钟:技术进步不能脱离经济规律。无论是大公司还是初创企业,在拥抱AI的同时,都必须学会算好“成本账”。只有这样,AI才能真正成为推动增长的可持续动力,而非一个来去匆匆的泡沫。