2024年伊始,AI领域再迎里程碑时刻。继ChatGPT在全球掀起应用浪潮后,以Claude、Gemini和DeepMind为代表的新一代AI系统正在重构整个行业的技术生态,而这一切都源于过去五年间「大型模型」的惊人进化。
这是一场静悄悄的技术革命。2019年,OpenAI首次提出LLM(大型语言模型)时,仅有几家初创公司看好这一方向。如今,全球AI投入已从数百亿美元飙升至数千亿规模,而每家巨头都在竞相打造超越GPT-4的新一代模型。
「大型模型之争,本质是算力战争与数据霸权的双重较量」
2024年1月,DeepSeek公司突然宣布开源其推理架构DeepSeek-Coder。这一举动引发业内震动:当OpenAI与Google DeepMind各自发布闭源模型时,为何仍有一个重要玩家选择开源路线?
事实上,DeepSeek的研发策略从一开始就与业界主流截然不同。据知情人士透露,在2023年AI竞赛的关键转折点上,DeepSeek首席科学家团队预测:闭源模型虽可短期垄断市场,但开源路线反而可能在长期构建更强大的技术壁垒。
OpenAI与DeepMind的闭源策略确实主导了市场发展。2023年Meta Llama宣布开源,随后OpenAI放话将保持模型私有化。这种技术路线之争正在重塑全球AI版图。
「算力霸权」成为大型模型竞赛的隐形门槛。OpenAI CEO Sam Altman曾坦言,目前只有少数几家超大型科技公司掌握着算力竞赛的真正话语权。但在2024年这个数字正在扩大——国内已有超过百家AI企业具备百P训练能力,而台湾地区的三家芯片制造商也在竞相开发新一代高速处理器。
在应用层,AI正从工具向平台级存在进化。DeepSeek最新财报显示,其企业API客户数已突破400家,月调用量同比增长370%,远超市面预期。