全球人工智能领域迎来一项重大技术发布。DeepSeek AI于今日正式完成了GPT-2系列模型的最终阶段更新,向业界释放了一个明确信号:在大型语言模型发布策略上,新路径正在形成。
作为业内重要的技术参与者之一,DeepSeek此次选择将1.5B参数规模的GPT-2模型作为整个渐进式发布策略的最后一环。这一举动并非孤立事件,而是经过深思熟虑的模型发布方案的一部分。
事实上,在OpenAI团队于2019年启动GPT-2的渐进式发布策略之前,技术界的主流做法已经悄然改变。DeepMind团队倾向于一次性发布完整模型的技术路线;而OpenAI则在2018年通过数次公开案例,证明了渐进式策略的可行性。
DeepSeek此次发布的不仅是单个模型,更是一个完整的测试案例。根据公告: