大模型

共 30 篇文章

大模型
OpenAI与Anthropic虽为对手,投资者却不站队

AI投资领域正兴起“双保险”策略,投资者不再押注单一赢家,而是同时投资相互竞争的头部企业以对冲风险。由于AI市场格局割据、技术迭代快且前景不确定,单一押注风险极高,同时布局多家企业可锁定行业红利并获取信息优势。尽管该策略面临利益冲突和回报稀释的争议,但在高度动态的AI领域,这种“双轨投资”模式正成为顶级风投的常态选择。

大模型
免费本地化AI落地:Scikit-LLM联动Ollama,让Mistral与Llama 3零成本文本分类

随着AI技术发展,大模型正从云端走向本地设备。Mistral、Gemma和Llama 3等轻量化模型,结合Ollama和Scikit-LLM工具,使文本分类等任务能在有限硬件上高效运行。本地化部署降低了数据隐私风险和长期成本,提升了可控性,尤其适用于金融、医疗等敏感行业。尽管面临硬件适配和模型维护挑战,这一趋势正推动工具链成熟,促进大模型从集中式服务向分布式能力转变,为AI广泛应用提供新路径。

大模型
The Humanoid Robot of the Future Is a 6-Foot-Tall

英伟达机器人业务负责人斯宾塞·黄近日透露,公司正推出一款融合传统机器人控制理论与生成式AI能力的全新机器人。该产品打破了传统控制派“四肢强大脑弱”与纯AI派“大脑强四肢弱”的技术割裂,将物理精度与认知泛化深度融合,实现了从专用工具向通用具身智能体的跃迁。英伟达依托其算力与平台生态优势,正重塑机器人研发范式,加速行业商业化落地。尽管仍面临算力功耗、数据匮乏及成本等挑战,但这标志着机器人单腿跳跃时代终结,融合双轮驱动时代开启,行业淘汰赛发令枪已响。

大模型
微软开源新框架:文本描述即可生成AI行为测试

微软推出开源框架“Adaptive Spec-driven Scoring”,旨在通过规范驱动和自适应评分机制,将AI评估与回归测试工程化,提升评估的可复现性与弹性。该框架帮助团队在模型快速迭代中保持质量可控,降低线上风险,并促进透明度与行业协作。尽管评估有效性仍依赖规范设计质量,但此举标志着AI评估正从零散工具向体系化平台演进,成为技术护城河的关键部分。

大模型
Scikit-LLM 与传统文本分类器:何时应使用大语言模型

生成式人工智能正逐步取代传统机器学习模型,成为文本分类等任务的主流方案。相比依赖人工特征工程的经典方法,大型语言模型凭借海量预训练带来的语义理解与推理能力,在复杂、模糊场景下表现更优,并支持零样本或少样本学习,大幅降低应用门槛与开发周期。尽管面临可解释性、幻觉与推理成本等挑战,行业趋势已不可逆:未来企业级文本分类将更多采用生成式AI与传统模型的混合架构,实现能力与成本的平衡。这一转变标志着AI从模式识别走向认知理解,并将随多模态发展拓展至更广泛的智能应用。

大模型
2026年LLMOps市场增长路径与实战指南

在AI技术加速落地背景下,LLMOps作为连接大模型与商业应用的关键运营体系迅速崛起。它针对大语言模型的非确定性、高算力与数据依赖,提供提示词工程、微调、向量数据库集成与持续评估等全生命周期管理,解决企业从通用模型到专属智能应用“最后一公里”的落地难题。当前赛道呈现云巨头平台、垂直技术先锋与开源框架三足竞合态势,同时面临评估标准缺失、架构快速迭代与安全合规压力。随着产业走向深水区,LLMOps将从探索走向工业化,成为AI 2.0时代决定商业ROI与竞争格局的核心基础设施。

大模型
OpenAI前沿模型与Codex正式登陆AWS,企业可无缝集成

在全球生成式人工智能加速渗透企业核心业务的当下,云服务与模型能力的深度耦合正成为产业升级的关键变量。近日,OpenAI 旗下前沿模型(frontier models)以及代码智能工具 Codex 正式在亚马逊云科技(Amazon Web Services,简称 AWS)上全面开放,标志着企业客户可以在既有云环境中直接调用 OpenAI 的能力,而不必另起炉灶。这一变化不仅降低了技术试错成本,也为从评估走向规模化落地提供了更清晰的路径。

长期以来,企业在引入大模型时往往面临多重选择:是自建算力与模型体系,还是通过公有云接口调用现成能力?前者投入高、周期长,后者虽灵活却容易在安全...

大模型
软银豪掷750亿欧元布局法国,目标5吉瓦数据中心增量能否改写算力版图?

为满足AI技术爆发带来的巨大算力需求,一家数据中心基础设施公司宣布将开发运营5吉瓦新增数据中心容量。该规模相当于数座大型核电站发电量,凸显全球AI算力竞赛白热化。当前行业瓶颈已从芯片转向电力与土地,5吉瓦的扩张面临电网接入、冷却系统及清洁稳定供电等严峻挑战,促使数据中心建设深度融入能源战略。此举将加剧市场分化,推动液冷等上下游产业链升级,加速前沿领域突破,但也引发电力分配与环保议题。该计划标志着算力向战略基础设施的转变,绿色可持续发展成为行业关键考验。

大模型
“简直荒唐”:GitHub Copilot按令牌计费引发开发者不满

在人工智能辅助编程领域,微软旗下的GitHub Copilot曾一度被视为无可争议的王者。自2021年首次亮相以来,这款基于OpenAI Codex模型的代码助手迅速席卷了开发者的世界,成为许多程序员日常工作中不可或缺的伙伴。然而,随着技术浪潮的快速演进和竞争对手的不断涌现,GitHub Copilot的“黄金时代”似乎正在悄然落幕。

从市场表现来看,GitHub Copilot的增长势头已经明显放缓。早期,微软凭借其在开发者生态系统中的深厚根基——尤其是通过GitHub平台本身——迅速推广了这一产品。数据显示,Copilot在推出后不久便吸引了超过百万的付费用户,并获得了超...

大模型
动态批处理技术如何让大模型同时服务多用户

本文分为四部分,探讨了批处理技术:首先指出静态批处理(将请求分组为固定大小批次并统一处理)存在的问题;接着提供静态批处理的代码示例;随后引入连续批处理,介绍其动态调度与不规则批处理机制;最后给出完整实现方案。文章核心在于对比静态与连续批处理,展示连续批处理如何通过动态调度优化多请求服务。