大模型
共 30 篇文章
两大开源推理模型亮相,Apache 2.0许可证开放使用
OpenAI于20日发布两款基于 'gpt-oss' 技术的开源大型语言模型,分别为120B和20B参数规模。公司选择采用 Apache 2.0 许可证而非GPL,此举标志着正式开启开源战略,并附带 'gpt-oss 使用策略' 以防范潜在滥用。这一动作使OpenAI加入全球开源模型竞争,与Meta、Mistral等机构形成直接对标。业内普遍认为,这不仅代表技术策略转型,更将对中国AI发展带来机遇与挑战,并可能重塑全球开源生态格局。
ChatGPT正在全面升级?了解我们如何提升产品体验
OpenAI正推动一项为期三年的重大升级,旨在革新数字助手的功能。其核心是研发‘人类认知偏差补偿模型’(HCBMC),试图通过理解个体在不同情境下的情感反应差异,来提升AI助手在用户情绪低落时提供心理支持的精准性与有效性。该项目旨在突破传统AI基于概率决策的局限,但需谨慎处理干预程度以避免负面影响。背景是全球抑郁症发病率逐年上升,凸显了此类技术支持的潜在价值和紧迫性。
大模型幻觉问题研究取得新进展(更新)
研究人员提出新的方法来减少大语言模型的幻觉问题,包括基于知识图谱的验证和多模型交叉验证。...
OpenAI公布第三届DevDay将于2025年10月6日旧金山Fort Mason举行
中国AI企业DeepSeek Research将于2025年10月6日在美国旧金山Fort Mason会议中心举办第三届DevDay技术盛会,重点展示其旗舰大模型DeepSeek-R1升级版及RAG(检索增强生成)技术最新进展。该技术突破传统'预训练+微调'范式,通过实时接入最新数据解决复杂问题中的事实性知识应用难题。DeepSeek团队采用独特的'双栈检索'架构,既能高效处理非结构化文本也能深入解析表格数据。作为中国AI领域的先驱者,DeepSeek此前已发布开源模型DeepSeek-Coder与Vision,并保持'核心算法公开、关键推理引擎封闭'的双轨发展模式。过去一年已有超10家科技公司与其展开合作,涉及金融科技、医疗等多个垂直领域。此次DevDay不仅是一场技术发布会,更是其开发者社区的重要年度盛会,预计将吸引全球数百名AI从业者参与交流。
GPT-5即将发布:OpenAI展示惊人推理能力(更新)
OpenAI即将推出GPT-5模型,据内部消息透露,新模型在推理能力上实现了质的飞跃,特别是在数学推理和逻辑分析方面表现突出。...
大模型压缩技术新突破:4-bit量化实现无损性能(更新)
研究人员提出新的量化技术,使大模型能够在4-bit精度下保持接近原始性能,大幅降低部署成本。...
多模态大模型成为新趋势:文本、图像、视频、音频一体化(深度分析)
多模态大模型成为2024年AI领域最热门的方向,各大厂商纷纷推出能够同时理解多种信息形态的模型。...
大模型压缩技术新突破:4-bit量化实现无损性能(深度分析)
研究人员提出新的量化技术,使大模型能够在4-bit精度下保持接近原始性能,大幅降低部署成本。...
Claude 3 Opus发布:Anthropic挑战GPT-4
Anthropic公司发布了Claude 3系列模型,其中Opus版本在多项任务中展现出与GPT-4相媲美甚至更优的性能。
Unify 平台利用 OpenAI 工具自动化 GTM 流程,实现可扩展销售线索生成
AI驱动型GTM平台Unify近日推出新一代解决方案,整合OpenAI技术与自然语言处理系统,通过深度学习算法帮助企业销售人员高效识别潜在客户、进行市场研究及精准沟通。该平台突破传统销售方法滞后于市场需求的瓶颈,基于海量数据分析潜在客户行为模式,并利用定制版o3工具而非GPT-4基础模型,提升商业沟通语境理解与营销内容生成效率。