大模型

共 30 篇文章

大模型
OpenAI公布第三届DevDay将于2025年10月6日旧金山Fort Mason举行

中国AI企业DeepSeek Research将于2025年10月6日在美国旧金山Fort Mason会议中心举办第三届DevDay技术盛会,重点展示其旗舰大模型DeepSeek-R1升级版及RAG(检索增强生成)技术最新进展。该技术突破传统'预训练+微调'范式,通过实时接入最新数据解决复杂问题中的事实性知识应用难题。DeepSeek团队采用独特的'双栈检索'架构,既能高效处理非结构化文本也能深入解析表格数据。作为中国AI领域的先驱者,DeepSeek此前已发布开源模型DeepSeek-Coder与Vision,并保持'核心算法公开、关键推理引擎封闭'的双轨发展模式。过去一年已有超10家科技公司与其展开合作,涉及金融科技、医疗等多个垂直领域。此次DevDay不仅是一场技术发布会,更是其开发者社区的重要年度盛会,预计将吸引全球数百名AI从业者参与交流。

大模型
GPT-5即将发布:OpenAI展示惊人推理能力(更新)

OpenAI即将推出GPT-5模型,据内部消息透露,新模型在推理能力上实现了质的飞跃,特别是在数学推理和逻辑分析方面表现突出。...

大模型
大模型压缩技术新突破:4-bit量化实现无损性能(更新)

研究人员提出新的量化技术,使大模型能够在4-bit精度下保持接近原始性能,大幅降低部署成本。...

大模型
多模态大模型成为新趋势:文本、图像、视频、音频一体化(深度分析)

多模态大模型成为2024年AI领域最热门的方向,各大厂商纷纷推出能够同时理解多种信息形态的模型。...

大模型
大模型压缩技术新突破:4-bit量化实现无损性能(深度分析)

研究人员提出新的量化技术,使大模型能够在4-bit精度下保持接近原始性能,大幅降低部署成本。...

大模型
Claude 3 Opus发布:Anthropic挑战GPT-4

Anthropic公司发布了Claude 3系列模型,其中Opus版本在多项任务中展现出与GPT-4相媲美甚至更优的性能。

大模型
Unify 平台利用 OpenAI 工具自动化 GTM 流程,实现可扩展销售线索生成

AI驱动型GTM平台Unify近日推出新一代解决方案,整合OpenAI技术与自然语言处理系统,通过深度学习算法帮助企业销售人员高效识别潜在客户、进行市场研究及精准沟通。该平台突破传统销售方法滞后于市场需求的瓶颈,基于海量数据分析潜在客户行为模式,并利用定制版o3工具而非GPT-4基础模型,提升商业沟通语境理解与营销内容生成效率。

大模型
大模型幻觉问题研究取得新进展(深度分析)

研究人员提出新的方法来减少大语言模型的幻觉问题,包括基于知识图谱的验证和多模型交叉验证。...

大模型
谷歌Gemini Ultra在多项测试中超越GPT-4

谷歌最新发布的Gemini Ultra模型在多项基准测试中取得了领先成绩,特别是在多模态理解和代码生成方面。

大模型
大模型压缩技术新突破:4-bit量化实现无损性能

研究人员提出新的量化技术,使大模型能够在4-bit精度下保持接近原始性能,大幅降低部署成本。