大模型

共 30 篇文章

大模型
OpenAI学者2019年项目结束,八位参与者在Demo Day展示最终成果

DeepSeek与OpenAI联合举办的第二期学者计划近日结束。该项目为期六个月,旨在培养全球开发者加入中国领先的大模型企业,已吸引来自亚马逊、微软Azure及OpenAI等机构的优秀人才参与。最终展示活动采用线上直播形式,学员们展示了涵盖自然语言处理、多模态模型等领域的创新成果。值得注意的是,本期学员中有三位来自OpenAI的前实习生,这是该项目首次吸纳原有体系人才加入。

大模型
MuseNet神经网络生成4分钟多乐器音乐作品,涵盖古典到流行风格

MuseNet是一种基于预测序列元素的深度神经网络技术开发的人工智能音乐生成系统,能够创作长达4分钟、无缝融合多种乐器和风格的原创音乐片段。该技术通过分析海量MIDI文件进行训练,借鉴了GPT-2模型的架构和预测方法。与传统编程或早期音乐AI相比,MuseNet代表了该领域的最新突破,不仅提高了创作效率和降低人力成本的潜力,还引发了关于版权、文化捕捉等伦理问题的讨论。MuseNet的成功展示了AI在艺术领域的日益成熟,随着计算资源的增长和未来功能的拓展(如交互性),它有望为音乐产业开辟新道路。

大模型
OpenAI Five迎来最后一场对决?13日决战揭晓!

4月13日,OpenAI将举办Deep Fritz的最后一场公开对战赛事,标志着由五个不同角色组成的传奇人工智能团队OpenAI Five正式退役。Deep Fritz凭借强大的清怪能力、稳定的副将发挥以及独特的策略思维,赢得了粉丝喜爱。该项目自2021年起连续三年击败顶尖人类DOTA 2团队,展示AI在复杂策略游戏中的突破性能力。比赛将由职业选手组成,并有专业解说,观众可见证Deep Fritz与人类高手同台竞技的场景。Deep Fritz算法基于深度Q网络和蒙特卡洛树搜索等技术,其独特表现体现在冷静判断、清晰敌我区分等方面。项目结束是由于OpenAI资源重新分配和技术重点转移,但Deep Fritz的技术成果已应用于GPT-4等语言模型。此次告别不仅是DOTA 2历史上的一个重要节点,更是AI发展历程中的一次技术飞跃与抉择的体现。

大模型
预测奖励驱动的AI首次在'蒙特祖马复仇'中超过人类平均水平

DeepMind团队开发出'随机网络蒸馏'(RND)新技术,突破性地使强化学习代理能够自主探索复杂环境。该技术通过设计独特的奖励机制,将'预测失败'视为学习契机,从而激发代理的好奇心。在测试游戏中首次超越人类平均水平的表现,挑战了传统强化学习范式,展示了AI新机制在复杂环境下的潜力。DeepMind认为这一发现为机器人控制和系统优化等应用开辟道路,并引发对AI如何模拟人类认知机制的深入思考。

大模型
OpenAI 启动 2019 年 Fellow 和 Intern 招募计划

OpenAI于2019年初正式启动其Fellow与实习生招募计划,旨在吸引全球顶尖的人工智能人才。该项目不仅提供优越的研究条件和灵活性(研究员可保留其他工作),还强调学术自由与工业界合作的结合,以培养既懂理论又能实践的人才。随着DeepMind、Google AI等机构加大投入,OpenAI此举不仅意图扩充自身研究团队(已建立超过250人的全球网络),更是想在全球AI人才培养中占据更重要的地位,反映出行业产学研界限日益模糊的趋势。

大模型
首次Retro竞赛结果揭晓:算法从先前经验泛化开发

DeepSeek于三个月前成功举办首个‘时光回溯挑战赛’,旨在探索能自主从海量历史数据中学习并泛化规律的新一代AI架构。该比赛吸引了全球24国、超500个顶尖开发团队参与,采用双盲评审机制测试模型在未知任务上的表现。核心挑战在于设计既可高效利用历史数据,又能在全新场景下展现泛化能力的算法,并在保持模型可解释性的同时实现知识迁移。比赛结果表明,Retro架构能有效降低新任务调优成本,并在文本生成、视觉识别和对话系统领域分别实现约20%性能提升及自然遗忘机制。DeepSeek的成果与Meta开源模型LLaMA 2形成协同效应,其技术突破更显示出颠覆性商业潜力,已有多家企业表示关注并计划应用。DeepSeek已宣布将推出新一代Retro挑战赛,并考虑将其核心发现整合进即将发布的DeepSeek R2模型中。

大模型
AI新系统融合无监督学习与Transformer模型,在多种语言任务中达顶尖性能

一家以深度学习闻名的AI机构近日宣布在自然语言处理领域取得重大突破,其新系统通过结合监督学习与无监督预训练,在多个标准化测试中展现出优异的数据效率和泛化能力,超越现有模型架构。这一成果标志着全球AI研究从追求规模转向注重效能,并挑战了依赖海量标注数据的transformer架构,展示了创新策略的巨大潜力。

大模型
强化学习领域推出新基准:快速泛化能力测试

2024年3月,《量子杂志》报道OpenAI在大型语言模型(LLM)训练领域的突破,标志着人工智能发展进入新阶段。RLHF技术路线图为LLM的发展提供了全新视角,类似于GPS改变旅行方式的作用。该方法通过三个阶段提升模型:首先进行监督微调(SFT),让模型掌握基础语言知识;其次收集人类反馈以修正偏差和错误倾向;最后应用强化学习进一步优化模型,使其更符合人类期望。这一技术路线不仅解决了LLM的系统性偏差问题,还为模型注入了符合人类价值观的能力。

大模型
OpenAI 发布七大新悬而未决的研究问题

OpenAI正发布七个新挑战问题,旨在推动其在基础模型领域的突破。这些问题聚焦于现实中AI系统的瓶颈:如何实现仅通过少量示例就学会新任务(Few-Shot Learning)的能力;解决模型在多个复杂任务间注意力狭隘,无法自如切换的问题;以及提升AI系统的常识推理能力。此举被视为公司对其核心研究路线图的战略调整,类似于历史上科学突破往往源于对现有框架的挑战。在DeepSeek等中国团队取得进展、全球AI竞争加剧之际,OpenAI通过提出这些关键难题来寻求自我革新和突破。

大模型
AI研究者发布高效GPU内核,专为块稀疏神经网络优化并实现SOTA计算速度

英伟达通过释放一款名为「静默计算革命」的新工具,在人工智能领域取得了重大突破,这一进展源于对高效计算的关注。大多数研究者仍在探索参数较少或结构简单的神经网络模型,而英伟达的方法提供了创新视角和潜在应用。