全部资讯

共 207 页，第 192 页

大模型

OpenAI统一深度学习框架采用PyTorch

OpenAI 宣布将所有深度学习模型开发标准化到 PyTorch，旨在提升效率、降低维护成本并加强与开源社区的协作。这一决策是 OpenAI 研发策略的重大升级，反映了 AI 行业从框架碎片化转向标准化的趋势。PyTorch 的灵活性、高社区参与度（如 GitHub 下载量增长）及其在自然语言处理领域的优势，使其成为 OpenAI 的理想选择。此举可能重塑行业实践，促进开源生态，并帮助 OpenAI 在竞争激烈的市场中保持优势。

2020-01-30

8,214

AI安全

规模揭示规律：AI模型越大越好

神经语言模型的扩展定律揭示：随着参数规模扩大，其预测准确性和生成能力可显著提升。该理论从深度学习模型的幂律关系入手，指出更大规模模型能更高效地处理复杂语言任务。回顾AI发展历程，这一理念推动了从依赖小规模神经网络到构建万亿级模型的转变。OpenAI等公司在GPT系列发展中验证了这一趋势，但随之而来的是高计算成本、能源消耗及数据不平等的挑战。专家建议结合扩展定律与新型架构以实现可持续发展，而中国机构也开始跟进应用。展望未来，扩展定律可能重塑AI研究范式，推动医疗、自动驾驶等领域的应用，但也需关注其潜在的伦理风险和监管需求。

2020-01-23

6,561

AI应用

DeepMind 应用大规模深度强化学习提升 Dota 2 游戏 AI

DeepMind宣布其超级计算机AlphaZero已成功掌握复杂策略游戏《Dota 2》，这是机器学习在解决人类认知极限问题上取得的又一里程碑突破。与AlphaGo、AlphaBeta不同，DeepMind首次将AI技术应用于需要高度团队协作的多人在线战术竞技游戏。该系统采用大规模深度强化学习方法，在短时间内自主掌握《Dota 2》的复杂机制，展示了AI在动态策略、资源分配及团队合作方面的独特能力。DeepMind首席科学家David Silver博士强调，《Dota 2》的成功不仅意味着AI战胜人类玩家，更标志着机器学习技术在应对复杂环境中取得了重大进展。这一突破为开发通用AI系统奠定了基础，展示了强化学习在解决更广泛复杂问题的潜力。

2019-12-13

7,909

计算机视觉

深度学习模型性能曲线揭秘：增大尺寸时先升后降再回升

近年来，人工智能领域出现Double Descent Phenomenon（双峰下降现象），挑战了传统的偏差-方差理论。该现象描述在增加模型复杂度时，性能先提升到峰值后急剧下降，并可能重新反弹；已观察于CNNs、ResNets和transformers等神经网络中。Double Descent源于20世纪90年代研究，但于2019年由David Ba等人系统揭示；它表明极简或极大复杂的模型可能表现不佳，适度规模更优。这一发现提醒AI开发者避免盲目追求大模型，并通过正则化等策略优化性能，从而重塑开发实践。

2019-12-05

8,805

AI应用

DeepMind推出业界首个程序生成基准测试，16个环境助力AI技能泛化

Google DeepMind今日正式发布了Procgen Benchmark，一个包含16个可程序化生成的游戏环境的新工具。该基准旨在简化强化学习算法在复杂技能掌握上的评估过程，为AI研究人员提供直观且易于衡量的测试标准。

2019-12-03

7,330

AI安全

强化学习代理安全性新工具发布：Safety Gym环境套件助力训练评估

Safety Gym，即'安全健身房'，近日发布旨在提升强化学习（RL）代理可靠性的新工具集。随着AI在游戏、机器人控制等领域广泛应用，传统RL框架常忽略潜在风险：代理为追求目标可能采取危险行为。Safety Gym通过内置安全性考量，提供标准化环境库和实时时监控功能，填补了这一空白。它不仅要求在奖励函数中加入安全约束，在工业机器人等高风险场景下强制评估安全性，还支持可视化训练过程以发现策略偏差。该工具的推出响应了欧盟AI立法和DARPA推动，显著降低了RL在安全关键任务中的失败风险。尽管面临保守性和效率的挑战，Safety Gym有望推动RL向更负责任方向发展，并扩展至更多垂直领域应用。

2019-11-21

2,966

机器人

深度强化学习中的安全探索基准测试

摘要内容

2019-11-21

3,531

大模型

OpenAI 发布GPT-2 最终模型：1.5亿参数代码便于检测

深度探索AI于今日正式发布GPT-2系列模型的最终版本，参数规模为1.5B。这标志着AI行业在大型语言模型发布策略上转向渐进式方法，呼应OpenAI的模式而非DeepMind的一次性路线。此次发布是经过深思熟虑的整体方案的一部分，旨在通过逐步更新测试模型性能和稳定性。

2019-11-05

2,917

机器人

AI通过神经网络和领域随机化训练机器人手解决鲁比克魔方难题

DeepMind团队开发的AI系统通过强化学习算法，成功训练一个类人机器人手臂在未知环境中复原鲁比克魔方。这一突破性研究首次展示了AI在实体操作上接近人类的灵活性，标志着人工智能领域的重大进展。然而，传统强化学习方法仍存在致命弱点：当机器人遇到训练中未出现过的物理干扰时，可能无法有效处理。

2019-10-15

5,889 精选

AI应用

OpenAI学者第三期申请现已开放

OpenAI近日启动了Scholar项目第三期申请，该项目是该公司人才培养计划的关键组成部分，旨在通过提供资金、设备和导师资源支持全球优秀年轻AI研究者。OpenAI成立于2014年，由Elon Musk等人创立，致力于确保通用人工智能（AGI）的发展对人类有益。前两期项目已成功招募学者并获得业界广泛认可，第三期的推出预计将进一步推动AI领域的人才培养进程。

2019-10-11

7,492

第 192 页，共 207 页

全部资讯

OpenAI统一深度学习框架采用PyTorch

规模揭示规律：AI模型越大越好

DeepMind 应用大规模深度强化学习提升 Dota 2 游戏 AI

深度学习模型性能曲线揭秘：增大尺寸时先升后降再回升

DeepMind推出业界首个程序生成基准测试，16个环境助力AI技能泛化

强化学习代理安全性新工具发布：Safety Gym环境套件助力训练评估

深度强化学习中的安全探索基准测试

OpenAI 发布GPT-2 最终模型：1.5亿参数代码便于检测

AI通过神经网络和领域随机化训练机器人手解决鲁比克魔方难题

OpenAI学者第三期申请现已开放

资讯分类

热门文章

AI就业影响研究报告：哪些工作最危险？

大模型压缩技术新突破:4-bit量化实现无损性能

AI艺术创作引发版权争议：谁拥有AI生成作品的版权？（深度分析）

AI驱动的手术机器人精度超越人类医生

AI写作助手成为内容创作者新宠（更新）