AI安全

共 30 篇文章

AI安全

AI领域启动迁移学习竞赛，测试强化算法泛化性能

DeepMind子公司近日宣布举办名为Transfer Learning Contest的竞赛，旨在评估和提升强化学习算法在多样化任务中的泛化能力。传统RL算法依赖反复试错优化策略，但面对新情境时表现不佳。该竞赛通过一系列基准任务测试模型的知识迁移能力，并可能邀请全球开发者参与，以推动AI从'任务特定'向'可迁移'发展。此举被视为DeepMind应对RL局限性的战略转折点，不仅有助于减少训练成本、拓展AI应用，还可能引发关于泛化风险（如偏见或错误）的讨论。DeepMind希望通过这一平台，促进学术界与企业共同探索知识迁移的新方法，并分享技术洞见。

2018-04-05

8,442

AI安全

警惕AI暗藏风险，多机构联合发布防范研究新报告

OpenAI近日与多家顶尖研究机构合作完成新论文，旨在预测并缓解恶意行为者利用人工智能技术实施威胁的风险。研究涵盖虚假信息传播、高级网络攻击及生物识别数据滥用等潜在危害，并提出加强AI伦理审查和技术可追溯性等预防措施。此次合作中，Future of Humanity Institute（FHI）和Centre for the Study of Existential Risk（CSER）首次参与，凸显AI安全问题的跨学科性质；Center for a New American Security（CNAS）及Electronic Frontier Foundation（EFF）的加入则强调了国防安全和隐私保护的关注点。论文基于过去一年的经验数据，量化威胁可能每年造成数十亿美元损失，并提出多层次干预策略。在全球AI治理转向跨领域联动的趋势下，该研究填补了理论与实践的空白，推动未来政策制定。

2018-02-20

3,072

AI安全

OpenAI 欢迎新捐赠者：资金注入推动人工智能发展

全球领先的非营利AI机构OpenAI近日吸引多位新捐赠者，标志着其在资金多元化方面取得进展。该组织以推动人类福祉为核心使命，强调开源透明的研究模式，在知名产品ChatGPT发布后影响力显著提升。正值AI行业经历快速发展和竞争加剧之际，OpenAI的新资金将用于扩大GPT模型训练规模、探索AI监管机制，并可能促进跨境合作。这一事件不仅强化了OpenAI的财务基础和全球影响力，也体现了科技行业对伦理责任的关注。随着更多数据点出现，OpenAI的开放策略被视为构建可持续发展环境的重要尝试，在当前强调人类福祉而不仅是商业利益的趋势下，其模式或将成为行业标杆。

2018-02-20

7,703

AI安全

人工智能快速发展的浪潮中，可解释性和教育性成为焦点话题

DeepMind Technologies近期发布了一组名为'Interpretable and pedagogical examples'的AI案例集，旨在通过直观示例解析模型逻辑并服务于教育。该案例集已应用于清华大学等高校的AI伦理课程，成为缓解公众对复杂AI技术神秘感、提升开发者责任意识的重要工具。随着欧盟AI Act强调高风险系统的透明性，DeepMind采用类似框架结合可视化技术展示决策过程。案例涵盖从线性回归到神经网络的多种模型，不仅帮助初学者理解AI原理，也为专业人士提供公平性分析方法。目前，Google AI和Microsoft Research等机构也在开发类似案例集，AI解释性正成为行业竞争焦点。预计到2025年，这类材料将成为全球AI教育的核心组成部分，并推动数据隐私和伦理导向的AI设计发展。

2017-11-02

4,963

AI安全

模拟训练机器人成功适应真实环境

一项AI突破通过在虚拟环境中训练机器人控制器，使实体机器人能够主动适应真实环境中的意外变化。该技术采用闭环系统设计，在模拟中学习反馈机制，解决了传统开环系统的局限性。应用实例包括电子制造中的焊接控制和物流仓储避障，显著提升了机器人的灵活性、效率与安全性。尽管仍存在环境细节捕捉不足等挑战，这一进展正推动更多行业采用闭环控制技术。未来随着算法优化和计算能力提升，该方法有望扩展至自动驾驶等领域，并引发对AI自主决策的伦理讨论。

2017-10-19

6,877

AI安全

LOLA算法让AI代理在重复囚徒困境中发现自私合作策略

LOLA是一种新型算法，专注于模拟多代理环境中所有参与者同时学习的情景。这突破了传统AI的静态假设，使代理在重复囚徒困境游戏中自发演化出合作策略如'tit-for-tat'，即基于对手的行动进行互惠响应。算法不仅提升了代理在博弈论中的适应性，还为行业应用（如自动驾驶）和AI伦理提供了新视角，帮助实现可持续合作。然而，LOLA也面临局限性，例如潜在的局部最优问题，并代表multi-agent reinforcement learning的重要里程碑，有望推动AI在更多领域的创新发展。

2017-09-14

3,558

AI安全

AI算法考虑对手学习动态：新突破提升机器学习效率

DeepSeek AI团队于2023年10月的AI未来峰会上公布了一种名为'Learning with opponent-learning awareness'的新学习机制，该机制让AI在训练中考虑竞争对手的存在来优化策略，提升与人类互动的灵活性和效率。这不同于传统孤立学习方法，DeepSeek利用博弈论概念，在测试中如围棋游戏中表现更优（成功率50% vs 40%），并已应用于自动驾驶等领域，但也引发潜在伦理风险，公司正开发监督框架。这一创新标志着AI训练范式的转变，可能推动全球竞争与合作，提升模型的泛化能力。

2017-09-13

2,658

AI安全

DeepMind团队开发新算法，自动从人类反馈中推断复杂目标

DeepMind团队近期推出一项突破性进展，研发出可自动推断人类意图的新算法。该系统通过用户反馈比较行为模式进行机器学习，旨在解决传统AI依赖简化目标函数导致复杂意图解读偏差的问题。研究人员指出，此方法虽能提升系统可靠性并减少潜在事故风险（如自动驾驶领域），但需警惕过度优化和忽略罕见情境的挑战。DeepMind的安全团队强调，该算法是长期AI伦理研究的重要成果，将推动行业从人类主导转向更多自主化开发阶段。

2017-06-13

4,776

AI安全

竞争性多智能体环境：推动AGI发展的动态机制

多代理竞争环境被视为实现通用人工智能（AGI）的关键路径。与传统单代理训练不同，这种设置通过动态调整的'自然课程'模拟真实互动挑战，促使AI代理持续进化而非收敛到固定性能。核心优势在于不存在稳定均衡——当一个代理提升，竞争者也会出现，推动系统不断优化。研究显示该环境能加速AI从狭义智能向广义能力的过渡，在自动驾驶、网络安全等领域有应用潜力。然而，也面临计算复杂性和代理间合作难题等挑战，需平衡对抗性与安全性。当前AI界正大力投资multi-agent研究，并通过如NeurIPS会议等平台探索其机制，有望推动下一代AI系统的开发。

2017-06-08

3,444

AI安全

AI探索新方法：通过Q函数集合优化UCB算法

DeepMind团队于2019年推出Q-ensembles方法，通过整合多个独立训练的价值网络解决深度强化学习中的探索-利用困境。该技术不仅提升算法在复杂决策环境的效率，还显著减少样本偏差并加快收敛速度。Q-ensembles采用动态权重分配机制，结合人类专家知识库能增强AI在不确定环境下的稳健性。该方法适用于机器人控制、自动驾驶等动态系统，并为医疗诊断等领域提供新思路，有望推动强化学习在高风险场景的应用发展。

2017-06-05

2,534

第 45 页，共 46 页

AI安全

所有分类