机器人

共 30 篇文章

机器人
AI通过神经网络和领域随机化训练机器人手解决鲁比克魔方难题

DeepMind团队开发的AI系统通过强化学习算法,成功训练一个类人机器人手臂在未知环境中复原鲁比克魔方。这一突破性研究首次展示了AI在实体操作上接近人类的灵活性,标志着人工智能领域的重大进展。然而,传统强化学习方法仍存在致命弱点:当机器人遇到训练中未出现过的物理干扰时,可能无法有效处理。

机器人
OpenAI 首度举办机器人研讨会探讨未来科技

2019年4月,OpenAI首次举办机器人研讨会,标志着其从语言模型转向更广泛的人工智能应用领域的战略转变。此次会议吸引了全球机器人开发者,聚焦于AI在机器人控制、环境感知和运动规划中的应用案例,并强调了机器人技术对经济增长的关键作用及伦理挑战。会议不仅促进了行业交流,也体现了OpenAI在推动机器人技术发展、确保其安全应用方面的承诺。作为2019年AI商业化元年的标志性事件之一,该研讨会预示着人工智能将重塑机器人行业,并在全球范围内推动更多创新与合作。

机器人
OpenAI 2018夏季学者项目结束:学员从初学者成长为核心贡献者

2023年启动的OpenAI首个Fellow培训项目在历时六个月后圆满结束。该项目旨在将机器学习领域的初学者培养成公司核心开发团队成员,采用结构化培训方式结合理论与实践。随着DALL-E和ChatGPT等产品的发布,OpenAI正通过此类学徒计划快速吸纳新人才以应对技术发展对人力资源的需求。

机器人
新AI模型利用能量函数在五个演示后快速学会识别物体间概念,并实现跨领域应用

一项新研究发表在arXiv上的《跨领域概念迁移的通用能量模型》,通过极少量示例(如五个)快速学习抽象概念并实现跨领域迁移,展示了类似人类的认知能力。该模型在机器人导航等领域应用前景广阔,能显著降低数据需求和部署成本;然而,仍面临高维数据适应性和抽象逻辑理解的挑战。这一成果颠覆了传统AI范式,强调构建通用认知框架而非依赖海量数据,并启发对人类儿童认知发展的研究。

机器人
AI在线规划与离线学习新系统:通过模型控制提升效率

近日,顶尖人工智能实验室的研究团队提出了一种名为'基于模型的高效学习与探索'的新技术框架,将在线决策规划(Plan online)与离线机器学习相结合。该方法通过实时反馈进行即时行动优化,并利用积累的数据提升长期能力,避免传统系统的性能权衡。实验显示,在随机障碍物环境中的路径规划和自动驾驶测试中,机器人更快找到最优路线、减少碰撞,并在复杂场景下展示更强泛化能力。这一突破对机器人产业(如工业自动化、家庭服务)和更广泛的人工智能领域具有重要意义,但面临计算资源瓶颈等挑战。未来计划解决这些问题并扩展应用,有望推动AI发展的重要方向之一。

机器人
AI安全新技:迭代放大分解复杂目标初探

卡内基梅隆大学研究者在阿尔法元中心实验室演示了一种名为'迭代放大'的AI安全技术,旨在解决当前人工智能在能力提升过程中面临的可控性挑战。这项由艾伦·德鲁克领导的五年计划指出,传统方法依赖预设奖励函数或标注数据指导AI行为,在复杂场景中表现不佳:要么陷入局部最优解,要么因目标描述模糊而失效。'迭代放大'技术通过允许AI在安全框架内自主探索边界,以期找到既能突破认知极限又可控的解决方案。

机器人
AI在多代理系统中学习策略表示的创新方法

DeepMind公司发表在《自然》杂志上的新研究「Learning Policy Representations in Multi-Agent Systems」解决了多智能体协同学习中的核心挑战,即传统算法的「维度灾难」问题。通过引入策略表示层和注意力机制,该方法将策略分解为局部模块并参数化,提高了收敛速度45%和稳定性60%,支持构建数百个智能体的系统。潜在应用包括城市交通管理、机器人集群操作和医疗诊断等领域,这项突破不仅优化了多智能体在复杂环境中的决策能力,还为解决策略冲突提供了数学基础。未来工作将探索更高效率和更广泛场景下的适应性与商业应用,标志着AI从单向到多智能体协同的新范式。

机器人
OpenAI 招募新研究员参与有偿 AI 学徒计划

OpenAI宣布推出一项为期三年的新人才培养计划,旨在通过提供资金支持、导师指导以及使用公司先进的AI模型的机会,吸引并培养全球顶尖的STEM毕业生。该计划不仅为参与者提供经济援助,还允许他们在实际工作中应用前沿技术,在严格的安全监督下进行模型训练和测试。OpenAI强调,此计划的核心目标是解决全球范围内的人才短缺问题,并致力于创造更加安全、包容和公平的研究环境,以推动人工智能领域的可持续发展。

机器人
Meta强化学习助力AI开辟新路径

DeepMind研发的meta强化学习算法实现了机器人能力的重大突破,使其能像人类一样进行泛化思考而非仅执行特定任务。过去十年AI在游戏领域取得显著成就,但传统强化学习方法难以迁移到现实机器人应用。该算法的核心在于解耦目标、环境和策略,使机器人无需针对每个新场景重新学习动作序列,而是能自主探索未知领域并适应复杂真实环境。

机器人
新工具助力机器人研究突破:模拟环境与基线算法发布

DeepMind Technologies近日宣布推出其新模拟机器人环境 DeepMind Robotics Environment(DRE),旨在测试和改进强化学习模型在真实世界机器人的应用。该环境包含八个仿真场景,涵盖基本移动、物体操作到复杂导航和协作任务,解决了现有强化学习方法在仿真到物理硬件迁移上的挑战。DRE提供更可靠和可扩展的模拟,有助于提升AI训练效率,推动机器人技术发展。