General Intuition in talks to raise $300M at aroun

AI导读

在人工智能技术飞速迭代的今天,如何让机器真正理解并模拟物理世界的运作规律,已成为业界最为前沿的挑战之一。近日,一家新兴的初创公司凭借其独特的战略布局,吸引了科技界的广泛关注。该公司正利用来自游戏数据平台Medal的海量视频资源,训练其所谓的“具身智能”(Embodied AI)与“世界模型”(World Model),试图为AI赋予更接近人类的感知与行动能力。

据知情人士透露,这家初创公司所使用的数据集规模令人瞩目。Medal平台拥有超过1000万的月活跃用户,这些用户每年贡献的视频内容总量高达20亿条。如此庞大的数据洪流,为训练复杂的人工智能模型提供了前所未有的“燃料”。与...

AI Prism 智棱 - 计算机视觉 分类封面图

在人工智能技术飞速迭代的今天,如何让机器真正理解并模拟物理世界的运作规律,已成为业界最为前沿的挑战之一。近日,一家新兴的初创公司凭借其独特的战略布局,吸引了科技界的广泛关注。该公司正利用来自游戏数据平台Medal的海量视频资源,训练其所谓的“具身智能”(Embodied AI)与“世界模型”(World Model),试图为AI赋予更接近人类的感知与行动能力。

据知情人士透露,这家初创公司所使用的数据集规模令人瞩目。Medal平台拥有超过1000万的月活跃用户,这些用户每年贡献的视频内容总量高达20亿条。如此庞大的数据洪流,为训练复杂的人工智能模型提供了前所未有的“燃料”。与传统的静态图像或文本数据集不同,这些视频内容记录了人类在虚拟游戏世界中的各种互动行为,包括导航、操作、决策以及应对动态环境变化的反应,这恰好是训练具身智能模型所急需的“第一人称视角”经验。

具身智能,作为人工智能领域的一个重要分支,其核心目标是让AI实体(如机器人)能够在物理或虚拟环境中自主感知、规划并采取行动。而世界模型,则是一种试图在内部构建对外部环境因果规律进行模拟的深度学习框架。两者的结合,被认为是通往通用人工智能(AGI)的关键路径之一。传统的训练方式往往依赖于在模拟器中生成的数据,但模拟环境与真实世界的复杂性之间往往存在“现实差距”。Medal提供的海量真实人类游戏操作数据,则可能为弥合这一鸿沟提供一条捷径。

从行业背景来看,这一做法并非孤例。近年来,随着大语言模型(LLM)在文本理解上取得突破,科技巨头们纷纷将目光投向视频数据。例如,Meta(原Facebook)曾利用用户上传的视频训练其图像识别模型,而Google DeepMind也多次强调视频数据对于构建智能体(Agent)的重要性。然而,Medal平台的数据具有其特殊性:它并非普通的影视内容或生活记录,而是高度聚焦于游戏场景内的交互行为。每一段视频都对应着玩家在特定规则下的目标驱动行为,这意味着数据中天然包含了“意图”、“反馈”和“结果”的因果链条。对于训练AI理解“如果按下按钮,屏幕会发生什么变化”这类因果逻辑,这类数据具有极高的价值。

分析人士指出,这种数据驱动的训练模式,可能预示着AI研发范式的又一次转变。在过去,AI能力的提升主要依赖于算法创新和计算能力的增长。但在大模型时代,优质且大规模的数据集已经成为核心竞争力。Medal所积累的20亿条视频,不仅数量庞大,更关键的是其“行为密度”极高——每一帧都承载着玩家的操作指令与游戏环境的即时响应。这种密集的行为-反馈数据,对于训练世界模型预测下一帧画面、或者训练具身智能体模仿人类操作,都是极为宝贵的训练素材。

不过,这一路径也并非没有挑战。首先,游戏视频数据虽然丰富,但其场景与真实物理世界仍有显著差异。例如,游戏中的物理规则是人为设定的,可能存在简化或不符合现实规律的情况。如何确保模型从游戏数据中学到的能力能够有效迁移到现实世界的机器人身上,是一个需要解决的泛化问题。其次,如此大规模的视频数据处理,对计算资源和存储架构提出了极高的要求。此外,数据隐私和版权问题也是不可忽视的潜在风险,毕竟这些视频内容由数百万用户创作,其使用边界需要法律层面的清晰界定。

尽管如此,该初创公司的大胆尝试已经为行业提供了新的思路。在通往更强大AI的路上,我们或许正见证一个新时代的开启:数据不再是简单的“燃料”,而是塑造智能体行为模式的核心“基因”。当AI能够从数以十亿计的人类行为片段中学习如何与复杂世界互动时,机器所展现出的灵活性和适应性,可能会超出我们当前的想象。

目前,该公司尚未公布其具体的模型架构或训练成果,但业界对其后续进展保持高度关注。如果这一模式被证明成功,它可能会彻底改变机器人、自动驾驶、游戏AI乃至虚拟现实等多个领域的发展轨迹。毕竟,让机器真正学会“看”和“做”,一直是人工智能研究者的终极梦想,而如今,这个梦想正因海量真实行为数据的注入而变得前所未有的接近。

内容声明

本文内容基于公开市场信息与媒体报道进行整理,部分观点来自社区讨论。如涉及事实性问题,欢迎通过 xurj005@163.com 与我们指正,我们将及时核实并更新。