Sora视频生成模型现已上线:用户可创建高清短视频

北京时间2月14日晚,OpenAI正式上线其视频生成模型Sora的公开测试版本。该工具提供高达1080p分辨率、时长上限为20秒的高质量视频创作能力,并在sora.com官网面向全球用户提供免费试用服务,标志着AI视频生成领域的一次重大技术突破。

作为OpenAI在2023年公布的突破性作品,Sora的核心价值在于实现文本到视频的全自主生成。与行业现有工具不同的是,Sora不仅限于扩展已有素材库或剪辑现有视频,用户还可以直接基于文本指令创造全新的视觉内容。值得注意的是,这款工具在提供高质量输出的同时,将视频时长限制在20秒以内,分辨率最高可达全高清标准。

业内分析人士指出,这一限制暗示着OpenAI在技术优化上的战略考量。当前视频生成领域普遍存在的一种现象是:要么输出质量受限,要么处理时长有限制。(以Runway为代表的工具)的时长限制通常在45秒以内,而Pika则设定为最多2分钟。相比之下,Sora能够提供更高质量的输出表现。

在视频分辨率参数上,Sora支持三种常见画幅比例:横屏(16:9)、竖屏(9:16)和标准方形画幅(1:1)。这种多比例支持对内容创作者具有重要意义,意味着用户可以根据不同发布平台的需求灵活调整作品格式。

技术层面来看,Sora生成20秒视频的能力反映了AI模型在时间维度上的推理限制。业界普遍认为,当前最先进的(文本到视频生成技术)存在三个主要瓶颈:首先是计算资源消耗过大导致的时间限制,其次是长时序生成过程中的空间一致性问题,最后是复杂场景下的物理规则遵循困难。

OpenAI的产品经理在演示中指出,Sora的突破在于实现了多个复杂要素的同时生成: