Sora视频生成模型现已上线:用户可创建高清短视频

AI导读

OpenAI近日发布其视频生成模型Sora的公开测试版,标志着自主AI视频创作领域的重要突破。该工具可直接根据文本指令生成长达20秒的1080p高清视频,输出质量显著优于Runway、Pika等同类服务(通常仅支持较短时长)。Sora还兼容16:9、9:16和1:1等多种屏幕比例,适配不同平台需求。业内普遍认为该技术解决了当前AI视频生成在时长与质量间的矛盾,尽管仍面临推理限制和算力消耗等技术瓶颈。

AI Prism 智棱 - 计算机视觉 分类封面图

北京时间2月14日晚,OpenAI正式上线其视频生成模型Sora的公开测试版本。该工具提供高达1080p分辨率、时长上限为20秒的高质量视频创作能力,并在sora.com官网面向全球用户提供免费试用服务,标志着AI视频生成领域的一次重大技术突破。

作为OpenAI在2023年公布的突破性作品,Sora的核心价值在于实现文本到视频的全自主生成。与行业现有工具不同的是,Sora不仅限于扩展已有素材库或剪辑现有视频,用户还可以直接基于文本指令创造全新的视觉内容。值得注意的是,这款工具在提供高质量输出的同时,将视频时长限制在20秒以内,分辨率最高可达全高清标准。

业内分析人士指出,这一限制暗示着OpenAI在技术优化上的战略考量。当前视频生成领域普遍存在的一种现象是:要么输出质量受限,要么处理时长有限制。(以Runway为代表的工具)的时长限制通常在45秒以内,而Pika则设定为最多2分钟。相比之下,Sora能够提供更高质量的输出表现。

在视频分辨率参数上,Sora支持三种常见画幅比例:横屏(16:9)、竖屏(9:16)和标准方形画幅(1:1)。这种多比例支持对内容创作者具有重要意义,意味着用户可以根据不同发布平台的需求灵活调整作品格式。

技术层面来看,Sora生成20秒视频的能力反映了AI模型在时间维度上的推理限制。业界普遍认为,当前最先进的(文本到视频生成技术)存在三个主要瓶颈:首先是计算资源消耗过大导致的时间限制,其次是长时序生成过程中的空间一致性问题,最后是复杂场景下的物理规则遵循困难。

OpenAI的产品经理在演示中指出,Sora的突破在于实现了多个复杂要素的同时生成:

内容声明

本文内容基于公开市场信息与媒体报道进行整理,部分观点来自社区讨论。如涉及事实性问题,欢迎通过 xurj005@163.com 与我们指正,我们将及时核实并更新。