OpenAI 在 2024 年 2 月 16 日发布的首个文本生成视频模型。它可以根据用户的文本提示快速制作长达一分钟的高保真视频,还能获取现有的静态图像并从中生成视频。Sora 的主要功能包括:
文本到视频的转化:能够将用户的文本描述转化为动态的视觉内容,极大地降低了视频制作的门槛。
角色和场景生成:可以根据描述生成具有多个角色和复杂背景的视频场景。
物理模拟:在生成视频时,会尝试模拟现实世界的物理规则,尽管在某些情况下可能不够完美。
视频编辑和扩展:不仅能够从头开始生成视频,还能够对现有视频进行编辑和扩展,填补缺失的帧或增加新的内容。
为全方位展示 Sora 的功能,OpenAI 同时发布了 48 个由 Sora 直接生成、未经修改、长度不等(9 秒~60 秒)的视频。这些视频展示了 Sora 在不同场景下的生成能力,包括行人在日本街头行走、狗在雪地中玩耍、中国龙年舞龙等。
-=||=-收藏赞 (0)
评论 ( 0 )