谷歌最新发布了其先进的视频生成模型Veo 2和图像生成模型Imagen 3,同时推出了全新的图像生成实验工具Whisk。在谷歌的测试中,OpenAI的Sora视频生成模型表现最差,而可灵成为视频生成领域的顶流之一。
Veo 2能够生成各种主题和风格的高质量视频,对真实世界物理规律以及人类动作和表情的细微之处有了更深入的理解,提高了视频的整体细节和真实感。Veo 2的核心优势包括高质量和控制力、增强的真实感和保真度、先进的运动能力以及更强大的相机控制选项。在Meta发布的MovieGenBench基准数据集上,Veo 2在整体偏好和准确遵循提示词的能力方面表现最佳。
Imagen 3则改进了图像生成能力,能够生成更明亮、构图更好的图像,并以更高的精度渲染更多样化的艺术风格。Imagen 3能够更忠实地遵循提示词,并呈现更丰富的细节和纹理。Imagen 3将在Google Labs的图像生成工具ImageFX中全球推出,覆盖100多个国家。
Whisk是谷歌实验室推出的最新实验项目,允许用户输入或创建图像,以表达他们心目中的主题、场景和风格。然后,用户可以将它们组合在一起,并重新混合,创造出独特的作品。Whisk结合了最新的Imagen 3模型和Gemini的视觉理解和描述能力,为用户提供了轻松地以有趣的新方式重新混合主题、场景和风格的可能。
-=||=-收藏赞 (0)
评论 ( 0 )