可灵是快手 AI 团队自研的视频生成大模型,一款具有强大功能和创新技术的 AI 视频生成大模型,为视频创作和相关领域的发展带来了新的活力。
基本信息
于 2024 年 6 月 6 日在官网正式上线,随后在快影 app 开放邀测体验。7 月 24 日,可灵 AI 宣布基础模型升级并全面开放内测,且正上线了会员体系。
产品功能
视频生成能力强:支持生成长达 2 分钟的 30fps 视频,分辨率高达 1080p,并且支持多种宽高比。这使得用户可以生成高质量、符合不同需求的视频内容。
动作与物理模拟出色:生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,比如光影反射、重力影响下的流体运动等,为视频增添真实感。
概念组合与想象丰富:具备强大的概念组合能力和想象力,能够将用户的各种创意转化为具体的视频画面。
会员专属功能:拥有高表现模式、视频延长、视频生成尾帧参考、视频运镜支持大师运镜等多种会员专属功能。
技术特点
结构创新:采用类 Sora 的 DIT 结构,用 Transformer 取代了传统的卷积网络结构,提升了模型的处理和生成能力。
基座优化:为了提升计算效率,使用 Flow 模型作为扩散模型基座,并使用分布式训练集群,通过算子优化和重算策略优化,显著提升了硬件利用率。
训练策略科学:在训练过程中采用分阶段训练策略,初期通过大量数据增强模型对概念的理解,后期通过高质量数据进一步提升模型性能和细节表现。
应用领域
可灵大模型可应用于多个场景,例如快影 app 中的 “AI 舞王” 和 “AI 唱跳” 等功能。
-=||=-收藏赞 (0)
评论 ( 1 )