当前位置：首页 » 文章

Adobe与MIT联合发布CausVid技术，实现AI视频边生成边播放

Adobe与MIT的最新研究CausVid技术，标志着AI视频生成领域的一大突破。这项自回归实时视频生成技术能够实现视频的边生成边播放，极大地减少了视频生成的等待时间。传统视频生成模型需要完整生成整个视频才能播放，而CausVid技术允许在模型生成首帧后立即开始播放，后续内容动态生成并无缝衔接。

CausVid技术的核心在于蒸馏预训练的双向扩散模型（DiT）构建自回归生成模型，通过分布匹配蒸馏（DMD）将生成步骤从50步缩减到仅需4步，显著提升了视频生成的速度。此外，研究团队提出了非对称蒸馏策略，引入一个拥有未来信息的双向教师模型，在蒸馏训练阶段指导自回归的单向学生模型，有效减少了误差累积问题，并生成了更高质量的视频内容。

实验结果显示，CausVid技术在首帧生成延迟和生成速度上均有显著提升：首帧生成延迟从3.5分钟降至1.3秒，提速170倍；生成速度从0.6帧/秒提升至9.4帧/秒，提升16倍。此外，生成质量也经过VBench和用户调查验证，优于主流模型如Meta的MovieGen和智谱的CogVideoX。

CausVid技术的应用范围广泛，包括图片动画化、实时视频风格转换以及交互式剧情生成等。这项技术不仅提高了视频生成的效率，也为创作者提供了全新的创作体验和可能性。随着CausVid技术的进一步发展和应用，AI视频生成领域将迎来更多创新和突破。

-=||=-收藏赞 (0)

Adobe与MIT联合发布CausVid技术，实现AI视频边生成边播放

评论 ( 0 )

取消回复