注册
当前位置:首页 » 文章 » 笔记

首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务

Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。

-=||=-收藏赞 (0)

评论 ( 0 )

微信咨询

qrcode

关注公众号

qrcode

回顶部