注册
0已收藏
0已赞

腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。

发展历程

  • 2023 年 8 月 3 日进入应用内测阶段。
  • 2023 年 9 月 7 日在腾讯全球数字生态大会上正式亮相,并通过腾讯云对外开放。
  • 2023 年 10 月 26 日正式对外开放 “文生图” 功能。
  • 2023 年 12 月通过国内 “大模型标准符合性评测” 测试。
  • 2024 年 5 月 14 日宣布对外开源;5 月 22 日腾讯云公布全新大模型升级方案,对部分模型的价格进行了调整。
  • 2024 年 9 月 5 日,腾讯推出新一代大模型 “混元 Turbo”。

技术特点

  • 参数规模与训练数据:拥有超千亿参数规模,预训练语料超 2 万亿 tokens,为模型提供了强大的基础数据支持,使其能够学习到丰富的语言知识和语义理解能力。
  • 混合专家模型(MOE)架构:率先采用混合专家模型结构,这种架构在激活参数不变的情况下,总参数量加大,可以吞吐更多的 token,同时能显著降低训推成本,提升了模型的性能和效率。
  • 强大的能力表现
    • 优秀的中文理解与创作能力:擅长中文文本的生成、创作,无论是文学创作、文本摘要等任务都能出色完成。
    • 逻辑推理能力:在复杂语境下能够进行准确的逻辑推理,可应用于专业领域的多轮问答等场景。
    • 可靠的任务执行能力:能够准确地理解用户的指令并执行相应的任务。
    • 知识增强:不断学习和更新知识,有效解决事实性、时效性问题。
    • 多模态能力:在多模态方面持续迭代升级,具备文生图、文生视频、图生视频、图文生视频、视频生视频、文 / 图生 3D 等多种能力。

产品功能与应用场景

  • 产品功能
    • 混元生文:基于人机自然语言对话方式,结合输入的文本或图片输出相关文本内容,可用于文本生成、创作、问答等场景。
    • 混元生图:根据输入的文本描述智能创作出与输入相关的图像内容,为高质量的内容创作、内容运营提供技术支持。
  • 应用场景:已经支持内部超过 400 个业务和场景接入,如企业微信、腾讯文档、腾讯会议等,还可应用于文档、会议、广告、营销、创作等场景。

性能优势

  • 领先的知识理解和获取能力:在中文表现尤其是文本生成、数理逻辑和多轮对话上性能表现卓越,整体处于业界领先水平。
  • 优秀的长文表现:最大支持 256k 上下文,在长文输入场景,大海捞针指标达到 99.9%。
  • 可靠、安全:围绕大模型的生命周期,从数据处理、训练使用、应用访问等环节构建全流程的安全防护体系,全方位保障大模型数据和应用的安全。

市场影响力

在最新的中文大模型测评基准 SuperCLUE 发布的 2024 年 8 月报告中,腾讯混元大模型总得分稳居榜首,在 11 项核心任务中,8 项夺得国内第一,展示了其在国内市场的强大竞争力。

-=||=-收藏赞 (0)

评论 ( 0 )

微信咨询

qrcode

关注公众号

qrcode

回顶部