月之暗面Kimi最近发布了其视觉思考模型k1的升级版,这一新模型在推理能力上取得了显著提升,并且在速度和准确性上都有了大幅增强。k1模型基于强化学习技术,支持端到端图像理解和思维链技术,将能力扩展到了数学之外的更多基础科学领域,包括物理、化学等。
在基础科学学科的基准能力测试中,k1模型的表现超过了全球标杆模型,如OpenAI的o1、GPT-4o以及Claude 3.5 Sonnet。k1的图像理解能力也解决了之前k0-math模型无法解决的许多几何图形问题,在基础教育各阶段的几何和图形题专项基准能力测试中,k1的成绩打平或超过了OpenAI的o1模型。
k1不仅能够识别各种真实的拍题场景,处理复杂状况,如照片图像不清晰、多题一起拍、手写字迹干扰,甚至纯手写的题目,还能以端到端的方式将视觉能力和推理能力结合起来,直接理解用户输入的图片信息并进行深度推理。
此外,k1还展现出了一些涌现能力,包括古代文献分析、梗图理解、基于照片推断地点等,这些能力大大提升了k1在日常生活中的实用性。月之暗面Kimi的这一新模型,通过强化学习技术,为大模型技术范式带来了新的发展方向,预示着AI模型在未来可能实现更加强大的交互体验。
-=||=-收藏赞 (0)
评论 ( 0 )