3 月 18 日消息,在英伟达 GTC 2026 大会上,月之暗面 Kimi 创始人杨植麟发表公开演讲,首次系统性地披露了今年 1 月底发布的 Kimi K2.5 模型背后的技术路线图。
杨植麟在演讲中提出,要推动大模型智能上限的持续突破,必须从底层架构入手,对优化器、注意力机制及残差连接等核心技术进行重构。他将 Kimi 的进化逻辑归纳为三个维度的协同推进:Token 效率、长上下文以及智能体集群。
杨植麟认为,当前的 Scaling 已不再是单纯的资源堆砌,而是要在计算效率、长程记忆和自动化协作上同时寻找规模效应。
他表示,如果能够将这三个维度的技术增益相乘,模型将表现出远超现状的智能水平。在谈及未来智能形态时,杨植麟判断,智能的发展方向将从单智能体向动态生成的集群进化。
参考此前报道,月之暗面今年 1 月宣布推出并开源了其最新的 Kimi K2.5 模型,在 Agent、代码、图像、视频及一系列通用智能任务上取得开源 state-of-the-art 表现;同时也是 Kimi 迄今最全能的模型,采用了原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。
文章来源:
思思
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!