首页 > 科技 > 正文

快手开源代码模型KAT-Dev-72B-Exp登顶全球基准测试,国产AI编程工具实现突破

新时空 · 2025/10/15 10:38 · 作者:港陆通
这一成绩甚至逼近GPT-4 Turbo(74.8%)和Claude 3.5 Sonnet(71.4%)等顶级闭源模型,标志着国产AI编程工具在核心能力上已具备国际竞争力。

快手旗下Kwaipilot团队于2025年10月正式开源其新一代编程模型KAT-Dev-72B-Exp,该模型在软件开发领域权威基准测试SWE-Bench Verified中以74.6%的解题准确率刷新开源模型纪录,超越Qwen3-Coder、DeepSeek-V3.1、Kimi-K2及GLM-4.6等国内外主流开源模型,成为当前开源代码模型中的性能领先者。

这一成绩甚至逼近GPT-4 Turbo(74.8%)和Claude 3.5 Sonnet(71.4%)等顶级闭源模型,标志着国产AI编程工具在核心能力上已具备国际竞争力。

新时空声明: 未经授权,不得复制、转载或以其他方式使用本内容。新时空及授权的第三方信息提供者竭力确保数据准确可靠,但不保证数据绝对正确。本內容仅供参考,不构成任何投资建议,交易风险自担。

关键词: