快手开源代码模型KAT-Dev-72B-Exp登顶全球基准测试，国产AI编程工具实现突破

新时空 · 2025/10/15 10:38 · 港陆通

这一成绩甚至逼近GPT-4 Turbo（74.8%）和Claude 3.5 Sonnet（71.4%）等顶级闭源模型，标志着国产AI编程工具在核心能力上已具备国际竞争力。

快手旗下Kwaipilot团队于2025年10月正式开源其新一代编程模型KAT-Dev-72B-Exp，该模型在软件开发领域权威基准测试SWE-Bench Verified中以74.6%的解题准确率刷新开源模型纪录，超越Qwen3-Coder、DeepSeek-V3.1、Kimi-K2及GLM-4.6等国内外主流开源模型，成为当前开源代码模型中的性能领先者。

这一成绩甚至逼近GPT-4 Turbo（74.8%）和Claude 3.5 Sonnet（71.4%）等顶级闭源模型，标志着国产AI编程工具在核心能力上已具备国际竞争力。

新时空声明： 未经授权，不得复制、转载或以其他方式使用本内容。新时空及授权的第三方信息提供者竭力确保数据准确可靠，但不保证数据绝对正确。本內容仅供参考，不构成任何投资建议，交易风险自担。

关键词：