首页 > 科技 > 正文

Anthropic发布Claude Sonnet 4.5挑战OpenAI,30小时自主编码重塑AI生产力格局

新时空 · 2025-09-30
人工智能公司Anthropic正式推出新一代模型Claude Sonnet 4.5,宣称其是目前全球最强的编码模型及复杂软件智能体构建工具。

当地时间9月29日,人工智能公司Anthropic正式推出新一代模型Claude Sonnet 4.5,宣称其是目前全球最强的编码模型及复杂软件智能体构建工具。

技术突破集中体现在长周期任务处理能力上。据官方测试数据,Claude Sonnet 4.5能够自主连续运行30小时,完成从代码生成到安全审计的全流程开发,期间生成约1.1万行代码并成功构建出一款类似Slack的企业级聊天应用。这一耐力远超其前代模型约7小时的极限,标志着AI从辅助工具向独立生产力迈进的关键一步。在衡量真实世界软件工程能力的SWE-bench Verified基准测试中,该模型以82.0%的准确率领先于OpenAI的GPT-5(72.8%)和谷歌的Gemini 2.5 Pro(67.2%)。

商业策略上,Anthropic采取稳健的定价方针以巩固开发者生态。新模型API价格与Claude Sonnet 4完全一致,维持每百万输入Tokens 3美元、输出Tokens 15美元的标准,这意味着开发者无需增加成本即可获得性能提升。同时,公司同步推出Claude Agent SDK,将其内部构建Claude Code的基础设施向开发者开放,支持金融合规、网络安全等领域的定制化智能体开发。

安全合规成为本次迭代的重要卖点。该模型通过AI安全等级3(ASL-3)认证,配备危险内容检测过滤器,误报率较初代降低90%。Anthropic联合创始人贾里德・卡普兰强调,这是公司“过去一年半以来最大的安全飞跃”,模型在抵御提示注入攻击等方面表现显著改善。

当前AI编码领域竞争已呈白热化态势。Anthropic在8月刚推出Claude Opus 4.1,5月发布Claude Sonnet 4,此次快速迭代既凸显了技术竞赛的激烈程度,也反映出单一企业难以长期维持绝对领先地位的行业现状。随着Claude Sonnet 4.5的推出,其30小时自主编码能力不仅为开发者提供了更高性价比的选择,也可能加速AI代理技术在金融、法律、医疗等高门槛行业的规模化落地。

新时空声明: 未经授权,不得复制、转载或以其他方式使用本内容。新时空及授权的第三方信息提供者竭力确保数据准确可靠,但不保证数据绝对正确。本內容仅供参考,不构成任何投资建议,交易风险自担。

相关资讯