Anthropic发布Claude Sonnet 4.5挑战OpenAI，30小时自主编码重塑AI生产力格局

当地时间9月29日，人工智能公司Anthropic正式推出新一代模型Claude Sonnet 4.5，宣称其是目前全球最强的编码模型及复杂软件智能体构建工具。

技术突破集中体现在长周期任务处理能力上。据官方测试数据，Claude Sonnet 4.5能够自主连续运行30小时，完成从代码生成到安全审计的全流程开发，期间生成约1.1万行代码并成功构建出一款类似Slack的企业级聊天应用。这一耐力远超其前代模型约7小时的极限，标志着AI从辅助工具向独立生产力迈进的关键一步。在衡量真实世界软件工程能力的SWE-bench Verified基准测试中，该模型以82.0%的准确率领先于OpenAI的GPT-5（72.8%）和谷歌的Gemini 2.5 Pro（67.2%）。

商业策略上，Anthropic采取稳健的定价方针以巩固开发者生态。新模型API价格与Claude Sonnet 4完全一致，维持每百万输入Tokens 3美元、输出Tokens 15美元的标准，这意味着开发者无需增加成本即可获得性能提升。同时，公司同步推出Claude Agent SDK，将其内部构建Claude Code的基础设施向开发者开放，支持金融合规、网络安全等领域的定制化智能体开发。

安全合规成为本次迭代的重要卖点。该模型通过AI安全等级3（ASL-3）认证，配备危险内容检测过滤器，误报率较初代降低90%。Anthropic联合创始人贾里德・卡普兰强调，这是公司“过去一年半以来最大的安全飞跃”，模型在抵御提示注入攻击等方面表现显著改善。

当前AI编码领域竞争已呈白热化态势。Anthropic在8月刚推出Claude Opus 4.1，5月发布Claude Sonnet 4，此次快速迭代既凸显了技术竞赛的激烈程度，也反映出单一企业难以长期维持绝对领先地位的行业现状。随着Claude Sonnet 4.5的推出，其30小时自主编码能力不仅为开发者提供了更高性价比的选择，也可能加速AI代理技术在金融、法律、医疗等高门槛行业的规模化落地。

新时空声明： 未经授权，不得复制、转载或以其他方式使用本内容。新时空及授权的第三方信息提供者竭力确保数据准确可靠，但不保证数据绝对正确。本內容仅供参考，不构成任何投资建议，交易风险自担。