Anthropic發布Claude Sonnet 4.5挑戰OpenAI，30小時自主編碼重塑AI生產力格局

新時空 · 2025/09/30 10:26 · 港陸通

人工智能公司Anthropic正式推出新一代模型Claude Sonnet 4.5，宣稱其是目前全球最強的編碼模型及復雜軟件智能體構建工具。

當地時間9月29日，人工智能公司Anthropic正式推出新一代模型Claude Sonnet 4.5，宣稱其是目前全球最強的編碼模型及復雜軟件智能體構建工具。

技術突破集中體現在長周期任務處理能力上。據官方測試數據，Claude Sonnet 4.5能夠自主連續運行30小時，完成從代碼生成到安全審計的全流程開發，期間生成約1.1萬行代碼並成功構建出一款類似Slack的企業級聊天應用。這一耐力遠超其前代模型約7小時的極限，標志着AI從輔助工具向獨立生產力邁進的關鍵一步。在衡量真實世界軟件工程能力的SWE-bench Verified基準測試中，該模型以82.0%的準確率領先於OpenAI的GPT-5（72.8%）和谷歌的Gemini 2.5 Pro（67.2%）。

商業策略上，Anthropic採取穩健的定價方針以鞏固開發者生態。新模型API價格與Claude Sonnet 4完全一致，維持每百萬輸入Tokens 3美元、輸出Tokens 15美元的標準，這意味着開發者無需增加成本即可獲得性能提升。同時，公司同步推出Claude Agent SDK，將其內部構建Claude Code的基礎設施向開發者開放，支持金融合規、網絡安全等領域的定制化智能體開發。

安全合規成爲本次迭代的重要賣點。該模型通過AI安全等級3（ASL-3）認證，配備危險內容檢測過濾器，誤報率較初代降低90%。Anthropic聯合創始人賈裏德・卡普蘭強調，這是公司“過去一年半以來最大的安全飛躍”，模型在抵御提示注入攻擊等方面表現顯著改善。

當前AI編碼領域競爭已呈白熱化態勢。Anthropic在8月剛推出Claude Opus 4.1，5月發布Claude Sonnet 4，此次快速迭代既凸顯了技術競賽的激烈程度，也反映出單一企業難以長期維持絕對領先地位的行業現狀。隨着Claude Sonnet 4.5的推出，其30小時自主編碼能力不僅爲開發者提供了更高性價比的選擇，也可能加速AI代理技術在金融、法律、醫療等高門檻行業的規模化落地。

新時空聲明： 未經授權，不得復制、轉載或以其他方式使用本內容。新時空及授權的第三方信息提供者竭力確保數據準確可靠，但不保證數據絕對正確。本內容僅供參考，不構成任何投資建議，交易風險自擔。

關鍵詞：