首頁 > 科技 > 正文

Anthropic發佈Claude Sonnet 4.5挑戰OpenAI,30小時自主編碼重塑AI生產力格局

新時空 · 2025/09/30 10:26 · 作者:港陆通
人工智能公司Anthropic正式推出新壹代模型Claude Sonnet 4.5,宣稱其是目前全球最強的編碼模型及復雜軟件智能體構建工具。

當地時間9月29日,人工智能公司Anthropic正式推出新壹代模型Claude Sonnet 4.5,宣稱其是目前全球最強的編碼模型及復雜軟件智能體構建工具。

技術突破集中體現在長周期任務處理能力上。據官方測試數據,Claude Sonnet 4.5能夠自主連續運行30小時,完成從代碼生成到安全審計的全流程開發,期間生成約1.1萬行代碼並成功構建出壹款類似Slack的企業級聊天應用。這壹耐力遠超其前代模型約7小時的極限,標誌著AI從輔助工具向獨立生產力邁進的關鍵壹步。在衡量真實世界軟件工程能力的SWE-bench Verified基準測試中,該模型以82.0%的準確率領先於OpenAI的GPT-5(72.8%)和谷歌的Gemini 2.5 Pro(67.2%)。

商業策略上,Anthropic採取穩健的定價方針以鞏固開發者生態。新模型API價格與Claude Sonnet 4完全壹致,維持每百萬輸入Tokens 3美元、輸出Tokens 15美元的標準,這意味著開發者無需增加成本即可獲得性能提升。同時,公司同步推出Claude Agent SDK,將其內部構建Claude Code的基礎設施向開發者開放,支持金融合規、網絡安全等領域的定制化智能體開發。

安全合規成為本次疊代的重要賣點。該模型通過AI安全等級3(ASL-3)認證,配備危險內容檢測過濾器,誤報率較初代降低90%。Anthropic聯合創始人賈裏德・卡普蘭強調,這是公司“過去壹年半以來最大的安全飛躍”,模型在抵禦提示註入攻擊等方面表現顯著改善。

當前AI編碼領域競爭已呈白熱化態勢。Anthropic在8月剛推出Claude Opus 4.1,5月發佈Claude Sonnet 4,此次快速疊代既凸顯了技術競賽的激烈程度,也反映出單壹企業難以長期維持絕對領先地位的行業現狀。隨著Claude Sonnet 4.5的推出,其30小時自主編碼能力不僅為開發者提供了更高性價比的選擇,也可能加速AI代理技術在金融、法律、醫療等高門檻行業的規模化落地。

新時空聲明: 未經授權,不得復制、轉載或以其他方式使用本內容。新時空及授權的第三方信息提供者竭力確保數據準確可靠,但不保證數據絕對正確。本內容僅供參考,不構成任何投資建議,交易風險自擔。