阿裏發布千問旗艦模型Qwen3-Max-Thinking，高階推理能力比肩國際頂尖

新時空 · 2026/01/27 09:40 · 吳澤宇

新時空訊，阿裏1月26日正式推出千問系列旗艦推理模型Qwen3-Max-Thinking，總參數量超萬億，憑借自適應工具調用能力與測試時擴展技術兩大核心升級，在19項權威基準測試中媲美GPT-5.2-Thinking、Gemini 3 Pro等國際頂尖模型，高階推理表現實現反超。

新時空訊：阿裏於2026年1月26日晚發布千問系列旗艦推理模型Qwen3-Max-Thinking，該模型以超萬億參數量、36T Tokens預訓練數據爲基礎，經大規模強化學習打磨，在高階推理領域實現國產大模型的重要突破，性能比肩國際頭部產品。

據悉，該模型核心改進聚焦兩大技術創新。其一爲自適應工具調用能力，現已上線Qwen Chat，可在對話中自主判斷並調用內置搜索、記憶及代碼解釋器功能，有效降低AI“幻覺”風險；其二是測試時擴展技術，通過“經驗提取”式反思避免冗餘計算，在相同算力下聚焦難點突破，使GPQA科學知識測試得分從90.3升至92.8，LiveCodeBench編程測試從88.0提升至91.4，關鍵推理性能超越Gemini 3 Pro。

性能比拼中，該模型表現亮眼。在HLE工具調用基準測試中以58.3分遠超GPT-5.2-Thinking（45.5分）及Gemini 3 Pro（45.8分）；IMO級數學推理測試獲91.5分登頂，預覽版曾拿下AIME 25與HMMT 25雙滿分。

新時空聲明： 本內容爲新時空原創內容，復制、轉載或以其他任何方式使用本內容，須注明來源“新時空”或“NewTimeSpace”。新時空及授權的第三方信息提供者竭力確保數據準確可靠，但不保證數據絕對正確。本內容僅供參考，不構成任何投資建議，交易風險自擔。

關鍵詞：