新時空訊:阿裏於2026年1月26日晚發佈千問系列旗艦推理模型Qwen3-Max-Thinking,該模型以超萬億參數量、36T Tokens預訓練數據為基礎,經大規模強化學習打磨,在高階推理領域實現國產大模型的重要突破,性能比肩國際頭部產品。
據悉,該模型核心改進聚焦兩大技術創新。其壹為自適應工具調用能力,現已上線Qwen Chat,可在對話中自主判斷並調用內置搜索、記憶及代碼解釋器功能,有效降低AI“幻覺”風險;其二是測試時擴展技術,通過“經驗提取”式反思避免冗余計算,在相同算力下聚焦難點突破,使GPQA科學知識測試得分從90.3升至92.8,LiveCodeBench編程測試從88.0提升至91.4,關鍵推理性能超越Gemini 3 Pro。
性能比拼中,該模型表現亮眼。在HLE工具調用基準測試中以58.3分遠超GPT-5.2-Thinking(45.5分)及Gemini 3 Pro(45.8分);IMO級數學推理測試獲91.5分登頂,預覽版曾拿下AIME 25與HMMT 25雙滿分。
新時空聲明: 本內容為新時空原創內容,復制、轉載或以其他任何方式使用本內容,須註明來源“新時空”或“NewTimeSpace”。新時空及授權的第三方信息提供者竭力確保數據準確可靠,但不保證數據絕對正確。本內容僅供參考,不構成任何投資建議,交易風險自擔。