聯合報記者賴錦宏/綜合報導
阿里雲29日凌晨在微信公眾號宣布,通義千問Qwen2.5-Max全新升級發布,並表示新模型不僅展現出極強勁的綜合性能,更在多項公開主流模型評測基準上均取得高分,全面超越了目前全球領先的開源混合專家模型(MoE)及最大的開源稠密模型。
🚄3分鐘就能到家!捷運便利宅立刻看!🔥新北優質建案捷運宅,推薦搶先看>>
🍊新春精選低總價房800萬起🍊趁這一波快進場!
🔥副都心 x 雙捷運,新案「富都馨」搶先看>>

阿里雲說,通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本效能進行了評估測試。
在指令模型方面,Qwen2.5-Max在多個基準測試中比肩美國的Claude-3.5-Sonnet模型,幾乎全面超越另外三個模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。
在基座模型方面,阿里雲則表示,通義團隊將Qwen2.5-Max與目前領先的開源MoE模型DeepSeek V3、最大的開源稠密模型Llama-3.1-405B,以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比,Qwen2.5-Max在所有11項基準測試中,表現全部超越對比模型。
據路透社報導,選擇大年初一發布Qwen 2.5-Max是較為特殊的時間點,也顯示了深度求索過去三周迅速崛起,給中國境內外競爭對手帶來壓力。