陰天

臺北市 17-19 ℃

真的假的?阿里推新AI模型Qwen 2.5-Max 宣稱贏過DeepSeek

「阿里雲」宣布「通義千問Qwen 2.5-Max」29日凌晨上線。(圖擷取自網路)

「阿里雲」宣布「通義千問Qwen 2.5-Max」29日凌晨上線。(圖擷取自網路)

2025/01/29 14:30

黃邦平/核稿編輯

〔即時新聞/綜合報導〕中國人工智能(AI)模型DeepSeek高性能、低成本震驚矽谷,美、日AI相關個股連日上沖下洗,又傳出阿里巴巴旗下「阿里雲」宣布「通義千問Qwen 2.5-Max」超大規模MoE模型,號稱能力更勝一籌,消息一出,也帶動阿里股價走揚。

阿里「通義千問」團隊的Qwen2.5-Max在29日凌晨悄悄上線,號稱在多項權威基準測試中與世界頂級AI模型比肩,甚至略勝最近轟動全球製造話題的DeepSeek,指稱已可以透過API方式訪問,也可登錄Qwen Chat體驗,例如直接與模型對話或用artifacts及搜索等功能。

團隊聲稱,研發過程中使用超過20兆token預訓練及精心設計的後訓練方案,並與業界領先的閉源或開源模型對比,在評估編輯程式能力的LiveCodeBench、評估綜合能力的LiveBench、近似人類偏好的Arena-Hard,都超過了DeepSeek V3,另外在測試大學水平知識的MMLU-Pro等其他評估中也展現極具競爭力的成績。

「阿里雲」宣布「通義千問Qwen 2.5-Max」29日上線,官方介紹中聲稱各項指標都領先DeepSeek。(圖擷取自網路)

「阿里雲」宣布「通義千問Qwen 2.5-Max」29日上線,官方介紹中聲稱各項指標都領先DeepSeek。(圖擷取自網路)

「阿里雲」宣布「通義千問Qwen 2.5-Max」29日凌晨上線。(圖擷取自網路)

「阿里雲」宣布「通義千問Qwen 2.5-Max」29日凌晨上線。(圖擷取自網路)

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

圖 impressionimpression
國際今日熱門
看更多!請加入自由時報粉絲團

網友回應

載入中
此網頁已閒置超過5分鐘,請點擊透明黑底或右下角 X 鈕。