與國際大模型價格對標 智譜發布開源模型GLM-5.1提價10%

大陸通用大模型開發商智譜8日正式發布新一代開源模型「GLM-5.1」。據人工智慧(AI)模型服務平台OpenRouter顯示,伴隨這次發布,智譜GLM再度提價10%。調價後,GLM-5.1在Coding場景的緩存命中Token價格,已接近美國AI科企Anthropic旗下Claude Sonnet 4.6水準。
智譜8日在微信公眾號指出,從3分鐘的Vibe Coding(氛圍程式設計)到30分鐘的Agentic Engineering(AI代理工程),再到本次帶來的8小時Long-Horizon Task(長程任務),GLM-5.1再次取得突破。智譜號稱,GLM-5.1是迄今最智能的旗艦模型,也是全球最強的開源模型,程式碼能力大幅提升,能在一次任務中持續自主工作超過8小時,期間自主規劃、執行、自我進化,最終交付完整工程級成果。
在程式設計能力方面,GLM-5.1在SWE-bench Pro、Terminal-Bench 2.0、NL2Repo三大代碼評測基準的綜合平均分中,取得全球第三、大陸國產第一、開源第一;在最接近真實軟件開發的SWE-bench Pro測試中,更實現大陸國產模型首次超越Opus 4.6,刷新全球最佳成績。
長程任務是GLM-5.1的一大突破。智譜透露,GLM-5.1是唯一達到8小時持續工作的開源模型,其在「8小時從零構建Linux桌面」任務中,模型歷時8小時完成超過1200步操作,最終產出完整桌面系統,包括窗口管理器、狀態欄、應用程式、VPN管理器、中文字體及遊戲庫等,相當於一個四人團隊一周的開發工作量,且全程無人工干預。同時,GLM-5.1也是全球除Claude Opus 4.6外,少數具備該長程能力的模式。
在向量數據庫優化及工具調用任務中,GLM-5.1也展現自主迭代與策略切換能力。模型在655次迭代中完成全庫掃描、IVF分桶召回、半精度壓縮、量化粗排、兩級路由等整套流程,將向量數據庫查詢吞吐量從3108 QPS提升至21472 QPS,增幅達6.9倍。
IT之家提到,GLM-5.1是目前全球唯一能持續工作8小時的開源模型,突破了以分鐘級交互為主的局限,可在單次任務中自主拆解任務、反覆試錯、修復問題,最終完成完整工程級成果。
報導還指,這是大陸國產大模型首次在核心場景實現與海外頭部製造商的價格對齊。從一年前產業內普遍以降費90%以上的方式爭奪市占率,到如今以性能溢價錨定國際基準,有關變化顯示大陸國產模型正逐步擺脫單純依賴低價競爭的路徑,開始以性能對標國際水準,正式進入價值定價的新階段。

贊助廣告
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。





