快訊

暴衝逆向撞公所!桃園無辜2行人遭撞命危 驚悚畫面曝光

你用過哪一個? 從MSN、Skype到Teams 那些年遇過的轉移Bug魔咒

公幼海嘯/全數招滿 熱門幼兒園「軟實力」打動家長

字節跳動旗下「豆包」新模型架構 推理成本最多降83%

字節跳動字節跳動旗下「豆包大模型」Foundation團隊,近期提出一種全新的稀疏模型架構「UltraMem」,推理成本最高可降低83%。路透
字節跳動字節跳動旗下「豆包大模型」Foundation團隊,近期提出一種全新的稀疏模型架構「UltraMem」,推理成本最高可降低83%。路透

字節跳動旗下「豆包大模型」Foundation團隊,近期提出一種全新的稀疏模型架構「UltraMem」,該架構在保證模型效果的前提下,推理速度較傳統的MoE(專家混合模型)架構提升2到6倍,推理成本最高可降低83%。

陸媒財聯社報導,這項創新成果已被機器學習和AI領域的頂級會議ICLR 2025接收,為解決大模型推理效率和擴展能力問題提供了全新思路。

大模型的推理能力,對應的是端側AI應用/工具的回應能力和速度。隨著模型規模的擴大,推理成本和訪存效率已成為限制大模型規模應用的關鍵瓶頸。

在Transformer架構下,模型的性能與參數數量和計算複雜度呈對數關係。隨著LLM規模不斷增大,推理成本會急劇增加,速度變慢。

為了解決計算問題,先前的研究者提出MoE和PKM(Product Key Memory)方案,但都有各自侷限性。包括MoE架構犧牲了效率、PKM架構犧牲了效果,這些侷限性使得MoE和PKM在推理效率、模型效果和擴展能力等方面的優化空間仍需進一步探索,UltraMem正是為了解決上述缺點。

UltraMem參考了PKM的設計,但針對PKM的缺陷予以補充,優勢主要在於降低推理成本、提升推理速度、保持模型效果。

豆包研究團隊在151M、680M、1.6B三個不同規模的模型上進行了廣泛的實驗。實驗結果顯示,UltraMem在模型效果和推理速度方面均優於MoE和PKM架構,且在680M、1.6B上具有顯著的效果優勢。

報導提到,無論是訓練端還是推理端,當大模型廠商「捲」起成本,代表AI應用將在未來更加高效易用;當推理成本大幅降低,將助推AI技術在更多領域的應用成為可能,尤其是對於資源受限的場景,如邊緣計算和移動設備等,能讓更多企業和開發者有能力使用和部署AI模型。

團隊 推理

延伸閱讀

佳士得首場AI藝術拍賣會掀爭議 逾4千人連署籲取消

台灣公務機關禁用DeepSeek 陸國台辦:「反中」意識作祟

如何看待DeepSeek?鴻海董座劉揚偉這樣說

人數再創新高!「聲優名鑑 2025 年女性篇」收錄1099人 與24年前相差近五倍

相關新聞

川普有2王牌沒出手? BBC:關稅戰 中握消費市場等5籌碼

美中關稅戰硝煙瀰漫,中國多次喊話「打,奉陪到底、談,大門敞開」。英媒盤點北京手握五籌碼叫陣華盛頓,包括消費市場潛力、高科...

陸擬適時降準降息 穩外貿增消費

因應關稅戰,中共中央政治局昨天召開會議,分析當前經濟形勢和工作,由中共總書記習近平主持。會議提到要強化底線思維,充分備足...

「重創緬北電詐集團」 緬甸移交920多名電信詐騙嫌犯給大陸

大陸公安部微信公眾號23日稱,近日,緬甸執法部門將前期在緬撣邦南部當陽、勐休等地抓獲的920多名陸籍涉詐犯罪嫌犯,透過雲...

關稅已達245%?陸外交部連2天發聲:再玩數字遊戲將不予理會

美中貿易戰持續延燒,美國白宮15日一份針對232條款的相關事實清單(fact sheet)中提到,由於大陸採取報復行動,...

白宮指中國關稅上看245% 中國外交部:無實際意義

針對美國白宮表示,中國輸美商品已面臨最高245%的關稅,中國外交部今天上午以未署名的發言人表示,美方對中輪番加徵關稅已經...

小米SU7車禍引關注 陸新規要求「電動車電池不起火不爆炸」

小米SU7電動車日前在大陸高速公路爆燃事件導致3名乘客喪命,受到高度關注。電動車安全標準成為大陸汽車工業最急迫的優先事項...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。