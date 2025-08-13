華為AI推理技術亮相 有望降低對HBM技術的依賴

經濟日報／ 記者林茂仁／綜合報導

華為昨（12）日發表AI推理創新技術─推理記憶數據管理器（UCM），這項突破性成果有望降低中國大陸AI推理對高頻寬記憶體（HBM）技術的依賴，提升大陸AI大模型推理性能，打破美國封鎖大陸取得HBM的瓶頸。而華為也宣布該技術將9月正式開源（開放程式碼）。

美中科技戰方興未艾，美國早在去年就限制大陸取得先進HBM，HBM是AI晶片的心臟，負責資料高速傳輸，其性能直接決定AI算力集群效率，美國智庫CSIS專家指出，HBM約占先進AI晶片成本的50%，封鎖HBM可大幅延緩華為等陸企的AI晶片開發進程。

新浪財經報導，華為昨天參加2025金融AI推理應用落地與發展論壇，首度推出的UCM是一款以KV Cache（已計算的先存起來，下次直接拿來用不必再重算）為中心的推理加速套件，融合多類型緩存加速演算法工具，透過分級管理推理過程中產生的KV Cache記憶數據，擴大推理上下文窗口，實現高吞吐、低延時的推理體驗。

據了解，HBM作為解決數據搬運問題的關鍵技術，在AI推理過程中扮演著舉足輕重的角色。當HBM資源不足時，用戶在使用AI推理時會明顯感受到體驗下降，任務卡頓、回應緩慢等問題接踵而至。

UCM技術透過優化KV Cache記憶資料管理，使首每個文字單位（Token）時延最大降低90%，同時降低Token的推理成本。

這項技術發表正值AI產業從「追求模型能力的極限」轉向「追求推理體驗的最優化」的關鍵節點，推理體驗直接關聯用戶滿意度和商業可行性，成為衡量模型價值的重要標準。

推理 美國

延伸閱讀

銷陸前景坎坷 彭博：北京勸阻企業採用輝達H20晶片

SEMI：矽晶圓可能吃緊 HBM滲透率25%是轉折點

美光調升財測！台記憶體股狂飆 南亞科鎖定 AI 終端市場迎來新爆發

美光上調財測 法人：台股記憶體族群受惠有限

相關新聞

美光陸廠驚傳裁員 全球戰略調整 陸市場業務亮出收縮信號

大陸科技媒體芯智訊、界面新聞等報導，半導體業界最新爆料稱，美國記憶體大廠美光近日開始在中國大陸進行裁員。外界解讀，此次人...

陸救內需 補貼消費貸款利息 可望帶動經濟增長

大陸為刺激內需消費祭出大招，由財政部等多部門聯合發布促消費方案，包括為服務業經營主體及個人消費提供貸款貼息。分析指出，面...

受惠DeepSeek-R2將發表 陸AI晶片第一股 寒武紀飆漲

在傳出大陸官方敦促國內企業避免使用輝達H20晶片後，加上市場傳聞DeepSeek-R2發布時間將屆，滬深半導體晶片股昨（...

彭博：陸官方促企業勿用輝達H20

彭博報導，知情人士透露，中國大陸官方已敦促國內企業避免使用輝達的Ｈ20晶片，尤其是政府相關用途。輝達正試圖挽回在大陸市場...

華為AI推理技術亮相 有望降低對HBM技術的依賴

華為昨（12）日發表AI推理創新技術─推理記憶數據管理器（UCM），這項突破性成果有望降低中國大陸AI推理對高頻寬記憶體...

全球人形機器人 明年將大量交貨

2025世界機器人大會近日於北京召開，多位業界人士表示，受技術進步、政策驅動、資本熱潮等多重因素影響，具身智能商業化步伐...

商品推薦

udn討論區

0 則留言
規範
發布
  • 張貼文章或下標籤，不得有違法或侵害他人權益之言論，違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論，經網友檢舉或本網站發現，聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者，請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤，聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者，請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利，聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者，請勿張貼文章。