快訊

悲劇!北市公車停讓行人再起步 碰撞女騎士捲入車底亡

賓士男酒駕撞死女清潔員…南檢聲押 警加強巡邏防其鹽酥鴨店面被砸

明天清晨低溫11度!這日東北季風緊接而來 台北馬周末開跑水氣增

IBM發表可大幅減少記憶體用量的「小語言模型」 Granite 4.0

IBM發表「中小企業友好」的AI小語言模型Granite 4.0,大幅降低記憶體的使用量達七成,推理速度加快2倍,同時支援更平價的GPU包括家用硬體。圖/IBM提供
IBM發表「中小企業友好」的AI小語言模型Granite 4.0,大幅降低記憶體的使用量達七成,推理速度加快2倍,同時支援更平價的GPU包括家用硬體。圖/IBM提供

IBM日前發表其最新一代企業級「小語言模型」Granite 4.0,以創新的混合式架構 — 結合Mamba-2與Transformer技術,實現前所未有的效能與效率。Granite 4.0不僅大幅降低記憶體與硬體成本,更提供企業部署AI的安全性、可控性與彈性,為台灣各類型企業的AI應用落地提供強力支援。這一代模型優化了處理Agentic工作流程核心任務的能力,無論是獨立部署,或作為大型推理系統中的高效模組,皆能發揮關鍵作用。

Granite 4.0採用創新的Mamba/Transformer混合架構,突破傳統Transformer模型處理長文本的效能瓶頸。Mamba架構可線性擴展上下文長度,讓Granite 4.0在處理複雜任務時,大幅減少記憶體的使用量達70%,推理速度卻加快二倍,同時支援更平價的GPU包括家用硬體。這項突破對台灣中小企業與開發者意味著高效能AI不再是高成本的同義詞,而是人人可及的技術資源。

Granite 4.0已在IBM watsonx.ai平台正式上線,並同步支援Dell Technologies(Dell Pro AI Studio與Enterprise Hub)、Docker Hub、Hugging Face、Kaggle、LM Studio、NVIDIA NIM、Ollama、OPAQUE及Replicate等平台;未來也將支援Amazon SageMaker JumpStart與Microsoft Azure AI Foundry。

Granite 4.0提供多種模型規格,靈活應對不同場景;並預計於2025年底推出強化邏輯推理的Thinking模型。

AI IBM

延伸閱讀

蓋牌市場、堅信黃董?專家:力積電(6770)轉型晶圓代工只是過程、不是快樂終點

記憶體搶搶滾還可以買?法人曝這四大概念股都不預設高點

記憶體族群齊揚 群聯創新天價華邦電漲停登24年高

記憶體族群火熱!華邦電漲停衝逾24年高 群聯寫天價

相關新聞

高盛:金價漲勢還沒結束 因這群人幾乎還沒買

今年黃金破紀錄的漲勢佔據新聞版面,但高盛集團表示,這種貴金屬的價格或許還有很多上漲空間,因為美國投資人幾乎尚未持有這項資...

台積電成美國「非官方國家隊」?紐時:川普布局讓台積處境艱難

紐約時報報導,台積電先前爆出離職員工洩密案,最近又傳出前高層羅唯仁疑「帶槍投靠」英特爾,引發台灣政府首次援引修法後的國家...

川普突解禁H200內幕曝光!白宮驚覺華為AI系統追上輝達 還有這一震撼

根據一位知悉討論內情的人士透露,美國總統川普之所以決定允許輝達(Nvidia)向中國大陸出售H200晶片,是因為考量到中...

債蛙終於要出頭天?Fed主席大熱門:10年期殖利率下跌空間很大

被視為美國聯準會(Fed)下任主席頭號人選的白宮經濟顧問哈塞特(Kevin Hassett)表示,預先規劃未來六個月利率...

空巴步上波音後塵?A320系列召修後又證實鑲板品質問題

在召修陸續完成後,卻又發生A320因機身鑲板品質問題而延遲交付,空巴在12月2日證實,最多有628架飛機可能受影響。

不是晶片!黃仁勳點出AI未來發展主要瓶頸 估科技業者將這樣解決

輝達執行長黃仁勳表示,抑制人工智慧(AI)未來發展的將不是晶片而是電力,科技巨擘預料將開始以自家核能反應爐向旗下資料中心...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。