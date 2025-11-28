AI晶片公司Kneron耐能26日發表第七顆AI旗艦產品KL1140 ，號稱全球首款在終端完整執行Mamba架構模型的NPU，創辦人暨執行長劉峻誠表示未來兩年終端裝置LLM應用將出現爆發力，預告2026年會與國際大型生態玩家合作，切入穿戴裝置戰場，旺宏（2337）、鈺創、九元董事長都出席站台。

AI晶片戰場不斷變化，NVIDIA帶頭開始切入系統供應鏈，晶片業者也紛紛效尤垂直整合，從晶片做到系統，從上游往下游應用解決方案延伸，拚完整生態系也拚效能，耐能26日舉行發表會，對外發布從終端到雲端的完整AI基礎設施計畫，劉峻誠也預告要從純AI晶片供應商進化為AI基礎建設公司（AI Infrastructure Company）。

最特別的是，記者會現場出現幾位科技業大老站台，包括旺宏董事長吳敏求、九元董事長汪秉龍、鈺創董事長盧超群等，旺宏跟鈺創是耐能的記憶體供應商，九元則是測試夥伴，另外旺宏也是耐能股東之一。

耐能除發表首款能在終端完整執行Mamba的NPU「KL1140」，號稱業界第一顆可於終端設備完整運行Mamba神經網路的邊緣AI晶片，劉峻誠表示，看好未來1～2年將有許多智慧裝置在市場大量出現。

KL1140在能效上達到現有雲端方案3倍效能、但成本下降10倍，劉峻誠表示，在雲的算力方面已被GPU主宰，但NPU在端的LLM應用上將具領先優勢。

劉峻誠表示，模型在雲端算力做訓練，但當大家模型訓練得差不多，後面就是推論的應用，但「現在大家用的是有史以來最貴的推論算力」。他表示，現在訓練需求讓GPU算力愈來愈大，但當推論需求快速主導市場時，GPU一點優勢都沒有。

耐能也發表Klink作為晶片跟晶片間的傳輸技術，透過四顆KL1140並聯，可支援運行高達1,200億參數的模型，功耗僅為傳統GPU的三分之一。劉峻誠看好未來兩年邊緣AI將因模型變小，與NPU算力出現黃金交叉，帶動邊緣AI應用大幅揚升。

劉峻誠也宣布3年（至2028年）的高中低階多款新晶片規畫，總計達5～6顆，他透露這是因為耐能終於打破重圍，與一家國際一線大廠合作，參與制訂生態系統，其次耐能也從模組做到軟體工具，第三是推出整合模型應用的系統，打入醫療院所及主權AI（國泰醫院、榮總、丹佛大學），雲則是獲得中華電信採用，最後是宣布耐能已經成為一個集團公司。