輝達（NVIDIA）傳出計劃推出一款全新晶片，專為協助OpenAI等客戶打造更快速、更高效率的人工智慧（AI）工具。做為AI晶片龍頭，輝達的這項重大業務調整，勢將重塑AI競賽的格局。

知情人士向華爾街日報透露，輝達設計了一套全新的「推論」（inference）運算系統，這套新系統平台整合了新創公司Groq所設計的晶片，預定在3月舉行的輝達GTC開發者大會上亮相。

一些消息人士表示，OpenAI已同意成為輝達新顆新推論晶片的最大客戶之一。若真如此，這將是輝達的一大勝利。因為過去多個月來，OpenAI一直在尋找比輝達晶片更高效率的替代方案，上月還與晶片新創公司Cerebras簽署了價值數十億美元的算力合作協議，Cerebras的專長正是推論晶片。

推論運算是一種讓AI模型能回應查詢的處理方式；現在這種運算方式已成為業界激烈競爭的領域。Google與亞馬遜（Amazon）均已在這方面設計出可與輝達旗艦系統抗衡的晶片。

周五（27日）稍早，OpenAI宣布獲得輝達300億美元投資，並將向輝達大規模採購「專用於推論的算力」，其實已暗示了輝達新的推論處理器的存在。

過去一年來，隨著企業加速部署AI代理及其他AI工具，市場對高階運算的需求已從訓練轉向推論。AI代理，是一種相對能更自主代表使用者執行任務的AI系統。

輝達執行長黃仁勳一向主張，輝達的繪圖處理器（GPU）在訓練與推論兩方面皆為市場領導者，強調輝達晶片的多功能性，正是公司產品的核心吸引力所在。

然而，許多開發與營運AI代理的公司發現，輝達GPU成本過高、耗能過大，且未必最適合實際應用。部分輝達的大型客戶就發現，某些AI代理的工作，只以CPU執行，反而更有效率。輝達因而面臨壓力，必須開發成本較低、能源效率更高的推論晶片。

輝達新的推論運算系統要整合Groq晶片，雙方合作成形於輝達去年底同意以200億美元，取得Groq的關鍵技術授權，同時延攬Groq的高層團隊。Groq是以「語言處理單元」為架構設計晶片，在推論功能上具有高度效率。