快訊

朝野僵局仍難解!選罷法覆議遭否決 總預算協商瀕破局

大雨炸元宵!氣象署:今慎防劇烈天氣 周日恐再迎冷氣團

第四人遇害?高雄分屍案凶嫌弟也失蹤 警澄清:張弟因案通緝中

AI發展卡關 業者摸索新模式

隨著用來訓練人工智慧(AI)的大型語言模型(LLM)進步速度變慢,OpenAI和其他AI業者正透過開發新的訓練方法,尋求克服AI模型發展瓶頸的方式,這可能重塑AI硬體的競爭版圖。

路透報導,ChatGPT問世後,科技業者不斷對外宣稱,透過更多數據和算力來「擴大」現有模型,定能持續改善模型。如今一些最傑出的AI科學家卻說,這個「大就是好」的觀點有其限制。

LLM每一輪的訓練都可能耗費數百萬美元,也較容易出現由硬體造成的故障,且研究人員要在可能長達數個月的訓練期結束後,才知道模型的最終效能。

另外,LLM需要大量數據,而目前的AI模型已用盡世上所有容易取得的數據。再者,訓練模型需要大量能源,各地電力短缺的情況,也使訓練受阻。

為克服這些困難,研究人員正探索一個能在推論階段,提升現有AI模型的方法,稱為「測試時運算」(test-time compute)。此方法讓AI模型能將更多力氣用在特定的困難任務上。

OpenAI已在其最新發表的模型「o1」中使用此方法。o1能用類似人類推理的方式,多步驟「思考」問題。知情人士表示,其他AI業者如Anthropic、xAI和Google DeepMind,也都開始發展這種方法的自家版本。

OpenAI 科學家 語言

延伸閱讀

新光人壽運用AI提升風險識詐能力 打造完善保險生態圈

翔耀搶攻AI算力商機 明年營收拚增三倍

創想AI/生成式AI為產業帶來的機會與挑戰

專欄/葉肇元:AI引路 革新臨床病理診斷

相關新聞

不甩川普施壓降息!關稅政策恐釀通膨 聯準會利率按兵不動

美國聯邦準備理事會(Fed)今天在2025年首場政策會議上,宣布利率按兵不動,即便美國總統川普(Donald Trump...

NVIDIA 暴跌後急發聲明:DeepSeek 的進展證明需要更多輝達晶片

輝達(NVIDIA)周一(27日)表示,中國大陸 AI 公司 DeepSeek 取得的進展,顯示出輝達晶片對大陸市場的可...

C919將飛出陸國境? 越南政府:考慮取消監管障礙允商飛飛機在越南運營

大陸觀察者網報導,據越南通訊社,1月15日,越南政府表示,將考慮取消監管障礙,允許中國商飛公司生產的飛機在該國運營。而路...

鴻海推一把 本田、日產汽車加速談合併

日本經濟新聞與讀賣新聞報導,本田與日產汽車將討論合併,而促成這項汽車業歷史性變化背後,隱藏著台灣鴻海的身影。鴻海有意收購...

美國11月CPI符合預期 市場估Fed下周仍將降息1碼

美國11月消費者物價指數(CPI)月增0.3%、年增2.7%,升幅完全與預期相符,在就業市場降溫之際,市場預期聯準會(F...

英特爾執行長基辛格退休 股價盤前漲逾4%

英特爾2日宣布,執行長基辛格退休,12月1日生效。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。