快訊

攻占主席台被推下!沈伯洋「頭部重摔倒地」畫面曝光 救護車緊急送醫

台中傳溺水意外!19歲高三生河堤嬉戲落水 無呼吸心跳急救中

訓練人工智慧 資料不夠用

祖克柏宣稱,Meta在旗下平台可取得的資源是該公司在AI發展上的一大優勢。(路透)
祖克柏宣稱,Meta在旗下平台可取得的資源是該公司在AI發展上的一大優勢。(路透)

爭相開發更強大人工智慧(AI)的企業很快就會遭遇一個新難題:比起他們的遠大計畫,網際網路太小了。

網路資源供不應求的主要原因是,有些資料所有人不讓AI公司透過網際網路取用他們擁有的資料,而網際網路上優質的公共資源也不多。有的AI業界高階主管與研究人員認為,符合AI訓練所需的高品質文本資料,可能在兩年內就會出現供應短缺問題,拖累AI發展速度。

知情人士說,AI公司已在尋找尚未開發的資料來源,也重新思考該如何訓練AI系統。ChatGPT開發商OpenAI就討論過,將公開的YouTube影片內容轉換成腳本,拿來訓練公司的下一代AI模型GPT-5。也有公司嘗試使用AI生成的資料(也稱「合成資料」)作為訓練材料,不過許多研究人員說,這種方法實際上可能會造成系統嚴重故障。

AI公司物色所需資料通常都秘密進行,業者相信,這些手段都攸關競爭優勢。

目前AI語言模型是使用取自網際網路的文本所建立,收進來的材料被分解成詞元(token),AI模型用它們來學習如何構建出類似人類的表達。

OpenAI沒有透露過目前最先進的語言模型GPT-4的詳細訓練材料。根據AI研究專家維拉羅伯推估,GPT-4的訓練素材應該已經多達12兆個詞元;而根據一個電腦運算擴展定律,如果繼續遵循當前軌跡,像GPT-5這樣的AI系統將需要60兆到100兆個詞元的資料。

Meta Platforms執行長祖克柏最近宣傳了公司可由自家旗下各平台獲取資料的能力,認定這將會是Meta發展AI的一大優勢。他說,Meta可以挖掘旗下Facebook、Instagram等網站上,數以千億計公開分享的圖片和影片,總量大於多數常用的資料集。不過數量雖大,但還不清楚有多大比率會被視為高品質資料。

OpenAI執行長奧特曼則說過,OpenAI正在研究訓練未來AI模型的新方法。他去年在一場會議上提到,「我認為我們正處於那種模型要很大、很大的時代的末期;我們會用其他方法讓AI系統變得更好」。

OpenAI 材料 網路

延伸閱讀

MLB/大谷沒轟照寫百年紀錄 葛拉斯諾7局14K沒保送更狂

科技界重量級「交換球衣」!祖克柏穿上黃仁勳招牌皮衣 似乎小了一號

恐比華爾街預設還久 分析師參觀德州工廠:特斯拉可能要三年後才有戲唱

MLB/誰搭大谷熱成日本新男神?道奇兩位「飄髮哥」被點名

相關新聞

新加坡新總理黃循財上任前表態反台獨 否認是美國盟友

15日晚間接任新加坡總理的黃循財6日接受《經濟學人》專訪,內容8日刊出。被問及在美中爭霸時新加坡的立場為何,黃循財回答:...

路透:美台4月悄悄在西太平洋舉行聯合軍演

路透引述4名知情人士的話報導,美國和台灣海軍4月悄悄在西太平洋舉行聯合軍演,但官方並未對外宣布,顯示美台在中國軍事威脅不...

立陶宛大選首輪結果出爐 現任總統44%得票率未過半 決選將在5/26

路透報導,立陶宛12日舉行總統大選第一輪投票,59歲的現任總統瑙塞達(Gitanas Nauseda)以44%得票率領先...

美對陸電動車關稅 擬調漲三倍

華爾街日報、紐約時報及美聯社等美媒十日引述美國官員和知情人士報導,拜登政府擬於十四日宣布將對中國大陸電動車關稅增加三倍,...

又是波音!美聯航客機起飛5分鐘緊急折返 福岡機場一度關閉跑道

共同社報導,日本國土交通省和警方指出,美國聯合航空公司一架波音737-800客機10日上午從日本福岡飛往美國關島,但起飛...

別亂吃!印度19歲男吃路邊攤沙威瑪 「4天送3次急診」仍身亡

印度一名19歲少年日前在孟買特隆貝區(Trombay area)路邊攤買了沙威瑪來吃,結果沒多久就出現胃痛和嘔吐等症狀,...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。