快訊

再熱7天...這日天氣最不穩 北台灣午後慎防局部豪雨

北市長庚醫院旁公車起火!警消馳援撲救起火原因未明

「老狐狸」蕭雅全遭控性騷!劉冠廷哽咽首發聲:震驚

學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效

(首圖來源:pixabay)
(首圖來源:pixabay)

【文‧林妤柔】

J.K. 羅琳的《哈利波特》在全球造成轟動,現在學術界正使用這套暢銷書來測試生成式 AI 系統如何學習和提供資訊。

根據彭博社報導,越來越多研究人員利用《哈利波特》來試驗生成式 AI 技術,因為該系列影響力深遠,書中又有廣泛的語言數據和複雜的文字遊戲。透過回顧《哈利波特》一系列研究和學術論文,能了解 AI 前沿研究,以及該技術面臨的最棘手問題。

最近在論文〈誰是哈利波特?LLMs 近似反學習〉(Who's Harry Potter? Approximate Unlearning in LLMs)中揭露大型語言模型(LLM)選擇性遺忘訊息的新技術。由於 AI 聊天機器人建立在大量線上數據上,可能包括受版權保護的資料和有誤內容,導致 AI 公司面臨侵權訴訟或大眾監督問題。

因此這篇論文作者、微軟 Azure 技術長 Mark Russinovich 和 Ronen Eldan 已證明,可對 AI 模型進行修改或編輯,刪除任何有關《哈利波特》一書中存在的知識,包括人物和情節,而不會影響 AI 系統的整體決策和分析能力。

Russinovich 和 Eldan 表示,之所以選擇《哈利波特》是因為他們耳熟能詳。Russinovich 表示,「研究界會更容易評估我們的技術所產生的模型,並親自確認內容確實已經被『消除學習』」。

另項研究中,西雅圖華盛頓大學、加州大學柏克萊分校和艾倫研究所的研究人員開發新語言模型「Silo」,可刪除數據以降低法律風險。不過他們在稍早發布的論文中提到,如果只在版權過期書籍或政府檔案等低風險文本上進行訓練,模型性能會明顯下降。

為深入研究,研究人員利用《哈利波特》來研究單篇文本是否影響 AI 系統性能。他們創建兩個資料儲存庫,即網站和文檔的集合。第一個資料儲存庫包括除了《哈利波特》第一部以外所有已出版書籍;另個資料庫包括除第二部以外的所有系列書籍,以此類推。

研究人員發現衡量 AI 模型的準確性標準時,當《哈利波特》從資料儲存庫中移除,困惑度會變更加嚴重。

在開放存取的科學研究資料庫 arXiv 上,與《哈利波特》有關的最新論文包括〈霍格華茲魔藥開發的機器學習〉(Machine learning for potion development at Hogwarts)、〈大型語言模型與《哈利波特》的相遇〉(Large Language Models Meet Harry Potter)和〈用基於 Transformer 模型的人工智慧檢測奇幻文學中的咒語〉(Detecting Spells in Fantasy Literature with a Transformer Based Artificial Intelligence)。

AI 研究引用《哈利波特》至少已有十年之久,但隨著學術界和技術專家將重點放在能處理自然語言並給出相關答案的 AI 工具上,情況變得越來越普遍;即使不是研究的核心內容,《哈利波特》也是研究人員最喜歡參考的文學作品。

【本文章由科技新報授權提供,更多精彩內容請詳科技新報官網

延伸閱讀

列車速速前?英國「霍格華茲特快車」雅各派號蒸汽火車的安全隱憂

《波西傑克森》小說改編 與《哈利波特》齊名的奇幻經典

「31冰淇淋聯名哈利波特」開賣了!買再送蜂蜜公爵造型毛毯

不用再窩在組合屋了 苗栗市文山國小魔法學校8日開課

相關新聞

你知道NVIDIA 的正確唸法嗎?名字來自羅馬神話這位「女神」

輝達(NVIDIA)執行長黃仁勳來台掀起炫風,市值更是一度突破3兆美元衝全球第二大,但你知道 NVIDIA 正確唸法嗎?國際媒體近來研究,其實 NVIDIA 的發音是「en-VID-eeyah」,而不是人們以為的「NUH-vid-eeyah」,且取名是由羅馬神話忌妒女神「invidia」演變而來。

全球首款牙齒再生注射藥物 9月人體臨床實驗

全球首款牙齒再生藥物,今年 9 月至明年 8 月將於日本京都大學醫院進行人體臨床實驗,測試能否和之前動物試驗結果一樣成功長出新牙。

揭開不生真相 聯合國:生育率下墜是因為財務焦慮

不結婚生孩子、結了婚不生孩子,或是傳統的結婚生子,現在都可被社會接受,社會學家認為,這是這一代年輕人更自由的象徵,他們可以擺脫傳統約束,選擇自己想要的生活模式。但這種說法可能無法反映社會現實,聯合國報告一針見血的指出,全球年輕人都不再想要多生孩子,原因不是自由意志,而是他們怕沒錢。

年輕不是本錢 分析:畢業生面臨40年來最糟就業市場

畢業後進入穩定企業上班,幾乎是不需思索的人生路線,但現在這條路可能不太好走。年輕就業市場面臨 40 年來最糟糕的境地,《紐約時報》過去幾個月訪談經濟學家、企業高層和年輕求職者後,發現一個令人不安的結論,即初階工作職缺愈來愈少,至少在一定程度是被 AI 快速進步害的。

助解釋人腦龐大記憶儲存容量 研究:星形膠質細胞可能是關鍵

星形膠質細胞過去被認為是大腦「管家」,主要負責支持神經細胞儲存記憶、處理思想。但新研究表明星形膠質細胞不只是幕後角色,其數量、參與大腦儲存記憶過程的程度可能超乎想像。

從「狼人」到「鼠人」 年輕人拒絕就業將衝擊廣泛

讀書是為了謀得好工作,畢業就進入職場,應該是每個年輕人不需思索的任務。但現在不一樣了,年輕人畢業後不急著找到一份正職,而是過著對自己而言更平衡的生活,專家稱,這可能是幾十年來最重要的文化轉變。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。