學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效

(首圖來源:pixabay)
(首圖來源:pixabay)

【文‧林妤柔】

J.K. 羅琳的《哈利波特》在全球造成轟動,現在學術界正使用這套暢銷書來測試生成式 AI 系統如何學習和提供資訊。

根據彭博社報導,越來越多研究人員利用《哈利波特》來試驗生成式 AI 技術,因為該系列影響力深遠,書中又有廣泛的語言數據和複雜的文字遊戲。透過回顧《哈利波特》一系列研究和學術論文,能了解 AI 前沿研究,以及該技術面臨的最棘手問題。

最近在論文〈誰是哈利波特?LLMs 近似反學習〉(Who's Harry Potter? Approximate Unlearning in LLMs)中揭露大型語言模型(LLM)選擇性遺忘訊息的新技術。由於 AI 聊天機器人建立在大量線上數據上,可能包括受版權保護的資料和有誤內容,導致 AI 公司面臨侵權訴訟或大眾監督問題。

因此這篇論文作者、微軟 Azure 技術長 Mark Russinovich 和 Ronen Eldan 已證明,可對 AI 模型進行修改或編輯,刪除任何有關《哈利波特》一書中存在的知識,包括人物和情節,而不會影響 AI 系統的整體決策和分析能力。

Russinovich 和 Eldan 表示,之所以選擇《哈利波特》是因為他們耳熟能詳。Russinovich 表示,「研究界會更容易評估我們的技術所產生的模型,並親自確認內容確實已經被『消除學習』」。

另項研究中,西雅圖華盛頓大學、加州大學柏克萊分校和艾倫研究所的研究人員開發新語言模型「Silo」,可刪除數據以降低法律風險。不過他們在稍早發布的論文中提到,如果只在版權過期書籍或政府檔案等低風險文本上進行訓練,模型性能會明顯下降。

為深入研究,研究人員利用《哈利波特》來研究單篇文本是否影響 AI 系統性能。他們創建兩個資料儲存庫,即網站和文檔的集合。第一個資料儲存庫包括除了《哈利波特》第一部以外所有已出版書籍;另個資料庫包括除第二部以外的所有系列書籍,以此類推。

研究人員發現衡量 AI 模型的準確性標準時,當《哈利波特》從資料儲存庫中移除,困惑度會變更加嚴重。

在開放存取的科學研究資料庫 arXiv 上,與《哈利波特》有關的最新論文包括〈霍格華茲魔藥開發的機器學習〉(Machine learning for potion development at Hogwarts)、〈大型語言模型與《哈利波特》的相遇〉(Large Language Models Meet Harry Potter)和〈用基於 Transformer 模型的人工智慧檢測奇幻文學中的咒語〉(Detecting Spells in Fantasy Literature with a Transformer Based Artificial Intelligence)。

AI 研究引用《哈利波特》至少已有十年之久,但隨著學術界和技術專家將重點放在能處理自然語言並給出相關答案的 AI 工具上,情況變得越來越普遍;即使不是研究的核心內容,《哈利波特》也是研究人員最喜歡參考的文學作品。

【本文章由科技新報授權提供,更多精彩內容請詳科技新報官網

延伸閱讀

全球排名TOP 4授權商:華納兄弟探索集團談國際IP應用

列車速速前?英國「霍格華茲特快車」雅各派號蒸汽火車的安全隱憂

《波西傑克森》小說改編 與《哈利波特》齊名的奇幻經典

「31冰淇淋聯名哈利波特」開賣了!買再送蜂蜜公爵造型毛毯

相關新聞

專家也錯估形勢 調查:現在想離職者比「大辭職」年代還多

生活成本急劇上升,人工智慧進逼與前兩年過度招聘,許多行業員工面臨裁員威脅。經濟學家認為,與兩年前大辭職熱潮相反,現在許多求職者者不高喊薪資福利,只求有份安穩的工作,但一項調查發現,完全錯估勞工心態,今年想辭職的人比大辭職時代更多。

塑膠添加細菌孢子 研究:「活塑膠」五個月內自我毀滅

最近研究發現,回收箱中的塑膠大部分都沒有被回收再利用,而是飄流世界各地,成為別的國家或是海洋的垃圾。包括聚氨酯 (PU) 這種製造手機殼到運動鞋的各種產品,也很少被回收。人類已經很難擺脫塑膠,最近科學家想出一個類似科幻小說的解決方案,在塑膠製造過程中加入細菌孢子,可以生產出自我毀滅的塑膠。

新階級鬥爭正在成形 研究:千禧世代貧富差距擴大

疫情後千禧世代因為資產增值,家庭財富暴增,擺脫十年內兩次經濟衰退的影響,但是最新研究發現,千禧世代之間的貧富差距是任何一代人中最大的,新一波的階級緊張和怨恨正在成形,由於差距過大,因此談論千禧一代的平均財富並沒有特別意義。

為何機器人跑不贏動物 研究:硬體強但整合遠不如生物

人工智慧系統、新型合成材料和 3D 列印尖端技術,製造出能測量體育場的機器狗、受長腿爸爸啟發的探索機器人等各種機器動物分身。但儘管投資龐大資源,機器人仍跑不過動物,科學家解釋,因機器人各功能整合能力遠不如動物。

營養價值高又好照顧 蟒蛇會是超級食物嗎?

蟒蛇生長速度快,富含蛋白質,其實是不錯的肉類來源。最近美國麥覺理大學團隊研究發現,與雞和牛隻相比,蟒蛇的飼料轉化率相當高,是高效、低排放且具有氣候韌性食物來源。不過前提是要可以接受食蛇。

物價壓力釀生存危機 韓國年輕人開始學習節儉

尚未背負成家壓力的年輕族群,一直以來都是奢侈品消費的主力之一,他們也不吝於上高檔餐廳揮霍金錢,在公共場合炫耀財富,但在通膨高漲的時代,現在韓國年輕人感到迫切的生存危機,開始學習節儉度日。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。