趙坤茂/AI盜書練神功 回吐金丹求和

訓練全能型的AI工具,需要超級巨量的圖文資料,其中浩瀚書海可說是品質極高且效率極佳的來源,全球資訊科技巨擘無不想方設法,將各類書籍融入自家的大型語言模型中。然而,近年來使用書本訓練大型語言模型,卻引發諸多著作權糾紛,相關訴訟案件刻已進入關鍵司法裁決與和解階段;其中,備受矚目的Bartz v. Anthropic案深具指標意義。

二○二四年八月,Andrea Bartz等三位作家控告AI新創巨頭Anthropic,在訓練大型語言模型Claude時,從Books3等「影子圖書館」(線上盜版資料庫)抓取並複製超過七百萬本受版權保護的書籍,已然構成大規模的侵權行為。原告主張這類型的機器學習並非單純的學習行為,而是建立在大規模盜版複製上的侵權商業開發。二○二五年六月,法院裁定機器學習訓練行為,本身如同人們讀書一般,其「轉化性」屬合理使用範疇;但為了訓練模型而從影子圖書館下載並儲存盜版資料的行為,則不具備法律正當性,使得該公司面臨巨大的侵權賠償風險。

二○二五年九月,Anthropic為了避免敗訴風險,同意支付約十五億美元的賠償金來和解,創下史上AI著作權的天價賠償紀錄。此外,該公司承諾銷毀所有從盜版來源取得的資料及衍生副本,並將建立更嚴格的版權過濾機制,以防止未來再次侵權。至於這筆十五億美元的賠償金是如何估算而得的呢?它是由符合賠償資格的大約五十萬本書籍,再乘上每本賠償三千美元所得到的金額。蓋本案指控的七百多萬本下載量,在剔除重複檔案、政府公文及公有領域作品後,若僅針對在美國著作權局註冊、且擁有ISBN或ASIN編號的合規版權書籍來計算,則可縮減至約五十萬本為理賠對象。

至於每部合格作品三千美元的賠償標準,則是根據美國著作權法中的「法定損害賠償金」進行議價。考量公司財力與五十萬本作品的規模,雙方最終折衷出一個既能展現懲罰性、又在公司可承擔範圍內的和解金額。符合資格的作者與出版商須在二○二六年三月前,透過官方和解網站提出理賠申請,待審核通過並扣除律師費用後,賠償金才會分發下來。

前陣子筆者收到來自西雅圖的明信片,告知先前曾寄發Bartz v. Anthropic和解案通知,並再次提醒三月底前上網申請才可取得首波理賠。在排除網路詐騙的可能性後,筆者登入官方網站,才得知原來是自己的某本專書被侵權,可據以提出理賠申請。明信片上的英文住址只有巷弄、沒有路名,而我們的郵差竟還能送達,真令人折服。

今年初,史丹佛與耶魯研究團隊證實,主流大型語言模型在巧妙引導下,竟能近乎逐字複誦暢銷小說的篇章,更讓人質疑全能型AI系統,根本上恐已違法暗藏受版權保護的作品。在金庸小說中,當張無忌的太極劍法從「全都記得」到「忘得一乾二淨」時,開山祖師張三丰才認可他已達到「無招勝有招」的武學最高境界,或許這般「得意忘形」的功夫值得AI借鏡。

(作者為台大資工系教授)

AI 人工智慧 金庸 著作權

延伸閱讀

中AI公司「非法蒸餾」先進模型? 美3巨頭聯手對抗

AI短劇盜臉 普通人莫名其妙演出低俗角色、反派

詐騙轉型…以AI對抗AI 科技與治理競賽

拯救孩子童年/戕害兒少 臉書、YT要賠600萬美元

相關新聞

周行一/不確定性愈高,愈要DIY簡單理財

美國與伊朗談判破局,美以伊戰爭到底何時會結束,眾說紛紜。許多人還關心這個戰爭對未來世界是否會有深遠的影響,例如全球是否仍相信美國有維持世界能源運輸安全的能力?戰爭後世界是否將進入多極化(非美國單極霸權)的狀態?中東會更混亂嗎?全球國家間的衝突會升高嗎?這些問題很難解答,難怪有一位企業家最近告訴我,只要有人說未來世界會怎樣都是胡扯的,可見大家的焦慮感已因這幾年的國際政經情勢破表了。

陳力俊/為什麼人們會散播假消息

在網路訊息爆炸時代,錯誤的訊息往往迅速而廣泛的傳播,甚至演變成陰謀論,有些已到匪夷所思的地步,但還是讓許多人深信不疑,到底問題出在哪裡?

魏國彥/從遺傳基因看我們是什麼人

國民黨主席鄭麗文與中國共產黨總書記習近平會面,又引起台灣地區住民的身分認定與國族認同的論戰。身分或認同實與個人的出身背景、文化教養相關,也頗受政治馴化和社會氛圍所影響,不見得愈辯愈明,經常愈談愈僵、愈撕裂。本文想援引近年人類基因譜系研究的成果在族群問題上幫我們尋根溯源,來談談台灣住民的「基因祖先」。

闕志克/網路社群難逃產品缺陷責任

一九九六年美國《通訊規範法》(CDA)裡的一段條文支撐起今天網際網路的商業模式:任何互動式電腦服務的提供者或使用者,均不得被視為其他資訊提供者所提供資訊內容的發布者或傳播者。這個條款讓Meta、抖音和谷歌等公司免於承擔因平台內容造成用戶損害的法律責任。然而,上個月一起具有里程碑意義的訴訟案(簡稱KGM案)中,陪審團判定Meta和谷歌在產品設計時使用引人上癮的機制,導致原告引發嚴重的憂鬱傾向,因此需賠六百萬美元。這項裁決開了第一槍,預計在美國將引發數千起類似訴求的訟案。

趙坤茂/AI盜書練神功 回吐金丹求和

訓練全能型的AI工具,需要超級巨量的圖文資料,其中浩瀚書海可說是品質極高且效率極佳的來源,全球資訊科技巨擘無不想方設法,將各類書籍融入自家的大型語言模型中。然而,近年來使用書本訓練大型語言模型,卻引發諸多著作權糾紛,相關訴訟案件刻已進入關鍵司法裁決與和解階段;其中,備受矚目的Bartz v. Anthropic案深具指標意義。

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。