楊智傑／雲林科技大學 科技法律研究所 教授

美國加州北區聯邦地方法院法官William Alsup於2025年6月23日作成初步判決，認為生成式人工智慧（Gen AI）軟體開發公司Anthropic PBC因下載盜版書籍建立訓練AI用中央資料庫而不構成合理使用後，法官Alsup也同意本案成立集體訴訟，預估將有50萬名原告都可以對Anthropic提告。因而Anthropic提出一項和解方案 — 願意對其使用Gen AI訓練的每一本書均賠償3,000美元，其總共要承擔15億美元的預估賠償。

Bartz v. Anthropic PBC案初步判決

如我們之前在北美智權報384期所介紹[1]，Bartz v. Anthropic PBC案是由三位書籍作者（Bartz）針對未經授權使用書籍訓練大型語言（LLMs）模型公司Anthropic而提起的侵權訴訟。該案中，Anthropic在使用圖書檔案訓練其AI模型 — Claude有二個階段，

第一個階段，是從網路上的盜版書籍資料庫LibGen與PiLiMi下載 — 從LibGen下載了至少500萬本書籍、從PiLiMi則是下載了至少200萬本書籍[2]。

第二個階段，Anthropic決定自己購買圖書，然後將這些紙本書籍拆裝後逐頁掃描。

2025年6月23日，加州北區地院法官Alsup作出簡易判決，認定Anthropic以圖書檔案進行AI模型訓練，不論訓練資料來源是盜版還是自己購買紙本書拆裝後掃描，此行為均屬於合理使用。但將蒐集的圖書檔案 存放在其建置中央資料庫 的行為，則有不同認定，如下，

（1）若訓練資料屬自己花錢購買，然後逐頁掃描成數位檔案，在訓練AI後存放在中央資料庫，可構成合理使用。

（2）若訓練資料來自網路的盜版資料庫，則訓練AI後存放在中央資料庫，不構成合理使用[3]。

集體訴訟與和解方案

2025年7月17日，法官Alsup核准本案為全美範圍的集體訴訟（class action）[4]，亦即原來的三位原告乃代表所有Anthropic從LibGen或PiLiMi資料庫下載書籍版本之實質與合法著作權人。只要這些原告的書籍在被Anthropic下載前或出版後三個月內向美國著作權局（U. S. Copyright office）完成登記；並且具有ISBN或ASIN編號均可向Anthropic提告。實際上，在約700萬本被Anthropic下載的書籍中，只有約50萬本符合這些條件[5]。

2025年9月，在經過由中立第三方調解人主持的「雙方公平協商」後，原告與被告雙方達成了擬議的和解協議。該和解協議於2025年9月25日經法官Alsup初步核准[6]，並對外公開徵求，這50萬名書本的作者是否願意接受該和解條件[7]。

根據公開的協議內容，Anthropic為這項協議大約要付出15億和解美金。其具體約定，Anthropic對每本書籍的賠償金額為3,000美元。但作者將來實際拿到的錢，尚須扣除成本、律師費及其他費用等。其也提到，倘若參加的原告並非自己擁有完整的著作權，例如著作權是由作者和出版社共享，則這筆賠償金即需在作者和出版社之間分配。這個和解的範圍，只限於對Anthropic過去侵權行為， 並不包括其所開發的Claude之後的生成內容的潛在侵權問題 。

在集體訴訟徵求原告的公告中，符合資格的作者，有四個選項：（1）於2026年3月23日前提交有效的請求以領取款項；（2）於2026年1月7日前選擇退出集體訴訟；（3）於2026年1月7日前提出異議以表達反對意見；（4）或不採取任何行動[8]。

一本書賠償可高達3,000美元？

此處須說明，依美國《著作權法》第504條(c)規定，透過訴訟請求的賠償金，若非以 真正損害 來求償，而是以 法定賠償金 來求償，則最低一項侵權賠償不得低於750美元，最高不得高於3萬美元[9]。但若原告能證明被告是蓄意侵權的話，法院可將法定賠償金調高到最高 — 例如，一本著作可求償15萬美元[10]。

為何Anthropic的和解方案最後選擇每本書賠償3,000美元？可能是受到美《著作權法》法定賠償金的影響。雖然法定賠償金最低750美元，但因為初步判決已經認定被告是「在知道這些網路圖書資料庫是屬於盜版的情況下」下載、使用，此行為可能會構成蓄意侵權。因此，Anthropic和解方案所提出每本書3,000美元的賠償金，是美《著作權法》法定賠償金750美元的四倍。

既然如此，其他潛在原告可否選擇不加入此訴訟，而改為自己提告，想辦法拿到最高可能15萬美元的法定賠償金？這很難。因為在美國打官司的成本也非常高。審判可能曠日費時，並歷經多年上訴，且無法保證全額賠償[11]。因此，對潛在原告而言，選擇一本書3,000美元的和解金，也許是一個可接受的方案。

對未來訴訟與授權制度的影響

一般認為，Anthropic的和解方案很可能成為其他著作權人針對AI公司提出著作權訴訟的參考基準。其他原告可能會以每件作品約3,000美元為起點進行損害賠償談判，未來法院在設計救濟措施時也可能參照本案的結構[12]。

Anthropic提出的和解條件，也可能增加未來AI開發公司取得合法授權之訓練資料的意願[13]。一本圖書在美國可能價格為30美元，如果盜版一本書用作AI訓練，最後居然要賠償該本書的100倍價錢，還不如一開始就接受100倍以下的AI訓練用授權金。如美國Ropes & Gray律師事務所認為，AI開發商將越來越傾向主動尋求授權協議，藉此以「市場價格」支付權利金，而非冒著法定損害賠償風險進行非法使用[14]。

若是合法購買圖書自己數位化或下載合法檔案呢？

若比對Anthropic後期取得圖書檔案的來源，形成一明顯對比 — 一本圖書在美國可能價格為30美元，但Anthropic和解方案中的每本書須賠償3,000美元，是購買合法圖書價金的100倍。

法官Alsup在Bartz v. Anthropic PBC案認為「以合法購買書籍進行數位化後建立資料庫留存」屬合理使用。那麼，是否當初用30美元買書就比較省錢？但Anthropic採購合法圖書後，仍須自己拆解圖書進行逐頁掃描 — 尚需投入機械、人力、時間等成本。因此，若自行購買上百萬本書然後拆開逐一掃瞄成數位檔，所需支付的成本也不可小覷。

如果是購買某合法圖書資料庫的個人版，下載全部圖書檔案後，轉為作AI訓練並建立資料庫，這樣是否算是合法取得數位檔案？由於資料庫的授權使用契約中會約定用途，若購買的是個人版（非商用）卻大量下載作AI訓練（商用），算是違反該資料庫的授權契約。

對小型新創AI開發者不利？

由於Anthropic是開發Claude的公司，進入市場相對早，且也與大公司包括Microsoft合作，目前早已商業化，擁有充足資金。Anthropic於2025年9月的估值高達1,830億美元，因此15億美元的賠償金對於該公司來說仍在可負擔範圍[15]。

但對其他尚未獲利的AI新創公司，如何有辦法支付高額訓練資料的授權金？這樣的發展是否對小型AI新創公司不利？

這裡要注意一項重要的區別 — 不論法官Alsup在Bartz v. Anthropic PBC案初步判決，和同法院另一名法官Vince Chhabria在Kadrey v. Meta Platforms案之初步判決[16]，都認為AI開發公司 下載盜版檔案進行AI訓練，可構成合理使用 。而上述討論、針對的，是指AI開發公司在 訓練AI後仍將訓練資料「保留」的行為，而此行為才被認定不構成合理使用 的情況。

也就是說，對尚未獲利的小型AI開發公司，若不想被認定侵權，只要在訓練AI之後立即刪除訓練資料，就不會有問題。不過，若不能留存訓練資料，在每一次的AI訓練就必須重新蒐集、整理訓練資料，對後續新的AI開發者而言，確實仍然是一個阻礙。

楊智傑／雲林科技大學 科技法律研究所 教授

