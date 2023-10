王思原/世新大學智慧財產暨傳播科技法律研究所副教授

2022年9月15日,美國藝術家Kristina Kashtanova以自己為著作人,向美國著作權局(US Copyright Office,USCO)申請《Zarya of the Dawn》之著作權登記。登記後不久,USCO從社群媒體得知《Zarya of the Dawn》之創作過程涉及Midjourney 人工智慧(AI)之使用。USCO認為Kashtanova並未於申請時揭露AI使用情形,有提供不實陳述之嫌,有意撤銷其登記……

本案背景

2022年9月15日,Kristina Kashtanova向USCO提出著作權登記申請。依其提供的資訊及著作樣本,要登記的標的是一本名為《Zarya of the Dawn》的漫畫書。該書連同封面共18頁,內容由圖像及文字構成,著作人為Kashtanova本人。USCO於是日完成審查登記程序,登記號為VAu001480196[1]。

圖一:Zarya of the Dawn封面頁及第2頁

圖片來源:US Copyright Office, Re: Zarya of the Dawn (Registration # Vau001480196).

登記後不久,USCO發現Kashtanova自己在社群媒體上表示《Zarya of the Dawn》是由使用Midjourney AI生成的作品。由於申請書中並未揭露AI使用情形,亦未就任何部分聲明不專用,USCO認為本件有申請內容不實或不完整之嫌,遂於2022年10月28日去函Kashtanova,表示有意撤銷其登記,但同時給予書面辯駁之機會。USCO於2022年11月21日收到Kashtanova的律師來函,說明AI使用情形,並提出兩項不應撤銷登記的理由:(1)系爭作品是Kashtanova自己的創作,Midjuorney只是輔助工具;(2)退而求其次,系爭作品的某些部分應具可登記性。理由在於,文字是由Kashtanova創作,而且她對文字及圖像的選擇、彙整及編排具創作性,構成受著作權保護之編輯著作。USCO於2023年2月21日發函給Kasntanova的律師,告知最後決定[2]。

可登記性判斷之法律標準

在分析《Zarya of the Dawn》是否具可登記性之前,USCO先闡明判斷之法律標準。依美國著作權法之規定,著作權保護之標的須符合「原創性」及「人類創作」兩項實質要件。根據最高法院於1991年Feist Publ’ns, Inc. v. Rural Tel. Serv. Co.案的分析,原創性之內涵包括原始性及創作性,亦即,必須由作者獨立創作且具備足夠創作性。只要有少許創作性(modicum of creativity)即可滿足要求,但全然欠缺創作火花(creative spark)或創作性微不足道的著作不在著作權保護範圍之內。其次,著作權保護之標的僅限於人類創作。最高法院於1884年Burrow-Giles Lithographic Co. v. Sarony案即已確立此一法則。非人類創作則不受著作權保護。例如,第9巡迴上訴法院於1997年的Urantia Found. v. Kristen Maaherra案指出,著作權法之立法意旨不在於保護神靈的創作,故由非人類之靈體(spiritual beings)所創作的書不受著作權保護。USCO之登記實務作業向來遵循法院見解。USCO實務手冊(Compendium of U.S. Copyright Office Practices)即規定,對於猴子拍攝的照片或記載聖靈(Holy Spirit)為著作人的歌曲之登記申請,應予核駁[3]。

《Zarya of the Dawn》中的文字

根據Kashtanova的說法,《Zarya of the Dawn》中的文字完全由其自行撰寫,並未藉助包括生成式AI在內的任何工具。USCO採信其說法,認定系爭文字為人類創作。此外,USCO認定系爭文字的創作性已超越Feist要求門檻,從而應受著作權保護,具可登記性[4]。

圖像與文字之選擇及編排

依Kashtanova的說法,《Zarya of the Dawn》的圖像的選擇及編排,是由她自己完成。USCO採信其說法,認定係爭作品中圖像與文字的選擇及編排為人類創作,且達Feist對於創作性之要求,從而構成受保護之編輯(compilation)著作[5]。

個別圖像

為判斷《Zarya of the Dawn》中個別圖像是否受具可登記性,USCO花費相當篇幅解釋Midjourney的運作過程。依其說法,Midjourney是一種應使用者輸入的文字,生成圖像的AI技術。使用者透過第三方通訊軟體Discord操作Midjourney。使用者輸入「提示」(prompts),亦即文字指令,操作Midjourney生成圖像。提示以「/imagine」開頭再加上使用者輸入的文字。Midjourney每次生成4幅圖像,以方陣呈現,下方附有按鍵,可讓使用者請求提高解析度(例如,U1, U2,U3, U4)、修圖(例如, V1, V2, V3, V4)、或重新生成4幅圖像[6]。例如,輸入提示「/imagine cute baby dinosaur shakespeare writing play purple」之生成圖像如下:

圖二:Midjourney生成圖像

圖片來源:USCO, Re: Zarya of the Dawn (Registration # Vau001480196).

USCO引述Midjourney的說法,提示並非使Midjourney產出特定結果之具體指令。這是因為Midjourney「並非以人類的方式理解文法、句子結構或單字」,而是將單字及片語轉變為更小的片段,稱為詞元(token),再與其訓練資料對比後生成圖像。Midjourney圖像生成一開始產生「如同電視雜訊般之視覺訊號群」作為出發點來生成原始圖像方陣,再以演算法將這些雜訊修正成人類可識別之圖像。USCO認為,Midjourney生成圖像之過程,與人類藝術創作、寫作或攝影大相逕庭。雖然針對個別生成圖像所附加之提示,會影響後續生成之圖像,但由於無法事先預知Midjourney到底會生成什麼圖像,故此程序並非由使用者所控制。由於最終生成的圖像是由一開始的隨機雜訊演化而成,不能保證特定的提示會生成任何特定的視覺輸出。因此,這裡所謂的提示,比較像是建議而非指令,類似於客戶對其委託的畫家,就畫作內容提出的一般性指示[7]。值得注意的是,著作權局特別指出,本案分析的基礎是申請人使用 Midjourney的特定具體事實,並不能排除其他AI系統可能以不同方式產生表現性作品[8]。

基於對Midjourney生成圖像過程的理解,USCO認為《Zarya of the Dawn》中的個別圖像並非具原創性之人類創作,因此不受著作權保護。Kashtanova主張,這些圖像的生成,是她投入大量時間及精力使用Midjourney的成果,USCO對此並無疑義,惟依著作權法規定,其努力並不能使其成為圖像之「著作人」。而法院實務不承認「辛勤」(sweat of the brow)為著作權保護之基礎。USCO亦「不會考慮創作該作品所需之時間、精力或費用」,因為此與是否具有著作權法及憲法規定之原創性標準無關[9]。

經修改之圖像

依Kashtanova的說法,《Zarya of the Dawn》中有兩幅圖像經過其親手修改。USCO採信其說法,但無法確切判定修改的程度是否已達著作權保護的創造性要求。

首先,Kashtanova指出,第2頁的Zarya畫像的嘴部及唇部經過其修改(如圖三)。USCO則認為修改的程度過於微小,難以察覺,尚不足以跨越著作權法所要求創作性門檻[10]。

圖三:Zarya嘴部及唇部修改

圖片來源:USCO, Re: Zarya of the Dawn (Registration # Vau001480196).

其次,Kashtanova聲明第12頁的閉眼老婦人畫像,是其運用Midjourney加上Photoshop創作的產物(如圖四)。她利用Photoshop使畫中的婦人呈現臉部老化、柔化層次、及修改線條與輪廓[11]。

圖四:閉眼老婦人畫像

圖片來源:USCO, Re: Zarya of the Dawn (Registration # Vau001480196).

USCO則認為,根據Kashtanova的說法,無法判定該圖像創作過程中,Photoshop與Midjourney的運用情形及相對貢獻度。Kashtanova對系爭圖像進行實質修改的部分,有可能構成人類創作,從而不在新登記排除範圍內[12]。

結論

重新審查的結果,USCO認定《Zarya of the Dawn》中之文字及圖文編輯受著作權保護,具可登記性。單純由Midjourney生成的個別圖像並非人類創作,非著作權保護之標的。USCO將撤銷原登記並重新登記。新登記涵蓋的範圍為「文字」及「作者創作之文字及AI生成之美術作品所為之選擇、協調及編排」,並將明確排除AI生成之美術作品。此外,由於申請人之貢獻主要為文字,本件作品將被登記為「未發行之語文著作」[13]。

