抄襲還是模仿?AI繪圖工具遭指擅自拿藝術家作品「訓練」名單流出竟有上萬人
AI 技術的出現讓各行各業掀起一場使用令工作更有效率完成的熱潮,而首當其衝的莫過於繪畫產業——Stable diffusion、Midjourney 等 AI 繪圖工具的竄起,讓許多非繪師的使用者可以大量產出有一定水準的繪圖。
雖然起初 AI 生成的圖片看起來會有所謂的「AI 感」,但隨著時間發展,經過詠唱訓練、細部調整的 AI 繪圖,其實在一般人眼中已經與一般圖片相差無幾。更甚者,使用 AI 繪圖並且擁有大量粉絲追隨的大有人在。
鹿目まどか pic.twitter.com/LWKn13ncZC
— tarte (@HoDaRaKe) December 20, 2023
然而會讓 AI 繪圖與一般繪圖相差無幾的理由,很有可能是因為 AI 在未經授權的情況下,使用了大量繪師的圖來做訓練,並挪用了其他繪師的畫風來生成圖片,幾乎可說是與抄襲無異。
之所以有這樣的指控,源於 2024 年 1 月 1 日的 Midjourney 資料庫名單洩漏事件。Riot Game 的高級分鏡畫師「Jon Lam」在 X(舊稱推特)發文,並附上一份文檔,指這份文檔是 Midjourney 的工程師們用來訓練 Midjourney 的藝術家名單。
這份名單長達 24 頁,包含 16000 名藝術家,當中包括梵谷、草間彌生、《魔法風雲會》的藝術家們,甚至連參與威世智為西雅圖醫院籌款項目,當時僅有 6 歲的藝術家「Hyan Tran」也成為了 Midjourney 用來訓練的對象之一。
除了這份文檔,Jon Lam 在貼文裡還附上幾張 Midjourney 工程師在 2022 年於 Discord 頻道討論如何使用這份名單訓練 Midjourney,以及如何避開版權問題的對話截圖。
在討論中,當時 David H(Midjourney 的 CEO)表示 Midjourney 使用了 4000 名藝術家和 1000 種風格預先製造圖片,0.3 秒就能生成一張圖。
David H 聲稱這些藝術家來自維基百科和《魔法風雲會》,並要求參與討論的人把更多藝術家的名稱和風格餵給 Midjourney 訓練,就算重複了也沒關係。
另外有成員表示 Midjourney 經過資料庫生成的圖片,只要使用 fine tune codex「清洗」過後就沒事,同時也有人表示這種衍生圖片很難追究版權問題。
早在 2023 年 1 月,就有三位藝術家 Karla Ortiz、Kelly Mckernan 和 Sarah Andersen,以侵權為由把 Midjourney、Stability AI 和 DevianArt 告上法庭,控訴他們未經創作者同意,就把大量作品用來訓練 AI,不過一直沒有實質證據。
然而這次的披露將可能成為 AI 工具侵權的有力證據,因此 Jon Lam 在貼文表示上述文件已成為訴訟證據,並「提醒」工程師,他們掌握的「技能」不是他們的。
Jon Lam 後來再發文,稱有工程師在討論之後向 David H 警告 Midjourney 可能會牽涉版權問題,指「模仿」依然是侵權行為,不過 David H 卻沒有理會。
目前尚未確實得知 Midjourney 是否涉及侵權,也無法確定其他 AI 繪圖工具是否使用同樣方式來訓練 AI。但是早在去年 8 月,美國著作權局已多次拒絕 AI 圖的版權申請,美國地方法院指出 AI 圖並不受版權保障,強調「人類作者身份是版權的基本要求」。
新科技的出現讓人類進步固然是好事,但是利用「使用新技術」之名逃避版權責任,剽竊別人成果,反而熄滅進步的動力,是一種傷害和倒退。若是想著「要是跟不上最新技術就要小心」的同時,也要注意自己的行為是否正當,以免陷入法律糾紛和阻礙產業發展。