美國加州北區聯邦地方法院法官William Alsup於2025年6月23日作成初步判決,認為生成式人工智慧(Gen AI)軟體開發公司Anthropic PBC因下載盜版書籍建立訓練AI用中央資料庫而不構成合理使用後,法官Alsup也同意本案成立集體訴訟,預估將有50萬名原告都可以對Anthropic提告。因而Anthropic提出一項和解方案 — 願意對其使用Gen AI訓練的每一本書均賠償3,000美元,其總共要承擔15億美元的預估賠償。
圖片來源 : shutterstock、達志影像
Bartz v. Anthropic PBC案初步判決
如我們之前在北美智權報384期所介紹[1],Bartz v. Anthropic PBC案是由三位書籍作者(Bartz)針對未經授權使用書籍訓練大型語言(LLMs)模型公司Anthropic而提起的侵權訴訟。該案中,Anthropic在使用圖書檔案訓練其AI模型 — Claude有二個階段,
第一個階段,是從網路上的盜版書籍資料庫LibGen與PiLiMi下載 — 從LibGen下載了至少500萬本書籍、從PiLiMi則是下載了至少200萬本書籍[2]。
第二個階段,Anthropic決定自己購買圖書,然後將這些紙本書籍拆裝後逐頁掃描。
2025年6月23日,加州北區地院法官Alsup作出簡易判決,認定Anthropic以圖書檔案進行AI模型訓練,不論訓練資料來源是盜版還是自己購買紙本書拆裝後掃描,此行為均屬於合理使用。但將蒐集的圖書檔案存放在其建置中央資料庫的行為,則有不同認定,如下,
(1)若訓練資料屬自己花錢購買,然後逐頁掃描成數位檔案,在訓練AI後存放在中央資料庫,可構成合理使用。
(2)若訓練資料來自網路的盜版資料庫,則訓練AI後存放在中央資料庫,不構成合理使用[3]。
【本文未完,完整內容請見《北美智權報》391期:從《2025台灣創新技術博覽會》看研發趨勢及能量】
※如欲轉載本文,請與北美智權報聯絡