AI盜書練神功回吐金丹求和

訓練全能型的ＡＩ工具，需要超級巨量的圖文資料，其中浩瀚書海可說是品質極高且效率極佳的來源，全球資訊科技巨擘無不想方設法，將各類書籍融入自家的大型語言模型中。然而，近年來使用書本訓練大型語言模型，卻引發諸多著作權糾紛，相關訴訟案件刻已進入關鍵司法裁決與和解階段；其中，備受矚目的Bartz v. Anthropic案深具指標意義。

二○二四年八月，Andrea Bartz等三位作家控告ＡＩ新創巨頭Anthropic，在訓練大型語言模型Claude時，從Books3等「影子圖書館」（線上盜版資料庫）抓取並複製超過七百萬本受版權保護的書籍，已然構成大規模的侵權行為。原告主張這類型的機器學習並非單純的學習行為，而是建立在大規模盜版複製上的侵權商業開發。二○二五年六月，法院裁定機器學習訓練行為，本身如同人們讀書一般，其「轉化性」屬合理使用範疇；但為了訓練模型而從影子圖書館下載並儲存盜版資料的行為，則不具備法律正當性，使得該公司面臨巨大的侵權賠償風險。

二○二五年九月，Anthropic為了避免敗訴風險，同意支付約十五億美元的賠償金來和解，創下史上ＡＩ著作權的天價賠償紀錄。此外，該公司承諾銷毀所有從盜版來源取得的資料及衍生副本，並將建立更嚴格的版權過濾機制，以防止未來再次侵權。至於這筆十五億美元的賠償金是如何估算而得的呢？它是由符合賠償資格的大約五十萬本書籍，再乘上每本賠償三千美元所得到的金額。蓋本案指控的七百多萬本下載量，在剔除重複檔案、政府公文及公有領域作品後，若僅針對在美國著作權局註冊、且擁有ＩＳＢＮ或ＡＳＩＮ編號的合規版權書籍來計算，則可縮減至約五十萬本為理賠對象。

至於每部合格作品三千美元的賠償標準，則是根據美國著作權法中的「法定損害賠償金」進行議價。考量公司財力與五十萬本作品的規模，雙方最終折衷出一個既能展現懲罰性、又在公司可承擔範圍內的和解金額。符合資格的作者與出版商須在二○二六年三月前，透過官方和解網站提出理賠申請，待審核通過並扣除律師費用後，賠償金才會分發下來。

前陣子筆者收到來自西雅圖的明信片，告知先前曾寄發Bartz v. Anthropic和解案通知，並再次提醒三月底前上網申請才可取得首波理賠。在排除網路詐騙的可能性後，筆者登入官方網站，才得知原來是自己的某本專書被侵權，可據以提出理賠申請。明信片上的英文住址只有巷弄、沒有路名，而我們的郵差竟還能送達，真令人折服。

今年初，史丹佛與耶魯研究團隊證實，主流大型語言模型在巧妙引導下，竟能近乎逐字複誦暢銷小說的篇章，更讓人質疑全能型ＡＩ系統，根本上恐已違法暗藏受版權保護的作品。在金庸小說中，當張無忌的太極劍法從「全都記得」到「忘得一乾二淨」時，開山祖師張三丰才認可他已達到「無招勝有招」的武學最高境界，或許這般「得意忘形」的功夫值得ＡＩ借鏡。

焦點新聞

相關文章

相關影片