跳到主要內容

AI盜書練神功 回吐金丹求和

聯合報/A14版/論壇
趙坤茂
2026年4月9日   人氣: 11   開始朗讀

網路識讀

訓練全能型的AI工具,需要超級巨量的圖文資料,其中浩瀚書海可說是品質極高且效率極佳的來源,全球資訊科技巨擘無不想方設法,將各類書籍融入自家的大型語言模型中。然而,近年來使用書本訓練大型語言模型,卻引發諸多著作權糾紛,相關訴訟案件刻已進入關鍵司法裁決與和解階段;其中,備受矚目的Bartz v. Anthropic案深具指標意義。

 

二○二四年八月,Andrea Bartz等三位作家控告AI新創巨頭Anthropic,在訓練大型語言模型Claude時,從Books3等「影子圖書館」(線上盜版資料庫)抓取並複製超過七百萬本受版權保護的書籍,已然構成大規模的侵權行為。原告主張這類型的機器學習並非單純的學習行為,而是建立在大規模盜版複製上的侵權商業開發。二○二五年六月,法院裁定機器學習訓練行為,本身如同人們讀書一般,其「轉化性」屬合理使用範疇;但為了訓練模型而從影子圖書館下載並儲存盜版資料的行為,則不具備法律正當性,使得該公司面臨巨大的侵權賠償風險。

 

二○二五年九月,Anthropic為了避免敗訴風險,同意支付約十五億美元的賠償金來和解,創下史上AI著作權的天價賠償紀錄。此外,該公司承諾銷毀所有從盜版來源取得的資料及衍生副本,並將建立更嚴格的版權過濾機制,以防止未來再次侵權。至於這筆十五億美元的賠償金是如何估算而得的呢?它是由符合賠償資格的大約五十萬本書籍,再乘上每本賠償三千美元所得到的金額。蓋本案指控的七百多萬本下載量,在剔除重複檔案、政府公文及公有領域作品後,若僅針對在美國著作權局註冊、且擁有ISBN或ASIN編號的合規版權書籍來計算,則可縮減至約五十萬本為理賠對象。

 

至於每部合格作品三千美元的賠償標準,則是根據美國著作權法中的「法定損害賠償金」進行議價。考量公司財力與五十萬本作品的規模,雙方最終折衷出一個既能展現懲罰性、又在公司可承擔範圍內的和解金額。符合資格的作者與出版商須在二○二六年三月前,透過官方和解網站提出理賠申請,待審核通過並扣除律師費用後,賠償金才會分發下來。

 

前陣子筆者收到來自西雅圖的明信片,告知先前曾寄發Bartz v. Anthropic和解案通知,並再次提醒三月底前上網申請才可取得首波理賠。在排除網路詐騙的可能性後,筆者登入官方網站,才得知原來是自己的某本專書被侵權,可據以提出理賠申請。明信片上的英文住址只有巷弄、沒有路名,而我們的郵差竟還能送達,真令人折服。

 

今年初,史丹佛與耶魯研究團隊證實,主流大型語言模型在巧妙引導下,竟能近乎逐字複誦暢銷小說的篇章,更讓人質疑全能型AI系統,根本上恐已違法暗藏受版權保護的作品。在金庸小說中,當張無忌的太極劍法從「全都記得」到「忘得一乾二淨」時,開山祖師張三丰才認可他已達到「無招勝有招」的武學最高境界,或許這般「得意忘形」的功夫值得AI借鏡。

 

相關文章

知道網路風險,卻仍踏入陷阱? 你知道孩子上網都在做什麼嗎?
知道網路風險,卻仍踏入陷阱? 你知道孩子上網都在做什麼嗎?

「其實孩子們都不笨。」受訪的內政部警政署刑事警察局詐欺犯罪防制中心隊長洪丞奇語氣平穩,卻帶著一絲複雜的感受。他接著說:「外界常以為會去當車手的孩子,都是家裡有狀況、缺乏資源,然而我們的統計並不是這樣。真正因為家庭功能不彰而涉案的孩子,不到兩成,其餘八成都是再普通不過的家庭,家裡沒有特別辛苦,也不是因為缺錢。」那為什麼這些學生還要冒險去從事這樣的違法行為呢?

認識Deepfake技術及其應用與風險
認識Deepfake技術及其應用與風險

俗稱「AI換臉」的Deepfake技術又稱為「深偽技術」,它是深度學習(deep learning)與偽造(fake)的混成字,意指一類利用深度學習技術進行逼真的人像影像合成的技術。Deepfake技術之所以引起全世界如此重視的原因,在於它的相關軟體可以讓一般人輕鬆地取得,並且運作於一般的個人電腦或行動裝置上,因此各種相關的善意或惡意的應用方式層出不窮,迫使這個世界必須嚴肅看待Deepfake技術帶來的巨大衝擊。

相關影片

雲端影音,謹慎視聽
雲端影音,謹慎視聽
AI的練習曲
AI的練習曲
不只看見,更要看別人所見!
不只看見,更要看別人所見!
明辨是非的能力
明辨是非的能力

返回網路識讀新聞列表

頁首