愛思唯爾把Meta告了：拿Sci-Hub盜版論文訓練大模型

西風發自凹非寺

量子位 | 公眾號 QbitAI

AI版權大戰，再度升級了論文。

手握《柳葉刀》《細胞》等頂刊論文，掌控全球海量核心科研成果的學術出版巨頭愛思唯爾（Elsevier）正式入局，加入集體訴訟團硬剛Meta——

控訴Meta非法爬取、複製受版權保護的科研論文，用於訓練自家大模型Llama論文。

在此之前，站出來起訴AI侵權的多是作家、媒體機構論文。

此番是頭一回，頂級學術出版商下場打響版權維權之戰論文。美國出版商協會也在宣告中給定調：

這是主流出版集團首次發起針對AI企業的訴訟，Meta明目張膽侵犯版權，出版商們將還原全部事實論文。

有意思的是，這場官司明面上矛頭對準Meta，可證據一攤開，與愛思唯爾糾纏十多年的兩大盜版學術庫——LibGen、Sci-Hub，再度被擺上檯面論文。

只能說Meta樹大錢多論文，比追責盜版平臺靠譜多了

論文。

多方原告組團上陣論文，指控Meta侵權

這場訴訟於5月5日在紐約南區法院正式提交，被告直指Meta及其CEO扎克伯格論文。

而原告，不止愛思唯爾一家，還包括法國第一大出版集團阿歇特、源自英國的百年全球綜合性出版集團麥克米倫，以及美國小說家、執業律師Scott Turow等論文。

展開全文

出版商方核心指控非常明確：Meta為訓練Llama大語言模型，未經任何授權，大量獲取、複製、盜用受版權保護的學術論文與出版物內容論文。

具體來看論文，訴狀裡指出Meta訓練Llama主要靠兩大“不清白”的資料來源：

第一，Common Crawl通用爬蟲資料集論文。

這份資料集透過全網抓取生成，囊括數十億網頁內容論文。原告方稱，裡面大機率混進了未經授權的版權內容，比如付費期刊的摘要和全文。

第二，兩大知名盜版學術平臺LibGen、Sci-Hub論文。

這兩個網站常年免費傳播海量付費論文、教材與學術著作，長期深陷全球版權訴訟論文。出版商指控，Meta透過磁力下載、檔案共享等方式，從這些網站盜用學術資源。

值得一提的是，本案很多證據，還是從去年那樁“作家告Meta”（Kadrey v. Meta）案裡流出來的內部員工郵件論文。

面對訴訟，Meta發言人表示：將全力積極應訴論文。

Meta這邊抗辯邏輯也十分清晰，打出了一張王牌：合理使用（Fair Use）論文。

據瞭解，根據美國版權法，“合理使用”屬於版權豁免情形，允許在特定條件下無需授權使用版權內容論文。

Meta發言人稱：“AI正為個人與企業帶來顛覆性創新、提升生產效率與創作活力，已有法院判例認定，使用版權內容訓練AI可構成合理使用論文。”

不得不說，這幾年AI圈的版權官司確實不少論文。像《紐約時報》、一堆知名作家都起訴過AI公司，有些案子已經和解了。

但整體而言，利用版權作品訓練大語言模型是否合法，目前仍未形成明確司法判例論文。

至於這次後續怎麼發展……咱們先搬好小板凳，再蹲一波論文。

One More Thing

“合理使用”這張牌之前確實被成功使用過論文。

去年，美國法院裁決：允許Claude背後公司Anthropic在未經作者許可的情況下，使用合法購買的已出版書籍訓練AI論文。

法院參考了美國版權法中的“合理使用”（Fair Use）原則，認為AI訓練屬於“轉化性使用”（Transformative Use），即對原作品的新用途未取代原作市場，且有利於技術創新和公共利益論文。

這也是美國法院首次認可AI公司對書籍的使用權論文。

就在最近，有網友稱Anthropic正在大批次購入古籍，掃描收錄內容後就直接銷燬原書論文。這一說法也引發了不少網友關注。

參考連結：

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法論文！

— 完—

中國AIGC產業峰會最新嘉賓陣容來了論文！

從AI最新架構到應用生態，從AI音樂、AI漫劇、AI瀏覽器再到世界模型、AI硬體... 這一次，我們希望聚齊AI賽道的實戰派，百度、智譜、崑崙萬維、模思智慧、螞蟻靈波都會來論文。🔍

5月20日論文，北京·金茂萬麗酒店，@所有人，馬上AI起來！👉