愛思唯爾把Meta告了:拿Sci-Hub盜版論文訓練大模型

西風 發自 凹非寺

量子位 | 公眾號 QbitAI

AI版權大戰,再度升級了論文

手握《柳葉刀》《細胞》等頂刊論文,掌控全球海量核心科研成果的學術出版巨頭愛思唯爾(Elsevier)正式入局,加入集體訴訟團硬剛Meta——

控訴Meta非法爬取、複製受版權保護的科研論文,用於訓練自家大模型Llama論文

愛思唯爾把Meta告了:拿Sci-Hub盜版論文訓練大模型

在此之前,站出來起訴AI侵權的多是作家、媒體機構論文

此番是頭一回,頂級學術出版商下場打響版權維權之戰論文。美國出版商協會也在宣告中給定調:

這是主流出版集團首次發起針對AI企業的訴訟,Meta明目張膽侵犯版權,出版商們將還原全部事實論文

這是主流出版集團首次發起針對AI企業的訴訟,Meta明目張膽侵犯版權,出版商們將還原全部事實論文

有意思的是,這場官司明面上矛頭對準Meta,可證據一攤開,與愛思唯爾糾纏十多年的兩大盜版學術庫——LibGen、Sci-Hub,再度被擺上檯面論文

只能說Meta樹大錢多論文,比追責盜版平臺靠譜多了

論文

多方原告組團上陣論文,指控Meta侵權

這場訴訟於5月5日在紐約南區法院正式提交,被告直指Meta及其CEO扎克伯格論文

而原告,不止愛思唯爾一家,還包括法國第一大出版集團阿歇特、源自英國的百年全球綜合性出版集團麥克米倫,以及美國小說家、執業律師Scott Turow等論文

展開全文

愛思唯爾把Meta告了:拿Sci-Hub盜版論文訓練大模型

出版商方核心指控非常明確:Meta為訓練Llama大語言模型,未經任何授權,大量獲取、複製、盜用受版權保護的學術論文與出版物內容論文

具體來看論文,訴狀裡指出Meta訓練Llama主要靠兩大“不清白”的資料來源:

第一,Common Crawl通用爬蟲資料集論文

這份資料集透過全網抓取生成,囊括數十億網頁內容論文。原告方稱,裡面大機率混進了未經授權的版權內容,比如付費期刊的摘要和全文。

第二,兩大知名盜版學術平臺LibGen、Sci-Hub論文

這兩個網站常年免費傳播海量付費論文、教材與學術著作,長期深陷全球版權訴訟論文。出版商指控,Meta透過磁力下載、檔案共享等方式,從這些網站盜用學術資源。

值得一提的是,本案很多證據,還是從去年那樁“作家告Meta”(Kadrey v. Meta)案裡流出來的內部員工郵件論文

面對訴訟,Meta發言人表示:將全力積極應訴論文

Meta這邊抗辯邏輯也十分清晰,打出了一張王牌:合理使用(Fair Use)論文

據瞭解,根據美國版權法,“合理使用”屬於版權豁免情形,允許在特定條件下無需授權使用版權內容論文

Meta發言人稱:“AI正為個人與企業帶來顛覆性創新、提升生產效率與創作活力,已有法院判例認定,使用版權內容訓練AI可構成合理使用論文。”

不得不說,這幾年AI圈的版權官司確實不少論文。像《紐約時報》、一堆知名作家都起訴過AI公司,有些案子已經和解了。

但整體而言,利用版權作品訓練大語言模型是否合法,目前仍未形成明確司法判例論文

至於這次後續怎麼發展……咱們先搬好小板凳,再蹲一波論文

One More Thing

“合理使用”這張牌之前確實被成功使用過論文

去年,美國法院裁決:允許Claude背後公司Anthropic在未經作者許可的情況下,使用合法購買的已出版書籍訓練AI論文

法院參考了美國版權法中的“合理使用”(Fair Use)原則,認為AI訓練屬於“轉化性使用”(Transformative Use),即對原作品的新用途未取代原作市場,且有利於技術創新和公共利益論文

愛思唯爾把Meta告了:拿Sci-Hub盜版論文訓練大模型

這也是美國法院首次認可AI公司對書籍的使用權論文

就在最近,有網友稱Anthropic正在大批次購入古籍,掃描收錄內容後就直接銷燬原書論文。這一說法也引發了不少網友關注。

愛思唯爾把Meta告了:拿Sci-Hub盜版論文訓練大模型

參考連結:

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法論文

— 完—

中國AIGC產業峰會最新嘉賓陣容來了論文

從AI最新架構到應用生態,從AI音樂、AI漫劇、AI瀏覽器再到世界模型、AI硬體... 這一次,我們希望聚齊AI賽道的實戰派,百度、智譜、崑崙萬維、模思智慧、螞蟻靈波都會來論文。🔍

5月20日論文,北京·金茂萬麗酒店,@所有人,馬上AI起來!👉

本站內容來自使用者投稿,如果侵犯了您的權利,請與我們聯絡刪除。聯絡郵箱:[email protected]

本文連結://www.yxd-1688.com/post/38840.html

🌐 /