Meta涉嫌大規(guī)模下載盜版電子書 用于AI模型訓(xùn)練快訊
Meta還被指從LibGen下載了額外的80.6 TB數(shù)據(jù),這些盜版電子書庫可能僅占Meta盜版版權(quán)作品總量的0.008%,一名圖書作者對社交巨頭Meta提出了指控。
【TechWeb】近日,一名圖書作者對社交巨頭Meta提出了指控,聲稱該公司未經(jīng)授權(quán)下載了大量的盜版電子書,用以訓(xùn)練其人工智能模型。根據(jù)最新的證據(jù)揭示,Meta的盜版行為規(guī)模之大令人震驚。
據(jù)指控,Meta通過名為“安娜的檔案”(Anna's Archive)的渠道,下載了至少81.7 TB的數(shù)據(jù)。這些數(shù)據(jù)中包含了來自知名盜版網(wǎng)站Z-Library和LibGen的至少35.7 TB的內(nèi)容。值得注意的是,“安娜的檔案”是一個包含了Z-Lib、Sci-Hub和LibGen鏡像站點(diǎn)的平臺。此外,Meta還被指從LibGen下載了額外的80.6 TB數(shù)據(jù)。
圖書作者指出,Meta的這一行為構(gòu)成了非法的電子書庫種子下載,而且這一數(shù)字可能只是其盜版行為的冰山一角。作者估計,這些盜版電子書庫可能僅占Meta盜版版權(quán)作品總量的0.008%,這一比例表明Meta的盜版規(guī)模可能遠(yuǎn)超目前所揭露的。
這一指控引發(fā)了公眾對大型科技公司版權(quán)問題的關(guān)注,尤其是它們在訓(xùn)練AI模型時使用的數(shù)據(jù)來源。如果指控成立,Meta可能面臨嚴(yán)重的法律后果,包括版權(quán)侵犯的訴訟和可能的罰款。這也可能促使相關(guān)部門加強(qiáng)對科技公司數(shù)據(jù)使用合規(guī)性的監(jiān)管。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。