Mark Zuckerberg, CEO van Meta, zou het team achter de Llama AI-modellen toestemming hebben gegeven om een dataset van illegaal verkregen e-books en artikelen, bekend als LibGen, te gebruiken voor hun trainingen. Dit blijkt uit documenten die onlangs zijn ingediend in de rechtszaak Kadrey v. Meta.
Copyrightschendingen
LibGen staat bekend als een platform dat toegang biedt tot duizenden auteursrechtelijk beschermde werken. Het is meerdere keren aangeklaagd en veroordeeld vanwege copyrightschendingen. Ondanks waarschuwingen van Meta’s eigen AI-experts over de juridische risico’s, heeft Zuckerberg volgens de aanklacht persoonlijk ingestemd met het gebruik van deze dataset.
Daarnaast wordt Meta beschuldigd van het manipuleren van de data. Het team zou copyrightvermeldingen en metadata hebben verwijderd om te voorkomen dat gebruikers zouden opmerken dat de modellen getraind zijn op beschermde werken. Ook zou Meta de data via torrenting hebben gedownload – een praktijk die niet alleen illegaal is, maar ook risico’s met zich meebrengt voor de verspreiding van de inhoud.
lees ook
Meta aangeklaagd voor gebruik van illegale data door Meta’s Llama-team
De rechtszaak is nog niet beslist en beperkt zich voorlopig tot de oudere Llama-modellen, maar de reputatieschade voor Meta is al berokkend. Een rechter noemde de pogingen van Meta om details te verbergen “gericht op het voorkomen van slechte publiciteit” in plaats van op bescherming van bedrijfsinformatie.