AI vs Copyright. Fac față legile actuale AI-ului generativ?13 min read
Cât de adaptate sunt actualele legi ale dreptului de autor apariției AI-ului care generează texte și imagini?
Una dintre îngrijorările ridicate de apariția inteligenței artificiale generative este legată de drepturile de autor. Este încălcat copyright-ul atunci când OpenAI sau Midjourney generează text sau imagine după ce au fost antrenate pe „tot internetul”? Este cumva încălcat încă din procesul de învățare, pentru că operele sunt asimilate de modelele AI la grămadă și fără acordul autorului sau deținătorului de drepturi?
Creatorii tehnologiei spun că nu. AI-ul generează opere originale, pe baza informației existente, iar folosirea lor în antrenarea AI-ului e acoperită de doctrina fair use – la fel cum e acoperit, de exemplu, faptul că cineva învață dintr-o carte sau află o informație dintr-un ziar și folosește ideea într-un articol. Alții nu sunt neapărat de acord, în frunte cu creatorii care-și văd bucăți de opere folosite de AI-uri sau joburile puse în pericole de apariția acestor modele.
CITEȘTE ȘI: AI-ul (încă) nu a furat joburile designerilor
Multe dileme se vor lămuri în instanțe
Destui sunt dispuși însă să testeze asta în instanță, în frunte cu // „The Times Sues OpenAI and Microsoft Over A.I. Use of Copyrighted Work”, nytimes.com // primul publisher major care a dat în judecată Open AI, sau // „Photo giant Getty took a leading AI image-maker to court. Now it’s also embracing the technology”, apnews.com // care se judecă cu Stability AI. Unul dintre argumente e că articolele sau imaginile „ingerate” de modelele AI erau după un paywall, iar plata unui abonament vine cu acceptarea unor termeni și condiții. Altul, că uneori AI-ul nu crează un produs nou, ci plagiază originalul – acceptat de OpenAI drept o eroare de antrenare care trebuie corectată.
Procesele s-au înmulțit în 2024. De la urmașii lui // „George Carlin Estate Settles Lawsuit Over AI-Generated Comedy Special”, variety.com // care nu vor ca regretatul comic să fie imitat de AI, la ONG-ul austriac // „OpenAI’s ChatGPT targeted in Austrian privacy complaint”, reuters.com // care spune că informațiile incorecte date de ChatGPT despre diverse persoane încalcă legile europene ale dreptului la intimitate, și de la // „Sony Music Warns Companies to Stop Training AI on Its Artists’ Content”, bloomberg.com // care nu vrea ca AI-uri să se antreneze pe produse muzicale, fie ele melodii, versuri sau coperți de album, dar mai ales // „Sony, Universal sue AI music generators for ‘training’ models on copyrighted songs”, indianexpress.com // și până la // „Amazon Is Investigating Perplexity Over Claims of Scraping Abuse”, wired.com // care crede că Perplexity AI a abuzat prin folosirea conținutului de pe serverele Amazon pentru antrenarea unui AI, acestea devin tot mai diverse și mai complexe.
Fair use, dar peste tot în lume?
Apărarea OpenAI&co. se bazează puternic pe fair use, // Dar care a fost adoptată parțial și de alte țări, precum Israel, Polonia sau Coreea de Sud. // care permite utilizarea limitată și rezonabilă a materialelor protejate de drepturi de autor fără a cere permisiunea titularului, de regulă, pentru critică, comentariu, știri, educație sau cercetare. Nu-i de mirare – majoritatea jucătorilor majori din AI sunt americani.
Conceptul e permisiv și lasă loc la interpretări legale în instanță, în special datorită așa numitului // Four factor test, wvu.edu // care se uită la scopul utilizării, natura operei, cantitatea utilizată și efectele asupra operei originale. Cel mai probabil, opozanții companiilor AI vor argumenta că punctele trei și patru nu încălcate – prin folosirea integrală a creațiilor și pentru că ar putea avea efecte financiare. Însă într-o situație similară, când Google s-a apucat să scaneze integral cărți pentru a le pune pe Google Books, instanța a decis că gigantul tech // Detalii pe wikipedia.org //
Situația poate fi diferită în alte țări, care n-au doctrina americană fair use. Există concepte similare și în alte legislații, inclusiv în cea românească, adunate în capitolul VI al Legii 8/1996, intitulat // „Dreptul de autor | Lege 8/1996 actualizată 2024”, lege5.ro //
Directiva europeană care reglementează AI-ul, numită // „Artificial Intelligence Act”, europarl.europa.eu // încearcă să găsească o balanță prin care să nu pună o povară prea mare pe startup-urile de tehnologie, dar în același timp să respecte dreptul utilizatorilor, care să-și poată scoate operele din datele folosite pentru antrenarea modelelor AI sau să fie compensați corect.
Totul se rezumă la bani
În ultimele două cuvinte, „compensați corect”, stă soluția. Cu siguranță, legile dreptului de autor, fie ele americane sau europene, n-au fost gândite pentru situații în care sunt procesate cantități imense de date în foarte scurt timp, ci mai degrabă pentru viteza de procesare umană, însă oricare variantă a legii ai citi, accentul e pus mai degrabă pe drepturile materiale decât pe cele morale, iar aici viteza de procesare nu contează dacă compensația e „corectă”.
Mult înainte de a începe orice proces, firmele de AI au spart deja lucruri, după deja celebrul motto a lui // „Did Mark Zuckerberg Say, ‘Move Fast And Break Things’?”, snopes.com // cam la fel cum mp3-urile au stricat industria muzicală. Și, la fel cum casele de discuri au ajuns la un compromis și trăiesc din banii de la Spotify, YouTube sau TikTok, în timp ce CD-urile sunt o antichitate, și producătorii de conținut se vor înțelege cu firmele de AI – ba chiar aș paria că mult mai repede.
Un semn că așa stau lucrurile este că procesul intentat de The New York Times celor de la OpenAI a venit după ce nu s-a ajuns la un acord între cele două companii. Un altul e că unul dintre primele gesturi ale OpenAI e să licențieze imagini de la Shutterstock pentru a antrena DALL-E, // „Shutterstock Expands Partnership with OpenAI, Signs New Six-Year Agreement to Provide High-Quality Training Data”, shutterstock.com // și că a continuat prin a semna acorduri cu publisheri precum // „Partnership with Axel Springer to deepen beneficial use of AI in journalism”, openai.com // // „TIME and OpenAI Announce Strategic Content Partnership”, time.com // sau // „OpenAI signs deal with Financial Times to use content to train AI models”, seekingalpha.com // în timp ce Google s-a înțeles cu // „As Tech Firms Prioritize AI in News Dealings, Other Deals Get Cut”, theinformation.com //
Practic, bătălia care se dă acum este pentru sumele pe care creatorii de conținut – a se citi prin asta deținătorii mari de drepturi – le vor primi de la OpenAI, Google sau alții ca ei din cei 20 de euro pe lună pe care-i iau de la utilizatori. Direcția pare a fi către o sumă fixă anuală, dar asta probabil va însemna că pe termen lung, fie AI-ul se va antrena doar pe informațiile primite doar de la anumite siteuri, fie va folosi tot netul, dar îi va plăti doar pe cei cu avocați buni. Câte vreme legile dreptului de autor protejează banii produși de creații, nu creațiile, se vor găsi mereu soluții – dar nu pentru căței.