Foto: Blaise Hayward / Getty Images

Ce obiectiv are algoritmul?53 min read

De Alin Răuțoiu 19.05.2023

Pare că inteligența artificială reconfigurează relația omului cu tehnologia în feluri nemaiîntâlnite până acum. Însă pot fi făcute anumite comparații cu filmul cu ajutorul cărora să ne ghidăm prin perioada incertă care urmează.

În februarie anul acesta, autorul polimat Ted Chiang a scris pentru The New Yorker un articol„ChatGPT is a blurry JPEG or the web”, newyorker.com unde compară sistemul ChatGPT cu un fotocopiator care amalgamează cunoașterea existentă pe internet și o reproduce într-o formă comprimată, introducând artefacte pe care le confundăm cu sintetizări inteligente ale unui text. La un anumit nivel sunt de acord cu multe dintre afirmațiile din cadrul articolului, însă metafora folosită mi-a dat de gândit. O imagine poate să fie curată, lipsită de zgomot, netrucatăÎn contextul analogiei cu un LLM, acesta să nu fie antrenat pe afirmații eronate sau vădit conspiratoriale. și totuși să reprezinte doar o anumită fațetă a adevărului.

La momentul de față modelele generative pe bază de machine learning, cunoscute în spațiul public drept inteligență artificială, se află într-un soi de limbo, generând produse din ce în ce mai utile și convingătoare, însă totuși destul de evident parțiale, inexacte, incomplete, ba uneori chiar mincinoase. Asta duce în mod automat la un scepticism față de răspunsurile primite. Fie că ar fi folosit în jurnalism,„Can ChatGPT Help Journalists Fact-Check Faster?”, generative-ai-newsroom.com programare„How good is ChatGPT at writing code?”, botpress.com sau în finanțe„Some traders say ChatGPT gives them out-of-date information and they waste time fact-checking”, businessinsider.com tocmai „creativitatea” sistemului e ceea ce îl face nepotrivit.

Ce se va întâmpla însă atunci când acele artefacte ale procesului de „copiere și reproducere” nu vor mai fi evidente, când „JPEG-urile” produse de modele GPT-X vor fi afișate la o asemenea rezoluție încât nu vor putea fi distinse de „PNG-uri”? Pentru Chiang ar deveni neinteresante din cauza lipsei lor de creativitate, dar asta nu e o perspectivă larg răspândită. Foarte mulți utilizatori nu caută proză de calitate sau argumente insolite, ci răspunsuri la întrebări cât se poate de practice. Posibilitatea de a interoga internetul prin limbaj natural e în sine ceva atractiv.

Există probabil dintotdeauna tendința de a confrunta rezultatele unei măsurători mecanice cu realitatea obiectivă. Asta și pentru că, de cele mai multe ori, dispozitivul folosit este suficient de bine confecționat și calibrat încât se potrivește contextului, iar investigarea critică a rezultatului măsurătorii ar fi o risipă de timp. Dar uneori nu-i asta situația reală. 

Sigur ții minte replica emblematică „Not great, not terrible” din serialul Cernobîl, când Diatlov căuta orice motiv pentru a minimiza magnitudinea dezastrului, iar dozimetrul cu limita superioară de 3,6 röntgeni i-a oferit pretextul perfect. Momentul dramatizează situații care se întâmplă de altfel adesea, chiar dacă rareori cu rezultate catastrofale. 

Iar în cazul unui instrument de măsurare științific lucrurile încă stau bine. Pe lângă faptul că precizează explicit limitele în care pot fi folosite, precum și mărimea erorilor măsurătorilor, informația colectată este foarte specifică, nu poate funcționa drept cunoaștere utilă. Trebuie să fie pusă într-un context, să fie introdusă într-un model din care să reiasă interpretări. Dar instrumentele pe bază de machine learning, nu doar modelele de limbaj, fac deja o parte din procesul acesta, iar uneori parcurg suficient de mult din el încât să pară că l-au dus până la capăt. La o investigare naivă, pare că au produs cunoaștere.

CITEȘTE ȘI: Sunt DALL-E sau GPT-3 o amenințare pentru munca creativă?

Nu există multe alte dispozitive care ocupă funcții similare, anume metode de investigare și captare a realității care aduc la un loc multiple surse de informație, parcurgând numeroși pași din procesarea lor critică. Dar există câteva, cum ar fi camerele de filmat.

Aparatul foto și cel de filmat nu măsoară intensitatea radiației luminoase reflectate de o anumită suprafață și compoziția ei în lungimi de undă. Pelicula de film și senzorii camerelor digitale sunt sensibili la anumite lungimi de undă, răspund la anumite intensități, astfel încât creează imagini și secvențe care pot servi naiv drept cunoaștere. Asta nu înseamnă nici pe departe că imaginile produse sunt obiective.

Subiectivitatea obiectivului

Poate ai observat că filmele și serialele sunt mai întunecate de ceva vreme, uneori la limita lizibilității. Spectatorii serialelor Game of Thrones și House of the Dragon sigur s-au tot plâns de asta.„“Game of Thrones” Fans Still Think It’s Too Dark to See Anything”, vice.com Prima explicație pentru fenomen a căzut strict în domeniul tehnic, în cea mai mare parte s-a dat vina  pe cetățenii care nu știu să-și regleze televizoarele cum trebuie.„’Game of Thrones’ cinematographer says the show being too dark is your own damn fault” , mashable.com

Mult mai persuasiv mi s-a părut argumentul că această nouă estetică ar rezulta din compunerea mai multor factori concentrați în jurul tehnologiilor digitale, dar fără a reieși dintr-o schimbare anume.„Why are modern films underexposed?”, youtube.com Noile camere digitale ca ARRI ALEXA sau Red Dragon permit calitate cinematografică în condiții mult mai puțin stricte decât filmul, iar cum senzorii lor pot opera pe o gamă mai largă a intensității luminii decât pelicula, asta încurajează regizorii și directorii de imagine să experimenteze cu scene mai puțin expuse. În același timp, procesul de reglare a culorilor este diferit față de developarea negativului și vine cu propriile idiosincrazii de care unele echipe de producție nu sunt conștiente. 

Aparatura profesională pe care sunt montate aceste filme și seriale este, ei bine, profesională, de calibru industrial. Se prea poate ca detalii clare pe un monitor 8K HDRDispozitivele cu high dynamic range permit o gamă mai largă de tonuri, ceea ce înseamnă că diferența dintre zonele luminoase și cele întunecate poate să fie mai pronunțată, fără a se pierde din detalii. să fie șterse sau chiar complet distruse pe televizoarele casnice, multe dintre ele încă doar HD și fără HDR. Camerele în sine excelează la a prinde imagini în lumină slabă, dar algoritmii de compresie folosiți de serviciile de streaming fix aici eșuează, zdrobind valorile joase, pentru a permite mai multe detalii în zonele de intensitate înaltă, acolo unde ochiul uman poate observa mai bine diferențele.„Why dark video is a terrible mess”, youtube.com

Iar în final, da, televizoarele sunt prost calibrate.„How your TV settings ruin movies”, youtube.com

Totuși, câteva lucruri nu se leagă. În primul rând, dacă toate aceste probleme sunt cunoscute până și publicului larg, în mod cert profesioniștii ar trebui să fie familiari cu ele și să compenseze. Apoi, acea senzație de subexpunere, de încețoșare a imaginii, de întuneric care face detaliile greu de distins nu era prezentă în filme realizate de pionieri ai tehnicii digitale. Sunt multe lucruri pentru care Star Wars Episode II: Attack of the Clones„Industrial Light & Magic retools its technologies to finish Star Wars: Episode II.”, theasc.com poate fi criticat, dar nu și că ar avea măcar vreun cadru la care trebuie să te chiorăști pentru a înțelege ce se întâmplă. 

Așa ceva nu e cazul cu blockbustere recente, cum ar fi Solo: A Star Wars Story, ca să rămân în teritoriul francizei. Același lucru este valabil și pentru filmele lui David Fincher, ale cărui thrillere ca Zodiac sunt un model de imagine, dacă nu și de poveste, pentru multe dintre producțiile de pe Netflix, care însă ratează claritatea și precizia cu care regizorul operează.

Acest determinism tehnologic a fost criticat într-un articol controversat de pe Polygon.„Why are movies so dark these days?”, polygon.com Autorii articolului, A.B. Allen, propun un soi de autonomie a esteticului în care se urmărește o genealogie artistică, un adevărat arbore de familie ale cărui ramuri trasează surse de inspirație și influențe artistice.Discuție pe care au continuat-o ulterior pe Twitter. Ceea ce a născut controversa, însă, este ancorarea acelei opțiuni estetice într-o noțiune de surprindere a realității care se ține cel mai mult într-un joc de cuvinte. Materialul introduce dihotomia dintre iluminare motivată și nemotivată, adică între surse de lumină care ar avea o justificare diegetică și lumina proiectată doar pentru a face vizibil un subiect. 

Textul a stârnit o suma de reacții, toate însă acceptând la un anumit nivel ideea că iluminarea motivată ar reprezenta mai fidel realitatea, problemele comentatoriilor cu această abordare variind de la faptul că vor totuși să vadă ce e în cadru, până la a o considera nepotrivită pentru filme SF și fantasy. Premisa aceasta cred că trebuie interogată.

Un film american comercial din anii 1990 unde subiectul principal este clar evidențiat de reflectoare atent poziționate nu este mai puțin verosimil decât un film de Greig Fraser, în care acesta aproape că încearcă să picteze cu lumina. Prima este doar o abordare mai funcțională în care iluminarea și optica au scopul de a defini cât mai clar topologia scenei și conținutul mizanscenei, iar a doua e o abordare care speculează filmul ca mediu nu prin ceea ce surprinde, ci prin mecanismul prin care imaginea este captată, anume prin stimularea de către o rază de lumină a unei pelicule fotosensibile sau a unui senzor.

Evitarea luminii nemotivate poate sugera la prima vedere că ar produce imagini mai naturale, în sensul că ar fi mai apropiate de felul în care am vedea aceleași situații în viața reală, făcând astfel maimuțoii din The Mandalorian să fie mai credibili. Dar ochiul uman nu este camera de filmat, iar văzul este un fenomen care se petrece în creier, imaginea de pe retină fiind doar un pas dintr-un lung proces prin care această senzație este construită cognitiv.

Realitatea din imagine

Greig Fraser are dreptate când afirmă că omul a evoluat să înțeleagă lumina,„Truth in the Image: Greig Fraser, ASC, ACS”, theasc.com dar apelul la biologie are totuși limite. Proiectăm spații pe care încercăm cât se poate să le luminăm, natural sau artificial, și purtăm după noi surse de lumină. Rareori orbecăim în clar-obscur, iar senzația de verosimil este construită mai mult de experiența noastră de zi cu zi, de așteptările noastre, nu de istoricul evolutiv. Oricum, dacă strămoșii noștri reușeau să vâneze antilope la amurg, asta înseamnă că le vedeau. Întrebarea care se pune este dacă apare unitate între ceea ce poate să vadă spectatorul și ceea ce pot vedea personajele. 

Evitarea surselor de lumină extradiegetice dizolvă această unitate și, ca atare, rupe și spectatorul din experiența vizionării. Am menționat deja filmele mult prea întunecate, dar există și reversul. Ambițiile vizuale ale lui Stanley Kubrick au dus la numeroase progrese în tehnica cinematografică, cea mai faimoasă fiind sprijinirea dezvoltării stabilizatoarelor de imagine Steadicam prin filmarea lui The Shining„The Steadicam and The Shining Revisited”, theasc.com cu un prototip al dispozitivului. 

Cu cinci ani înainte, Kubrick și-a propus să filmeze un film doar la lumina lumânării. Pentru asta a făcut rost de câteva lentile experimentale dezvoltate de NASA, iar împreună cu tehnicianului Ed DiGiulio au creat un obiectiv pentru o cameră de filmat. Astfel, Barry Lyndon„How Stanley Kubrick Filmed Barry Lyndon By Candlelight”, slashfilm.com a putut fi filmat în lumină naturală, aproape toate scenele din interior sau nocturne luminate numai de candelabre, făclii și lumânări. 

Doar că nici cu noul obiectiv nu se putea obține imaginea dorită. Soluția cineaștilor? Și mai multe lumânări! În anumite scene fiind nevoie de un număr caraghios de sfeșnice, detaliu care din fericire nu sare în ochi pentru un public larg, nefamiliar cu decorurile epocii napoleoniene. Nu este neapărat cazul filmului lui Kubrick, dar situația arată cum tocmai încercarea de a evita utilizarea artificiul iluminării motivate, duce la crearea de mizanscene artificiale.

Senzația de verosimil apare nu doar prin compararea filmului cu experiențele umane imediate, ci și cu alte forme de media. Filmul documentar și mai ales cel de reportaj, din considerente tehnice și logistice, deseori este plin de artificii care îi trădează mediul: calitate slabă a imaginii, mișcări evidente ale camerei, utilizarea unor obiective care deformează câmpul vizual, alăturarea de secvențe incoerente estetic și multe altele. Însă prin natura celor reprezentate, publicul asociază acea estetică cu realitatea, chiar dacă imaginea nu „păcălește” în vreun fel ochiul că ar fi altceva decât o reprezentare. 

Odată cu răspândirea camerelor video personale, acest joc cu categoriile estetice a ieșit din sfera unor filme strict experimentale sau a unor intervenții în producții dramatice convingătoare. Întâi în zona filmelor de artă și a celor independente, dar în cele din urmă a ajuns să se consume în cele mai mari francize și filme de la Hollywood. 

Chiar în timp ce mișcarea Dogma 95O mișcare începută de regizorii danezi Lars von Trier și Thomas Vinterberg care constrângea producerea de filme „pure”. Pentru a se conforma, un film Dogma 95 trebuia filmat în spațiul fizic, cu o cameră de mână. Sunetul și lumina trebuiau să fie digetice. Nu se accepta melodramă sau povești tipizate, de gen. Inclusiv fondatorii au renunțat la a respecta cu stricteța „dogma” după câte un film fiecare. Se accepta totuși montarea unei lămpi pe camera de filmat dacă nu se putea vedea altfel fața actorului. scotea primele producții care se conformau regulilor sale, The Blair Witch Project năștea un gen întreg de filme horror, așa-numitul „found footage horror”, iar la scurt timp după aceea Paul Greengrass a adus o estetică similară în filmul thriller și cel de acțiune. 

Pentru o însemnată perioadă de timp, de fiecare dată când o producție se voia a fi mai autentică, mai serioasă, apela la imagini tremurate, eminamente artificiale, cu zoom-uri sau focalizări lăsate la vedere și nu ascunse prin tăieri, pline de purici și artefacte, ba uneori chiar verzui, chipurile filmate prin infraroșu. Într-un final, această estetică „s-a răsuflat” în mainstream.Ca aproape orice curent artistic continuă bine-mersi într-o anumită nișă subculturală, ba chiar evoluează, incorporând artificiile specifice camerelor de pe telefoane mobile sau a webcam-urilor.

Parțial, cred eu, din cauză că noile camere digitale de filmat, inclusiv cele personale și de pe telefoanele mobile, elimină foarte multe dintre acele mărci stilistice, chiar dacă introduc altele. Stabilizarea imaginii face aproape imposibil „shakey-cam”-ul, rezoluțiile enorme ale senzorilor au eliminat „puricii”, dar și zoom-ul optic. 

În viața de zi cu zi, acea estetică nu mai era întâlnită aproape nicăieri în altă parte în afara comediilor de tip „mockumentary”, a scenelor de acțiune din filmele Transformers și a unor filme SF care căutau o patină de seriozitate și autentic: printre ultimele dăți când acel stil a fost folosit la Hollywood, în afara filmelor horror și de comedie care l-au îmbrățișat ca parte din subgenul lor, a fost în anumite scene din Elysium și în primul film din seria The Hunger Games.

Iar în cele din urmă, însăși compararea imaginii filmice cu senzația văzului poate merge doar până la un punct. Sunt atât de multe diferențe între felul în care operează văzul uman și cel în care funcționează aparatul de filmat încât cel mai simplu lucru ar fi să-ți ilustrezi singur asta încercând să faci o poză cu telefonul la orice obiect din jurul tău, cu luminile stinse. În primul rând va ieși mai întunecat și mai șters decât te-ai aștepta, apoi studiind imaginea vei vedea tot felul de lucruri, alte obiecte, scame, umbre, reflexii, care strică imaginea și pe care nu le-ai observat inițial. În unele cazuri e posibil ca obiectul să pară deformat în vreun fel, subtil alungit sau aplatizat ori mult mai îndepărtat. 

Minte ochiul? E camera proastă? Nu și probabil că nu. Fiecare „dispozitiv” selectează anumite informații pe care le filtrează într-un anume fel. Creierul crede că unele lucruri pe care ochiul le vede nu sunt de interes, așa că nu apar în senzația văzului. De asemenea ochiul se adaptează la intensitatea luminii și creează cât mai multe detalii cu putință, în timp ce aparatele de filmat au condiții mult mai restrânse în care operează optim.

În cazul unei camere de filmat creierul este chiar directorul de imagine. El aranjează luminile pe platou, se coordonează cu regizorul pentru a poziționa actorii și recuzita, totul pentru a produce imaginea dorită, pentru a selecta ceea ce trebuie văzut, cum trebuie văzut și ceea ce trebuie ignorat. Inclusiv acei directori de imagine care preferă iluminarea motivată introduc în cadru surse de lumină potrivite, schimbă becurile lămpilor pentru a obține culoarea și intensitatea căutată, gestionează spațiul pentru a avea reflexiile și umbrele necesare.„Understanding the Cinematography of Bradford Young”, iso1200.com

Chiar și făcând abstracție de mizanscenă, imaginea este construită încă dinaintea filmării, prin alegerea obiectivului, a filtrelor, prin reglarea acestuia și a camerei, prin selecția cadrului și apoi prin procesarea imaginii brute. Alegerea tipului de iluminare, dacă este posibilă această alegere, e doar un factor implicat într-un mult mai amplu proces de producere a imaginii. Imagine în care se încearcă mereu crearea unui efect estetic prin porționarea informației și a tipului de informație captată. Iluminarea nemotivată este doar unul dintre instrumentele de care un cineast poate dispune pentru a face publicul să vadă ceea ce dorește acesta să vadă. Nu este obținut ceva obiectiv, ci e prezentată subiectivitatea creatorilor.

Când Paul Cameron și Dion Beebe filmau cu Michael Mann Collateral pe camere video HD nu și-au pus problema „de unde vine lumina”, ci cum pot introduce lămpi suficient de puternice în taxiul cu care Jamie Foxx îl plimbă pe Tom Cruise printr-un Los Angeles nocturn, astfel încât publicul să poată totuși vedea fețele actorilor.„Collateral”, theasc.com

Procesul de filmare a mers în amote față de toate instinctele directorilor de imagine, care nu se puteau baza nici pe ceea ce vedeau cu proprii ochi, nici pe ceea ce apărea pe ecranele de monitorizare. Pentru obținerea unei imagini finale cu care să fie mulțumiți au fost nevoiți să pună cap la cap toate sursele de informație disponibile, cea mai importantă fiind cea oferită de senzorii de zgomot, prezentată strict ca informație numerică. Înainte ca imaginea să apară pe vreun ecran, ea exista în mințile autorilor.

A vedea și a cunoaște

În 2004, camera nu funcționa ca o sursă de cunoaștere, ci era doar unul dintre multele instrumente folosite pentru crearea imaginii așa cum era ea dorită de cei din spatele ei. În 2023, Tinkerbell nu strălucește„Peter Pan and Wendy Director Explains the Film’s Major Tinkerbell Update”, cbr.com în cea mai nouă ecranizare a Peter Pan pentru că David Lowery, și implicit publicul, nu îi poate vedea strălucirea prin obiectiv. Asta poate și pentru că în 2004 camera de filmat nu producea rezultate imediat convingătoare. Paul Cameron a experimentat cu trei modele de camcodere, pentru care a fost nevoit să confecționeze accesorii la comandă, astfel încât să poată măcar începe lungul și anevoiosul proces de a înregistra ce avea de înregistrat. 

Acest exercițiu încurajează în mod natural o abordare critică față de imaginea produsă și descurajează ideea că ar putea exista o imagine obiectivă. Între timp tehnologia a avansat atât de mult încât pur și simplu funcționează. Indiferent de condiții sau de subiect, poate produce o imagine care operează naiv drept cunoaștere.

Cred că aici poate fi găsit unul dintre motivele pentru care justificarea acestei opțiuni estetice virează adeseori într-un apel la autenticitate. Directorul de imagine nu mai trebuie să vadă cu „ochiul minții” o imagine pe care apoi să o construiască alegând tipul de film potrivit, obiectivul, aranjând luminile pe platoul de filmare și așa mai departe, căci camera îi oferă din start o imagine satisfăcătoare. Astfel, camera de filmat devine „ochiul” cu care lumea ajunge să fie văzută.

Ceea ce este paradoxal este că această situație nu este rezultatul unor camere de filmat suficient de bune, ci mai degrabă atât de bune. Cantitatea de informație vizuală captată de un ARRI ALEXA sau un Red Dragon este enormă pentru a permite regizorilor, directorilor de imagine și editorilor să extragă aspectul dorit. Steve Yedlin, directorul de imagine cu care Rian Johnson a colaborat la aproape toate filmele sale, merge atât de departe încât numește camera de filmat doar un „dispozitiv de colectat date”, insistând că nu există vreo estetică specifică unui format sau mediu, ci estetica trebuie produsă prin selecție și filtrare de către echipa de producție.„Image Format Comparison Demo: 35mm vs Arri Alexa”, yedlin.net Înainte de a fi prelucrată, imaginea brută este pur și simplu imaginea care conține toată informația de care este camera capabilă, într-un format optim din punct de vedere al stocării acesteia. Asta este „subiectivitatea” camerei de filmat.

Acesta este însă doar unul dintre cele mai vizibile moduri în care relația omului cu tehnologia a suferit transformări. Dacă dezvoltarea senzorilor pentru aparatele de filmat s-ar fi petrecut în izolare, nu cred că efectul ar fi fost la fel de pronunțat, de ubicuu și, în orice caz, ar fi fost recunoscut în primul rând ca o preferință estetică. Fotografia și filmul fiind pentru mai bine de un secol singura tehnologie care pare că nu doar oferă omului informație, ci că îi servește direct cunoaștere, a fost supusă încă de la început unui robust proces de investigare critică. 

De la opera lui André Bazin care a problematizat constant felul în care filmul construiește senzația de realism, adeseori tocmai prin abstractizare și trucarea realității, la Walter Benjamin, care găsește în film producerea de noi subiectivități inaccesibile ochiului liber, la eseistica polemică a lui Susan Sontag, caracterul excepțional al imaginii fotografice a încurajat o permanentă dezbatere asupra cunoașterii produsă prin acest instrument. Dar caracterul său nu mai este excepțional.

În ultimii aproximativ 15 ani sunt folosite din ce în ce mai multe dispozitive care sintetizează numeroase surse de informații pe care le prezintă drept cunoaștere utilă, gata de folosit naiv, fără vreun fel de intervenție critică. 

Google Maps a fost lansat în 2008. Gândește-te ce presupunea orientarea într-un spațiu înainte ca poziția ta să fi fost pusă aproape instantaneu pe o hartă actualizată constant. Chiar și având acces la o hartă, chiar și cunoscându-ți coordonatele folosind un terminal GPS, tot trebuia să construiești un model mental al spațiului la care să te raportezi în continuu, pe care să-l actualizezi în funcție de realitatea înconjurătoare, de diferențele dintre mediu și hartă. Navigatoarele de bord pentru automobile ofereau în linii mari o experiență familiară, însă făceau prea puțin pentru a-și justifica prețul în fața celor mai mulți consumatori: nu cunoșteau condițiile de trafic, iar hărțile trebuiau actualizate periodic, adeseori contra-cost.

Tehnologiile pe bază de machine learning sunt mai greu de identificat, dar ele sunt cele care se răspândesc cel mai repede, găsindu-și întrebuințări din ce în ce mai numeroase. De la serviciile de traducere la algoritmii de recomandare, devine o obișnuință zilnică să te încrezi într-un mecanism în privința unei probleme foarte complexe cognitiv. Iar asta pentru că, de cele mai multe ori, mecanismul are dreptate, cel puțin la un anumit nivel. 

Pe de-o parte obișnuința actului de a apela la astfel de instrumente, pe de altă parte caracterul static și predictibil al răspunsurilor oferite are potențialul să le facă să apară nu ca ceea ce sunt, adică instrumente, ci surse de cunoaștere. Și nu doar surse de cunoaștere, ci surse obiective, neutre, care prin natura lor algoritmică și statistică au acces la un nivel mai corect al realității.

De exemplu, problema fidelității unei traduceri era, până nu demult, imposibil de rezolvat, de unde și celebra expresie „traduttore, traditore”. Cel mai probabil încă este, dar utilizarea instrumentelor de traducere automată creează din ce în ce mai mult așteptarea ca traducerea să fie cât mai puțin „trădare”,„Losing Faith in Comics Translation”, tcj.com lucru oferit în aparență de Google Translate sau DeepL.

O obiecție facilă împotriva obiectivității cunoașterii produse de aceste sisteme pe bază de machine learning este că de cele mai multe ori datele statistice și premisele folosite pentru construirea și antrenarea modelelor reproduc biasuri sociale și instituționale. Prejudecăți ca rasismul, sexismul, clasismul au fost reproduse și chiar amplificate în multe dintre domeniile unde decizii complexe au fost lăsate pe seama unor astfel de modele, fie că este vorba de utilizarea lor în criminalistică,„Machine Bias”, propublica.org stabilirea chiriilor,„Housing discrimination goes high tech” curbed.com credite ipotecare,„Access Denied: Faulty Automated Background Checks Freeze Out Renters”, themarkup.org sănătate„Medical Algorithms Are Failing Communities Of Color”, healthaffairs.org sau evaluarea rezultatelor la învățătură.„Everything that went wrong with the botched A-Levels algorithm”, wired.co.uk

Obiecția este validă, dar la fel ca în cazul dilmei referitoare la utilizarea iluminării nemotivate în film, trebuie lărgit cadrul de referință în care este adusă. Problema biasului în machine learning este cunoscută, acceptată„Mitigating bias in machine learning for medicine”, nature.com și se încearcă în permanență a fi remediată. Acceptând că este doar o problemă de bias, înseamnă a vorbi despre o tehnologie care doar își așteaptă perfecționarea. Ar însemna că aceasta va ajunge la un moment dat să producă cunoaștere corectă, cunoaștere în care te poți încrede ca fiind obiectivă,Sau mult mai probabil, cunoaștere a căror surse de erori să fie atât de subtile încât activiștii și cercetătorii preocupați de justiție socială să își prezinte obiecțiile cu suficient de mari dificultăți încât să nu mai fie luați în serios de decidenți. fără să te gândești dacă ai pus întrebările bune sau dacă există un singur răspuns pentru interogările tale. Cred totuși că trebuie să te gândești în permanență la aceste lucruri.

CITEȘTE ȘI: Ethics washing în IA: riscul existențial pentru etică

Pe vremea când posibilitatea de a crea mașinării care să  răspundă la întrebări era doar o ambiție proiectată în viitor, subiectivitatea mașinăriei era o mare sursă de dubii și angoase. Filmul și literatura SF abundă de inteligențe artificiale care, din punctul lor de vedere, fac ceea ce le-am fost cerut să facă omorând oameni sau chiar distrugând civilizația. 

În 1979, Douglas Adams distilează problematica aceasta în cea mai tare esența a sa. Într-un moment din piesa de teatru radiofonic, apoi serie de romane și film Ghidul autostopistului galactic, personajele asistă la trezirea unui supercalculator care a meditat timp de 7,5 milioane de ani pentru a găsi „răspunsul suprem”. Acesta fiind 42. Nu rezolvă nicio problemă, deoarece creatorii săi nu știu care este „întrebarea supremă”. 

În Ultimul restaurant înainte de sfârșitul lumii aflăm că „întrebarea supremă” e cât fac 6 ori 9. Probabil nu a fost intenția lui Adams, dar reprezentate în baza 13, 6 ori 9 chiar fac 42. Toată această secvență de glume maimuțărește ideea că poate exista un răspuns care să pună capăt tuturor răspunsurilor. Orice întrebare este pusă de cineva aflat într-o anumită situație, într-un anumit moment, cu un anumit cadru de referință. Răspunsul nu poate exista în afara acestor constrângeri.

Literatura SF speculează spre groază sau umor incomprehensibilitatea subiectivității unei inteligențe artificiale. Până la dezvoltarea unei așa-numite „inteligențe artificiale generale”, imposibilitatea omenirii de a-și înțelege creația nu e o problemă . Omenirea se confruntă în schimb cu confundarea unei anumite neutralități a răspunsurilor obținute cu lipsa subiectivității sistemului. Dar sistemele au „un punct de vedere”. E punctul de vedere al creatorilor, al celor care creează metodologia proceselor de antrenare și stabilesc obiectivele sistemului. În cazul unor sisteme ca modelele de limbaj LLM, este media punctelor de vedere a societății care a produs seturile de date pe care au fost antrenate.

În eseul Situated Knowledges, o intervenție feministă de marcă în filosofia științei,„Situated Knowledges: The Science Question in Feminism and the Privilege of Partial Perspective”, jstor.org Donna Haraway critică ideea posibilității cunoașterii totale, complet obiective, după care știința gonește, sau cel puțin gonea în 1988. Acestui fel de cunoaștere, cel mai probabil imposibil de atins și distructiv de urmărit, îi contrapune conceptul de cunoașteri așezate într-un context. 

Prima ar fi cea produsă de un soi de ochi dumnezeiesc omniprezent și omniscient, a doua categorie e cea care vine din dispozitivele optice și diferiții ochi din natură. Ochiul uman nu vede mai corect sau adevărat sau real decât ochiul de muscă, ci fiecare s-a adaptat pentru a selecta anumite lungimi de undă, de anumite intensități, primite din anumite unghiuri, focalizate pe o anumită suprafață, din care creierul fiecărui animal produce o imagine. 

Cine știe cum apare senzația de imagine pentru muscă? Dar cert e că o face destul de bine să te evite când încerci să le plesnești. Același lucru este adevărat și pentru dispozitivele optice, fie că vorbim de microscoape, telescoape, camere cu infraroșu, camere video sau camere digitale profesionale.

CITEȘTE ȘI: ChatGPT e o fereastră asupra viitorului și ce-am văzut îmi dă sentimente amestecate

O altfel de problematizare și punere permanentă în context a surselor de informație pe baza cărora se poate construi cunoaștere, precum și a limitelor cunoașterii respective, devine din ce în ce mai necesară odată cu adopția pe larg a instrumentelor pe bază de machine learning. Așadar, cum te vei raporta atunci la cunoașterea accesată prin intermediul acestor instrumente când nu vor mai fi doar un JPG șters, când nu se vor mai putea ridica obiecții evidente împotriva felului în care au construit rezultatele prezentate? Le vei accepta răspunsurile drept realitatea obiectivă, de necontestat sau le vei trata doar ca pe una dintre multele surse de informație pe care le ai la dispoziție?



Text de

Alin Răuțoiu

Utilizează ziua tehnologii .Net și-și zice programator, seara citește benzi desenate, teorie critică sau încearcă să învețe să facă jocuri video. În weekend își terorizează pisica cu aspiratorul.

AI&ROBOȚI|TENDINȚE

Cum îi ajută AI-ul pe cei care au probleme când călătoresc?

De
Pentru o aplicație de rezervări ca Kiwi.com, AI-ul care să trimită acasă angajații din call center-uri n-a venit. În schimb, îi scapă de răspunsuri la întrebările simple. Cel puțin pe moment.
AI&ROBOȚI|OVERVIEW

Armatele lumii cochetează cu AI-ul. Care ar trebui să fie regulile?

De
 Problema „roboților ucigași” era până de curând ipotetică, dar boom-ul AI din ultimii ani a accelerat dezvoltarea acestora și, mai mult, a permis testarea în zone de război. Ce se întâmplă însă dacă îi lași  să ia decizii?
AI&ROBOȚI|SLOW FORWARD

Sam Altman controlează acum OpenAI, dar se chinuie să mențină interesul asupra AI

De
Pe măsură ce lumea realizează că inteligența artificială are nevoie și de altceva decât mai mulți bani, mai multă energie, mai multe computere, CEO-ul OpenAI se străduiește să păstreze vie flacăra speranței în „superinteligență acum”.
AI&ROBOȚI|MS TALKS

Primul LLM românesc. Cum va arăta viitorul inteligenței artificiale în România?

De
Cercetatori de la Universitatea Politehnica din București, Universitatea din București și Institutul de Logică și Știința Datelor (ILDS) au dezvoltat primele modele de limbaj (Large Language Model – LLM) în limba română. Proiectul este un prim pas în dezvoltarea inteligenței artificiale generative în România.