Foto: Sorbetto / Getty Images

Social media limitează accesul la API, iar asta afectează cercetarea26 min read

De Radu Stochița 08.08.2023

Platformele de social media continuă să limiteze accesul cercetătorilor la date, chiar dacă s-au folosit de API-uri permisive, în trecut, pentru a crește.

Datele publice de pe rețelele de socializare reprezentau până de curând o mină de aur pentru cercetători. Aceștia aveau acces la un volum masive de informații la doar un click distanță. Postările publice de pe Twitter au fost folosite pentru a înțelege orientările electorale ale indivizilor, cele de pe comunitățile Reddit, pentru a antrena AI, iar relațiile dintre paginile de Facebook, pentru a descoperi rețele propagandistice.„Facebook as a research tool for the social sciences: Opportunities, challenges, ethical considerations and practical guidelines”, nlm.nih.gov

Dacă până de curând accesul la date era relativ deschis, Meta a restricționat accesul, iar Twitter și Reddit i-au călcat pe urme.„Why we should care about API restrictions”, siliconrepublic.com Cercetătorii deplâng limitarea accesului la date,  însă în realitate accesibilitatea informațiilor nu a fost niciodată făcută pentru a facilita descoperirile academice, ci strict pentru creșterea profitului. 

Momentul în care API-ul a devenit incomod

În 2018, ieșea la iveală adevărul despre Cambridge Analytica. O companie de cercetare britanică apropiată de partidul conservator se folosea de datele colectate de la utilizatorii Facebook pentru a-i crește popularitatea lui Donald Trump. Nu era pentru prima dată când Facebook era în centrul unui scandal legat de datele personale ale utilizatorilor, doar că incidentul CA avea să schimbe imaginea cercetării pe internet în totalitate.

Platformele de social media obișnuiau să ofere posibilitatea prelucrării anumitor date publice printr-un API, o Interfață de Programare a Aplicației. Aceasta reprezintă modul în care un website comunică cu alte platforme ce doresc să se folosească de datele sau algoritmii acestuia. Spre exemplu, Facebook oferă și acum posibilitatea accesării postărilor publice și cercetarea acestora de către platformele de fact-checking, pentru a identifica teme conspiraționiste sau dezinformări.

API-ul reprezintă un mod de comunicare, un limbaj prin care două platforme se înțeleg între ele. Nu doar platformele de social media se folosesc de API, ci și hărțile online, ca Google Maps sau Apple Maps, care vând servicii dezvoltatorilor de automobile pentru interfețele de navigație. Bursa de Valori de la București are propriul API, prin care oferă date despre companiile tranzacționate în timp real.„Bursa de Valori București – Web Service API Descrierea serviciuluit”, bvb.ro

Modul de comunicare între două platforme a fost util, în timpul pandemiei de COVID-19, pentru platformele media care s-au folosit de API-uri guvernamentale pentru a urmări evoluția cazurilor. Centrul pentru Controlul și Prevenirea Bolilor, CDC-ul american, dezvoltase API-uri prin care raporta numărul de cazuri noi de coronavirus, de care New York Times, The Guardian sau Casa Jurnalistului se foloseau.„APIs | CDC Open Technology”, cdc.gov

Am vorbit cu Vlad Ursulean, Casa Jurnalistului, care în perioada pandemiei a codezvoltat un portal web de urmărire a evoluției numărului de cazuri COVID-19. Vlad a deplâns inexistența unui API guvernamental care să facă treaba jurnaliștilor mai ușoară. 

„La început publicau PDF-uri cu chestiile astea, era groaznic, deci până la API este foarte mult”, spune Ursulean. „Parcă făceau tot ce posibil să facă datele imposibil de citit. Ideea este că tot timpul a trebuit să schimbăm sistemul pentru că guvernul schimba sistemul de raportare, au schimbat și sistemul de numărare a cazurilor, a fost a fost pur și simplu un haos, deci nici măcar nu s-a ajuns la la chestii avansate. A fost o ostilitate digitală.”

În cazul platformelor de social media, unde acumularea profitului este narativă predominantă, API-urile au avut și scopul de-a mări numărul de utilizatori de Facebook și de a crește timpul pe care-l petrec pe platformă, pentru a fi expuși la mai multe reclame. Rebekah Tromble, profesor de media și relații publice în cadrul George Washington University, a spus că„Where Have All the Data Gone? – A Critical Reflection on Academic Digital Research in the Post-API Age”, sagepub.com „API-urile au fost concepute pentru dezvoltatorii ale căror jocuri și alte aplicații ar aduce mai mulți utilizatori pe platforme. Au fost concepute pentru ca corporațiile să își monitorizeze bazele de clienți, identitatea mărcii și publicitatea. Pe scurt, au fost concepute pentru profitul platformelor.”

Cum a crescut Facebook cu ajutorul API-ului?

Platformele de social media se folosesc în continuare de API-uri, doar că în prezent accesul la date este mult mai limitat, iar înainte de accesare, utilizatorii sau companiile care o fac sunt analizate. Cambridge Analytica a costat Facebook prea mult în 2018. Mark Zuckerberg a fost târât în multiple multiple audieri guvernamentale, valoarea companiei a scăzut cu 119 miliarde de dolari în mai puțin de 24 de ore, iar încrederea utilizatorilor a scăzut.„Over $119bn wiped off Facebook’s market cap after growth shock”, theguardian.com La scurt timp după publicarea investigației, Facebook a limitat accesul la API-urile companiei, în unele cazuri l-a blocat în totalitate, apoi a înăsprit controlul.„How the facebook API led to the Cambridge Analytica Fiasco”, apiacademy.co

Până în 2018, Facebook era cunoscută pentru API-ul ușor de accesat de către dezvoltatori și indivizi. În 2006, când Mark Zuckerberg lansase public Facebook, compania de social media promova un model de API deschis, față de Friendster sau MySpace, care erau cunoscute pentru un ecosistem închis. În timp ce MySpace se lupta cu dezvoltatorii terți care încercau să construiască widget-uri, Mark Zuckerberg îi încuraja pe oameni să creeze ceea ce-și doresc.„Facebook opens its API in hopes of eclipsing MySpace”, arstechnica.com În 2009, MySpace crea pentru prima dată un mediu mai favorabil dezvoltatorilor terți, doar că era prea târziu: Facebook era pe un trend ascendent, iar MySpace stagna.„MySpace Launches Real-Time Stream API”, news.softpedia.com

Varii teorii există pentru a explica prăbușirea MySpace, dar e clar că un aspect important l-a avut API-ul deschis pe care Facebook era dispusă să-l ofere tuturor. Doi cercetători coreeni au analizat că deschiderea API-ului către publicul larg a contribuit la o creștere masivă a traficului și a vizitatorilor unici pe paginile Facebook.„An Analysis of Network Competition with Changes of Network Topology through ‘Open AI’”, psu.edu 

În 2009, Zynga lansa Farmville, joc în care utilizatorii de social media își puteau construi și întreține propria fermă. Pentru a juca, utilizatorii trebuiau să se conecteze cu un profil de Facebook, de care mai apoi se foloseau pentru a comunica cu prietenii ce se jucau. Farmville era pay-to-win, dar pentru cei care nu doreau să doneze bani pentru a construi un hambar mai repede puteau veni în ajutor prietenii de pe Facebook. Îmi amintesc cum, în 2021, alături de colegii de școală, ne construiam strategii pentru a maximiza profitul fiecărei ferme. Dacă eu îi trimiteam energie, resurse și oameni unui prieten, celălalt făcea la fel atunci când aveam nevoie.

Această formulă obliga practic utilizatorul să-și dezvolte rețeaua de prieteni de pe Facebook pentru a-și putea creșt ferma sau să doneze bani pentru a cumpăra îmbunătățirile necesare. Fiecare nou jucător reprezenta pentru Zynga un potențial de a-și mări profitul, iar pentru Facebook un utilizator în plus. În 2011, Farmville ajunsese la un maxim de 85 de milioane de utilizatori unici, în timp ce Facebook avea aproximativ 600 milioane de utilizatori la finalul anului 2006.„FarmVille once took over Facebook. Now everything is FarmVille.”, nytimes.com 

Iar acesta era doar cel mai popular dintre miile de jocuri de pe platformă. O analiză a școlii de business Wharton din cadrul Universității din Pennsylvania arăta cum interdependența dintre companiile de jocuri precum Zynga și Facebook au reprezentat mecanismul de creștere din spatele amândurora.„Is Zyngas’ Dependence on Facebook the Key to Its Success – Or Its Downfall?”, wharton.upenn.edu

Dependența de Facebook pe care Zynga a avut-o de la început a reprezentat însă o slăbiciune, deoarece orice schimbare a modului în care datele erau prelucrate avea să afecteze compania de jocuri. Și dezvoltatorii de aplicații terțe Reddit au trecut printr-un asemenea fenomen recent, dar Zynga a fost printre primele care să experimenteze falimentul. În timp ce Candy Crush se extindea pe mai multe platforme, FarmVille rămânea pe Facebook,„Is Zyngas’ Dependence on Facebook the Key to Its Success – Or Its Downfall?”, cnet.com iar asta i-a fost fatal.

Cum se face cercetare pe internet?

În timp ce Zynga se folosea de API-ul Facebook pentru a-și mări profitul, iar indirect pentru a mări profitul lui Mark Zuckerberg, instituțiile de cercetare încercau să se folosească de aceleași unelte pentru a studia fenomene sociale.

Facebook nu era singura platformă de socializare de pe care date erau colectate, iar mai apoi analizate. Platforma Twitter era renumită în rândul cercetătorilor datorită volumului mare de date publice pe care oricine, chiar cu puține cunoștințe digitale, îl putea accesa, iar mai apoi analiza.„Apps and their affordances for data investigations”, jstor.org Chiar dacă API-ul Facebook nu a fost niciodată făcut pentru cercetători, aceștia au dezvoltat unelte pe care să le folosească pentru analiză.

Cercetarea nu este o știință inerent etică, iar datele, indiferent de mărimea acestora, pot fi folosite atât în scopuri nobile, dar și pentru a distruge. Cercetătorii din domeniu prezintă o situație dezolantă, în care cercetarea, dar și datele sunt fetișizate, sunt puse pe un piedestal, iar mai apoi privite cu admirație.„Objects of Intense Feeling – the case of Twitter API”, computationalcultures.net În timp ce unii cercetători se folosesc de API-uri pentru a identifica riscul dezinformării și a combate atacuri asupra democrației, grupuri precum Cambridge Analytica se ocupau de complet opusul.

Scandalul Cambridge Analytica a zguduit internetul în 2018, când a ieșit la iveală ceea ce oamenii considerau deja a fi adevărat: datele utilizatorilor sunt vândute și folosite mai apoi în scopuri politice. Cambridge Analytica cumpărase seturi de date de la un utilizator, lector la Universitatea Cambridge, care declarase că se folosește de acestea pentru cercetare. Lectorul crease o aplicație ce oferea un test psihologic gratuit, dar care colecta date nu doar de la persoanele ce-l accesau, ci și de la prietenii acestora. Chiar dacă doar 270.000 de persoane au accesat testul de personalitate, Cambridge Analytica a avut acces la profilurile a 85 de milioane de utilizatori.

Mai apoi, pe baza informațiilor oferite, a construit profiluri de votanți, pentru a identifica cine este mai predispus să voteze pentru Donald Trump. Profilurile erau elaborate și includeau până și preferințe de dulciuri, iar pe baza acestora livrau reclame utilizatorilor pentru a-i împinge mai aproape de mesajul conservator. 

Schimbările de API și cercetarea de acum?

După ce limitările asupra API-ului Facebook au fost făcute publice, cercetătorii au denunțat măsura ca fiind un dezastru pentru cercetarea academică.„Facebook’s data lockdown is a disaster for academic researchers”, theconversation.com Aceeași reacție au avut cercetătorii și în mai 2023, când și Twitter a anunțat limitarea accesului la API.„Twitter just closed the book on academic research”, theverge.com 

Totuși, profesoara Rebekah Trombe, reamintește că aceste tehnologii nu erau niciodată făcute pentru cercetători,. Dimpotrivă, platformele de social media au încercat mereu să le limiteze accesul. Acum, conform Rebekah Trombe, cercetătorii nu trebuie să deplângă vremurile când volume masive de informație erau disponibile oricui, ci să-și imagineze noi metode de cercetare, mult mai etice.„Where Have All the Data Gone? – A Critical Reflection on Academic Digital Research in the Post-API Age”, sagepub.com 

„În loc să ne concentrăm pe obținerea mai multor date de pe platforme, trebuie să ne concentrăm pe obținerea de date de înaltă calitate”, spune Trombe. „De asemenea, trebuie să ne concentrăm pe a face o muncă mai bună și mai etică cu acele date. În loc să punem în prim plan și să fetișizeze datele în sine, întrebările semnificative din punct de vedere social ar trebui să servească drept punct de plecare. Și trebuie să recunoaștem responsabilitățile pe care le avem atunci când lucrăm cu date digitale, în special față de persoanele reprezentate în acele date. Având în vedere aceste priorități, sugerez două strategii ample pentru a urmări accesul la date în continuare.”

Nu doar Rebekeah Trombe argumentează că aceste API-uri erau pentru cercetători, ci organizații precum Pew Research Center concluzionau încă din 2015 că sunt multe dificultăți pe care un individ sau grup academic trebuie să le depășească atunci când accesează date.„The challenges of using Facebook for research”, pewresearch.org Deschiderea API-ului către public de către Facebook a fost motivată de creșterea platformei, de ridicarea ecosistemului fără de care nu poate fi imaginată viața socială digitală astăzi.„Facebook’s data lockdown is a disaster for academic researchers”, the conversation.com Cercetătorii s-au nimerit a fi acolo la momentul potrivit, au putut identifica căile de acces care le erau oferite dezvoltatorilor de software și să le utilizeze în scopul coordonării cercetării.

Chiar dacă Facebook a făcut mai dificil accesul cercetătorilor, iar ulterior Twitter și Reddit s-au alăturat acestui trend, nu trebuie neglijat modul în care datele au fost folosite. Recent, discuția despre siguranța și protecția datelor personale de pe internet s-a mutat către utilizarea acestora de către companii care dezvoltă inteligența artificială. API-ul Reddit era gratuit până acum câteva zile, iar conducerea executivă a anunțat că trebuie  compensată pentru datele pe care OpenAI le-a folosit pentru a antrena ChatGPT. 

 CITEȘTE ȘI: Reddit s-a prăbușit. De ce?

Totuși, accesul cercetătorilor nu e blocat definitiv, ci mult mai controlat. Pentru a-și spăla imaginea, Meta, în urma scandalului Cambridge Analytica sponsorizează cercetări și programe doctorale,

Meta are o pagină web dedicată cercetării, unde postează în mod regulat diverse teme pe care dorește să le analizeze o persoană sau grup de cercetători din afara companiei.„Facebook launches new research award opportunity focused on digital privacy”, research.facebook.com Fiecare subiect propus are legătură în mod direct cu unul dintre produsele Meta. Chiar dacă oferă impresia că Zuckerberg se gândește la binele comun, idealul profitului tronează în motivele companiei. În 2022, printre subiectele analizate se numărau „avatare VR ultra-realiste”, care probabil urmează să fie folosite în extinderea metaversului. Recent și TikTok și-a deschis baza de date disponibilă cercetării în spațiul european, doar că limitările sunt mari, iar accesul cercetătorilor individuali se face pe bază de aplicație.„TikTok allows Europe to access research software, with eye on EU online content rules”, reuters.com

Chiar dacă era colectării volumelor masive de date publice de pe rețele sociale se apropie de un posibil sfârșit, Rebekah Trombe le spune cercetătorilor să se gândească  la un viitor rezilient și la o defetișizare a cercetării de dragul de-a studia ceva. Închiderea unor uși reprezintă deschiderea altora.



Text de

Radu Stochița

Radu Stochița este jurnalist freelancer și a scris despre tech, economie și lumea muncii pentru Hotnews, Libertatea, Jacobin, Nation, Al Jazeera. În paralel, face cercetare economică pentru Cartel ALFA. Radu a absolvit Bowdoin College, din SUA, și este Watson Fellow.

TEHNOLOGIE|SOLUȚII

Grafenul, un material miraculos, ajunge în lumina reflectoarelor cu sprijin european

De
Grafenul a ieșit din laboratoare și a ajuns pe piață datorită contribuției deloc neglijabile a UE, potrivit prof. Patrik Johansson.
TEHNOLOGIE|SLOW FORWARD

Xiaomi 14 Ultra marchează oficial sfârșitul camerelor de travel

De
Senzorul de 1 inch Sony LYT-900 cu diagramă variabilă și kitul opțional de fotografie te lasă să treci acest model la o categorie hibrid, telefon-cameră foto.
TEHNOLOGIE|OVERVIEW

Neuralink: între promisiunile SF, lipsa de transparență și abuzurile din experimente

De
Interfața neuronală visată de Elon Musk este la început de drum, dar e deja încărcată de controverse.
SOCIETATE|SOCIAL MEDIA

Cyberbullying, printre primele lucruri cu care se confruntă tinerii ce încep explorarea internetului

De
Hărțuirea cibernetică sau cyberbullyingul este un fenomen din ce în ce mai întâlnit în rândul tinerilor, cei care se și expun cel mai des pe Internet. Consecințele pot fi devastatoare pentru sănătatea mentală și emoțională a victimelor.