gremlin/Getty Images

Cum colectează telefoanele Android date și când spun că nu o fac21 min read

De Ionuț Preda 20.10.2021

Marii producători de telefoane Android și Google sunt mai curioși despre ce fac utilizatorii decât ar trebui să fie.

Utilizatorii de telefoane Android care nu vor să aibă de-a face cu reclame online personalizate, istoricul locurilor pe care le-au vizitat acum trei ani sau recomandări de știri în funcție de hobby-uri știu deja pașii de bază pentru a-și face telefonul mai privat. Aceștia vor face opt-out la orice setare sau recomandare de tracking/împărțire a datelor/analytics, vor ține serviciul de localizare mereu închis și vor  înlocui aplicațiile prea interesate de urmărirea activității online cu alternative open-source.

Se pare, însă, că astfel de acțiuni nu sunt suficiente pentru a folosi telefonul într-o manieră complet privată. Sau măcar cât nu să fie identificabil. Așa susține un studiu apărut la începutul lunii octombrie, „Android Mobile OS Snooping By Samsung, Xiaomi, Huawei and Realme Handsets”, tcd.ie care a testat dispozitive de la câțiva producători mari de telefoane Android și a observat că, surpriză, aceștia mint atunci când oferă acele opțiuni de opt-out și colectează oricum datele.

Dacă o parte dintre aceste date colectate nu sunt neapărat intrusive și poate chiar necesare pentru a asigura calitatea anumite servicii, altele sunt suficient de specifice pentru a putea identifica pe termen lung un dispozitiv aparte, prea detaliate pentru a fi justificate prin nevoia de a îmbunătăți experiența de utilizare sau chiar sunt trimise direct către agregatoare de date sau alți dezvoltatori de aplicații.

Unele aplicații sunt mai egale decât restul

Studiul a fost realizat de cercetători de la Universitatea din Edinburgh și Trinity College Dublin și a examinat datele trimise de pe variații ale sistemului de operare Android instalate pe telefoane Samsung, Xiaomi, Huawei și Realme, incluzând și două sisteme de operare derivate din Android, LineageOS și e/OS.

Telefoanele folosite au fost resetate la setările de fabrică și au fost configurate pentru a reflecta nevoile unui utilizator care ar dori să le folosească doar pentru apeluri și mesaj. Astfel, au fost dezactivate opțiuni de tracking, colectare/împărțire a datelor sau servicii opționale, precum stocarea în cloud sau Find My Device. Practic, orice setare din meniul telefoanelor care ar permite colectarea de date complexe a fost dezactivată.

Atunci când au studiat conexiunile pe care dispozitivile le făceau în timpul utilizării, cercetătorii au observat că, în ciuda acestor setări,date complexe erau transmise nu doar către producătorii telefoanelor, dar și către anumiți creatori de aplicații sau companii specializate în agregarea datelor.

„Vinovate” de transmiterea acestor date sunt aplicațiile instalate pe partiția de sistem a telefonului, adică cele preinstalate. La majoritatea telefoanelor e vorba de pachetele GApps (Youtube, Google Mail, Play Store ș.a.m.d), dar  și de alte aplicații,precum Facebook, OneDrive sau LinkedIn, în funcție de model.

Excepție fac telefoanele cu e/OS, care nu transmit astfel de date pentru că înlocuiesc aplicațiile proprietare Google cu cele din suita MicroG,Mai multe detalii pe microg.org copii open-source ale acestora care permit utilizatorilor să modifice în detaliu ce date sunt colectate de către orice aplicație de pe telefon.

La prima vedere, nu pare atât de grav faptul că producătorii de telefoane, sisteme sau aplicații primesc astfel de date, mai ales că sunt, în teorie, anonimizate și pot contribui la îmbunătățirea produselor sau platformelor respective.

Doar că studiul arată probleme multiple: o parte din indicatorii colectați de pe telefon pot fi folosiți pentru a alcătui un profil specializat dispozitivului pe termen lung și anulează opțiuni pe care Google le oferă pentru a preveni acest lucru; tipul de date și modul de colectare al acestora încalcă standardele impuse de Google pentru dezvoltatorii din Play Store; datele sunt colectate constant, chiar dacă nu deschizi vreodată aplicațiile respective; nu există vreun mod de a opri această colectare sau de le a dezinstala fără a-ți trece telefonul printr-un proces de rooting.„How to Rid Your Phone of Those Default Apps You Never Use”, wired.com

Ce date sunt colectate și de ce sunt sensibile, chiar dacă sunt anonimizate

Colectarea unor date specifice de pe telefon nu duce automat la posibilitatea identificării dispozitivului; de sine stătătoare, majoritatea datelor trimise de telefon nu pot fi folosite în acest scop.

Însă, atunci când acestea sunt strânse sau vândute către agregatoare precum Google, unele tipuri de date persistente, care sunt unice pentru fiecare telefon, pot fi corelate destul de ușor cu alte date anonimizate, obținând astfel un profil complex pentru un telefon sau utilizator specific, de la tipul și frecvența aplicațiilor folosite până la informații legate de apeluri sau mesaje.

Studiul a găsit că datele transmise de către aceste „aplicații de sistem” pot fi aranjate, larg, în trei categorii: identificatori ai dispozitivului/utilizatorului, date de configurare a dispozitivului, date de telemetrie/event logging.

Identificatori ai dispozitivului sau utilizatorului

Majoritatea interacțiunilor care sunt colectate pe un smartphone sunt legate de un identificator, însă asta nu reprezintă din start o problemă de privacy. De exemplu, identificatorul respectiv poate fi unic, pentru o singură interacțiune sau sesiune de utilizare a aplicației/telefonului, caz în care este foarte dificil de corelat din exterior cu alte tipuri de date de pe același dispozitiv.

Cu toate acestea, autorii studiului au observat că aplicațiile preinstalate strâng mult mai des acei identificatori care sunt persistenți. De exemplu, numărul de serie hardware al telefonului, care este unic, sau codul IMEIInternational Mobile Equipment Identity, un cod din 15 cifre specific fiecărui telefon, folosit în mare pentru a bloca dispozitivele furate de la accesarea rețelelor de telefonie mobilă – niciunul dintre acestea nu poate fi schimbat prin resetarea telefonului sau cu vreun software. În cadrul testului, s-a observat că Samsung, Xioami, Realme, Huawei și Google colectează astfel de date persistente prin intermediul acestor aplicații.

Un alt identificator persistent este Google Advertising ID (GAID) care, așa cum sună, oferă un cod specific telefonului pentru toate interacțiunile cu reclame virtuale (practic, un înlocuitor al cookie-urilor pe mobil, prin care advertiserii pot urmări mai facil acțiunile legate de reclame lor de pe un dispozitiv).

Resetarea acestui ID„How to Reset Your Advertising ID on Android”, howtogeek.com este una dintre soluțiile oferite de Google utilizatorilor pentru a identifica profilarea pe termen lung a unui telefon, pentru că, teoretic, un advertiser nu ar avea cum să facă legătura dintre mai multe GAID-uri și ar trebui să o ia de la zero cu construirea unui profil de utilizator de fiecare dată când acesta este resetat.

Ce date sunt colecționate de aplicațiile preinstalate și unde ajung în funcție de varianta de Android OS

Această opțiune devine, însă, redundantă dacă advertiserii ar avea acces la alte date persistente ale telefonului, caz în care GAID-urile pot fi legate între ele fără prea multă dificultate. În primul rând, de către Google, care colectează direct aceste date.

Google, de altfel, interzice dezvoltatorilor de aplicații de pe PlayStore, „Apps”, support.google.com să facă această legare a GAID-lui de alți identificatori persistenți și o permite agregatorilor de date doar cu „acordul explicit” al utilizatorului. Această interdicție, însă, nu se referă la colectarea datelor în sine, ci doar la ce se întâmplă cu ele după ce sunt conectate.

Pe lângă toate acestea, fiecare conexiune a dispozitivului cu un server transmite și adresa IP a telefonului, care de cele mai multe ori poate fi folosită pentru a afla geolocația utilizatorului (chiar și în cazul în care serviciul de localizare din telefon este dezactivat). Care, având în vedere colectarea de identificatori persistenți de pe telefoane, poate pune și alte date sensibile în mâinile companiilor tech.

Date de configurare ale dispozitivului

În general, colectarea unor date de hardware sau de configurație a sistemului – modelul telefonului, mărimea ecranului, versiunea sistemului de operare etc. –  nu reprezintă un risc de identificare a dispozitivului și sunt necesare pentru actualizarea sistemului de operare sau a aplicațiilor.

Din nou, există și un „dar”. În cadrul testelor, autorii studiului au observat că mai multe aplicații preinstalate transmit și detalii despre întreg setul de aplicații instalate, în funcție de telefon, către Samsung, Xioami, Realme, Huwaei, Google și Heytap.O firmă singaporeză care oferă diverse servicii de internet, precum un magazin de app-uri, stocare în cloud și browser propriu, instalate din start pe dispozitive Realme sau Oppo Acesta este un alt set de date care poate fi folosit pentru a identifica în mod specific un anume dispozitiv, iar motivul pentru care se face această colectare nu este clar.

Date de telemetrie/event logging

Poate cea mai intrusivă și problematică descoperire din studiu se leagă de modul în care aplicațiile de sistem urmăresc activitățile utilizatorului, așa-numitul „event logging”, în care sunt înregistrate interacțiunile de pe dispozitiv și date specifice, precum durata în care o aplicație este deschisă. Asta în ciuda faptului că toate telefoanele testate oferă opțiunea de opta împotriva colectării de astfel de date pentru diagnostice sau analytics.

Cel mai agresiv logging este făcut de Xiaomi, care păstrează atât acțiuni individuale, cât și calupuri de interacțiuni executate pe telefon, cu timestamp-uri aferente pentru deschiderea sau închiderea aplicațiilor. Prin decriptarea comunicațiilor trimise de telefoane către serverele Xioami, cercetătorii au putut observa, de exemplu, că producătorul chinez este notificat de fiecare dată când telefonul formează sau primește un apel, inclusiv orele care acestea au fost efectuate și se termină, precum și durata acestora.

Nici Samsung nu stă cu mult mai bine. O parte din aplicațiile preinstalate pe telefoanele gigantului tech folosesc Google Analytics pentru a urmări date specifice de utilizare a aplicațiilor, din nou cu durată și timestamp. Una din aceste aplicații păstrează istoricul cartelelor SIM inserate în dispozitiv, în timp ce alta urmărește istoricul apelurilor.

Telefoanele care folosesc tastatura virtuală Swiftkey a celor de la Microsoft (instalată din oficiu pe Huawei) fac și ele logging agresiv. În acest caz, înregistrează aplicațiile în cadrul cărora este folosită (cu tot cu nume), numărul de caractere folosite pe sesiune și un timestamp. Ceea ce înseamnă, practic, că strânge un istoric detaliat al folosirii opțiunilor de căutare, aplicațiilor de mesagerie, căutării contactelor în agendă și a altor astfel de interacțiuni.

În afară de sistemele pe care rulează e/OS/, în toate cazurile Google colectează cantități mari de date de pe toate dispozitivele prin Play Services și Play Store, care nu au putut fi decriptate și pentru care nu există nicio documentație sau explicație publicată până în momentul de față.

În rest, aplicațiile preinstalate trimit date complexe despre utilizarea lor specifică către dezvoltatori. Printre acestea se numără Facebook, Avast (pe Huawei), Daily Motion sau HeyTap (ambele pe telefoane Realme).

Când vine update-ul cu transparența?

Este important de menționat că studiul doar dovedește că astfel de date sunt colectate și nu neapărat că ele ar fi schimbate între companii sau vândute advertiserilor. Însă acest potențial există, iar concluzia studiului este că în afară de telefoanele care rulează LineageOS sau e/OS, o corelare a datelor colectate cu telefonul individual ar putea fi realizată de toți producătorii testați, de Google și, în funcție de model, de companii precum Microsoft sau Heytap.

Iar faptul că aceste date sunt colectate în background, fără opțiune de opt-out sau de dezinstalare a aplicațiilor care realizează colectarea, nu crește neapărat încrederea în modul în care giganții gestionează datele extrase fără voia specifică a utilizatorului. Încredere care devine și mai fragilă când se ia considerare faptul că a fost nevoie de studii independente pentru ca astfel de practici să devină publice.

CITEȘTE ȘI: Cum să îți cureți viața digitală. Ghid practic.



Text de

Ionuț Preda

Redactor cu câțiva ani de experiență în presa centrală. Este curios despre aplicarea tehnologiilor SF în lumea reală și evoluția ideilor de-a lungul istoriei.

TEHNOLOGIE|TIPPING POINT

Metaversul între post-cyberpunk și post-pandemie

De
Anunțul că Facebook își va lansa propria lume virtuală a generat fie panică față de o posibilă înrobire a omului de către mașină.
TEHNOLOGIE|TIPPING POINT

Cum se influențează reciproc oamenii și AI-ul?

De
Cercetătorii vorbesc despre etica AI-ului în contextul unei lumi tot mai digitalizate.
TEHNOLOGIE|OVERVIEW

Primul procesor disponibil comercial, Intel 4004, a împlinit 50 de ani

De
Doi americani, un japonez și un italian au muncit și câte 80 de ore pe săptămână pentru a-l crea pe celebrul 4004, un procesor care a ajuns să fie folosit și în calculatoarele militare din România.
SOCIETATE|STUDIU

De la Tarantino la Squid Game: de ce atât de multor oameni le place violența?

De
Luna trecută, peste 100 de milioane de oameni s-au uitat la Squid Game serialul sângeros de pe Netflix. Dacă violența de pe ecran este dăunătoare, s-au scris tomuri întregi. Consensul este că poate avea efecte negative. Dar întrebarea de ce suntem atrași să urmărim violența a primit mult mai puțină atenție.