Guliver/Getty Images

Rezultate Vot – Despre date deschise și alegeri corecte

De Dragoș C. Costache 02.10.2020

Code for Romania face un apel pentru standardizarea datelor, ca un prim pas spre transparența administrativă

Pe 27 Septembrie, România a votat în cele mai răsunătoare alegeri (nu o spun eu, ci presa străină)„Centre-right Parties Trounce Social Democrats in Romanian local elections”, balkaninsight.com din ultimii ani și posibil cele mai importante din deceniul care de-abia a început (asta o spun eu, pe sentiment). A fost o serie de răsturnări de situație interesantă, am făcut alegeri în plină pandemie și ca la orice ciclu electoral, ne-am și distrat cu acuzațiile de fraudă.„Acuzații de fraudă la Sectorul 1. Poliție: Un candidat pe listele unui partid a fost găsit cu 473 de procese verbale asupra sa”, digi24.ro

Dar în paralel cu procesul de vot la care mulți dintre noi (dar nu o majoritate) am mers, o serie de ONG-uri se agitau din greu ca acel vot să fie corect. Mă refer la prietenii din coaliția Fiecare Vot și la Funky Citizens ai căror voluntari au pierdut ore dacă nu zile din viață asigurându-se că votul era corect. Însă, odată terminat votul și început procesul de numărare, cineva trebuia să convertească fișierele electronice în format CSV emise de AEP în ceva inteligibil pentru noi cei care stăteam cu sufletul la gură. Și aici intervenim noi, cei de la Code for Romania.

Când nu scriu despre jocuri„Cine o să construiască Drumurile?”, mindcraftstories.ro sau conspirații„Cui îi este frică de Bill Gates?”, mindcraftstories.ro pe aici, lucrez la Code for Romania, unde mă ocup de cercetarecomunicare și, ocazional, de grătare. Cu toții avem propriile noastre proiecte de suflet, și preocupările mele cele mai importante de la Code țin toate de alegeri. Pentru că de fiecare dată când se apropie alegerile zilele par că se evaporă, și toată lumea de la noi începe să doarmă mult mai puțin pe măsură ce taskurile încep să se strângă.

Aplicații electorale

Ne-am făcut-o, oarecum, cu mâna noastră. Primul proiect al Code for Romania a fost unul electoral, Vot Diaspora, cel mai de succes proiect, Monitorizare Vot, e unul electoral și cel mai nou proiect al nostru este, bineînțeles, tot unul electoral, Rezultate Vot

Rezultate Vot e ideea unui voluntar Code for Romania care a preluat acum mai bine de un an rezultatele în timp real oferite de Autoritatea Electorală Permanentă și le-a transformat într-un mic tool care afișa rezultatele pe o pagină statică. Până la prezidențiale, pagina evoluase, avea un UXUser experience, un termen folosit în design-ul web pentru a cuantifica modul în care experiența utilizatorului este mai ușoară și mai plăcută. semnificativ mai bun, era mai stabilă și pe deasupra arăta numărul de sesizări (via aplicația Monitorizare Vot) și prezența la vot în timp real (via AEP). 

Și pentru alegerile locale am pregătit cea mai mare evoluție a Rezultate Vot, transformând site-ul nu doar într-un instrument de date instante, ci într-o bază de date ușor de utilizat, în format grafic, a tuturor alegerilor din România din 1990 și până astăzi.  Cu mici excepții, astăzi puteți căuta orice alegeri din orice județ pe pagină asta, pe lângă funcționalitățile precedente. Există și o secțiune de live blogging pentru un grup de experți care au fost alături de noi. Site-ul nu a fost ușor de făcut doar cu muncă de voluntari și s-au muncit câteva mii de ore bune per total ca să iasă. Iar buna sa funcționare depinde de un și doar de un lucru: datele de la AEP.

Date care, când au venit, au venit în cea mai proastă formă posibilă. Structura inițială a datelor fusese oricum alterată, deoarece la alegerile locale pot vota și cetățenii UE, iar colegii noștri de pe tehnic au trebuit să refacă structura bazei de date cu câteva ore înainte de publicarea primelor rezultate. Însă când aceste rezultate brute au început să apară, a devenit destul de evident că avem o problemă foarte mare. Nu doar că datele nu erau în formatul utilizabil, dar seturile de date erau inițial amestecate (secții din București, Buzău și Brașov contorizate la comun), structura datelor nu respecta nici o regulă imaginabilă – cu candidații într-o ordine care nu era nici alfabetică, nici conformă cu ordinea buletinele de vot. Mai mult, fișierele erau în formate diferite și nu puteau fi preluate automat.

Mi-e greu să descriu exact toată munca depusă de colegii noștri nedormiți de 48 de ore pentru a reuși să remedieze aceste deficiențe. Important este că după aproape șase ore de muncă neîntreruptă de structurare și preluare a datelor, genul ăla de muncă  intensă, demnă de „hacking-ul” din filme„The Incredible Hack: Five of the worst on-screen hacking scenes”, medium.com am reușit să punem Rezultate Vot înapoi pe picioare la 4:52, la fix cât să pice de la traficul de dimineață, cu oameni reîncărcând obsesiv pagina ca să afle rezultatele oficiale. Totul s-a terminat cu bine până la urmă, rezultatele sunt online, dar am rămas cu niște concluzii trase.

 Datele nu sunt de ajuns

Dacă am învățat ceva în ultimii patru ani în această organizație este că datele nu sunt de ajuns. Existența datelor e doar un punct de pornire, și adesea un capăt de linie. Pentru că e o tactică veche de ani buni în România ca atunci când ceri o serie de date de la stat, fie printr-o cerere de informații sau o petiție, acestea să fie predate într-un format neprietenos, indiferent dacă vorbim de PDF-uri sau baze de date necurățate. Munca de a aduce acele date la niște standarde utilizabile e migăloasă și plictisitoare. Și este, mai ales, una absolut inutilă. Pentru că toate aceste date ar trebui să existe, din start într-un format bun și preferabil să fie disponibile fără să mai fie nevoie să le ceri. 

Code for Romania lucrează destul de des cu date și am convenit o serie de principii de bază cu privire la calitatea datelor. Asta înseamnă că datele trebuie să fie, în mod ideal, lizibile electronic, adică să poată fi preluate automat, dar și lizibile uman, adică să „aibă sens” pentru utilizatori. De asemenea, datele trebuie să fie consecvente – adică fiecare variabilă să fie prelucrată identic în toate seturile de date. În al treilea rând, datele trebuie să fie date brute, precise și granulare, nu date gata procesate. În ultimul rând, dar poate cel mai important, ele trebuie să fie „date ordonate”,„Tidy data”, vita.had.co.nz adică să respecte o serie de principii de structurare. Datele nu sunt îndeajuns, este nevoie ca ele să fie ușor de preluat, analizat și reprodus, altfel rămân doar seturi de caractere.

Întorcându-ne la cazul nostru, putem spune că datele furnizate de AEP nu au respectat, cel puțin la început, niciunul dintre principiile enunțate mai sus, fiind dezordonate și inconsecvente. Doar cu multă muncă, din mers, ele au putut fi aduse la niște standarde minime, cât să ajute Rezultate Vot să își îndeplinească funcția. Și știm cu toții că localele sunt de departe cele mai dificile alegeri, tocmai de aceea ar fi trebuit să fim cu toții mai pregătiți, de la Code for Romania și partenerii noștri și până la autorități și partide. Pentru că, da, o mai bună disciplină a datelor ar fi putut duce și la o evitare a scandalului fraudei de la Sectorul 1 din București.

Ce putem face?

Noi, la Code for Romania, suntem mari fani ai standardelor de date ca un prim pas spre transparența administrativă. De aceea am publicat într-un format ușor de citit (și reprezentat grafic) toate datele electorale disponibile pe Rezultate Vot. Și tot din același motiv am decis să dezvoltăm un portal de date simplu, ușor de folosit și open-source (ca toate aplicațiile noastre) pe care să-l punem la dispoziția instituțiilor interesate. 

Sperăm să avem un cuvânt de spus în revoluția Big Data din administrația publică din România și ca Rezultate Vot și Data Portal să fie niște primi pași timizi spre date deschise și transparență administrativă. Până reușim acest miracol, vă așteptăm pe social media cu scurte analize de date de la aceste alegeri, iar eu vă aștept în newsletter-ul nostru CoolturalÎnscrie-te aici cu recomandări de filme cărți, jocuri, seriale și cu tot ce are de oferit mai bun internetul.



Text de

Dragoș C. Costache

A studiat antropologie și științe politice – și asta îl ajută să fie genul de om care are păreri pe Internet. E crescut în epoca ASCII, dar vorbește fluent emoji.

SOCIETATE|OVERVIEW

Ce sunt Parler, Gab sau MeWe, platformele spre care migrează conservatorii?

De Ionuț Preda 14/01/2021
Site-urile care se declară „alternative pentru free speech” au înregistrat recorduri de trafic după evenimentele recente din SUA.
SOCIETATE|HOT TAKE

Twitter vs. Trump. Momentul care a făcut rețelele sociale prea puternice.

De Iulian Comănescu 13/01/2021
Ce bine că Twitter l-a blocat pe Trump! Dar dacă ne făcea asta nouă, pe 10 august 2018?
SOCIETATE|2020

(Aproape) totul despre 2020

De Mindcraft Stories 16/12/2020
Poate că 2020 a fost anul pandemiei, dar lumea științei și a tehnologiei nu s-a rezumat doar la coronavirus.
SOCIETATE|TIPPING POINT

Cum au scăpat rețelele sociale algoritmii pe scări și au divizat societatea

De Mihai Ghiduc 08/12/2020
De la Brexit la AUR, mesajele conspiraționiștilor de pretutindeni trec prin serverele din Silicon Valley.