Alin Dobrin/How to Web

Start-up-urile merită să investească în AI doar dacă au acces la date personalizate

De Mihai Ghiduc 16.10.2023, ultima actualizare: 23.10.2023

Zachary Gleicher crede că modelele de limbaj actuale vor deveni mult mai bune la task-uri generale, iar asta va avea efect asupra multor lucruri, de la asistenții digitali la felul în care cauți pe internet.

Poate nimic nu a fost mai relevant pentru viteza cu care se mișcă lumea tehnologiei decât felul în care au evoluat discuțiile despre inteligența artificială între două ediții How to Web. Dacă anul  trecut start-up-urile de AI erau un subset redus, care folosea machine learning în moduri personalizate, anul acesta Zachary Gleicher de la Google DeepMind a vorbit în prima zi a festivalului, pe scena Build & Grow, despre folosirea modelelor mari de limbaj, precum ChatGPT, Bard sau Claude, și provocările aduse de acestea.

 Zachary Gleicher se ocupă de aplicațiile practice dezvoltate de Google DeepMind,// Funcția exactă este Co-lead, Applied Product Management. // start-up-ul „vinovat” de multe dintre lucrările teoretice care au dus la dezvoltarea actualelor modele de limbaj. El a venit la București pentru a participa la conferința How to Web, // „How to Web Conference 2023”, howtoweb.co // care a avut loc pe 4-5 octombrie, la Face Convention Center.

CITEȘTE ȘI: Inteligența artificială e imprecisă, dar poate ajuta la rezolvarea problemelor matematice complexe. Interviu cu Petar Veličković (Deep Mind)

Iată ce părere are el despre felul în care chatboții AI au cucerit lumea și despre viitorul modelelor de limbaj și felul în care vor schimba universul start-up-urilor, despre cum a pierdut Google startul (și probabil că încearcă să-l recupereze, dar despre asta nu mi-a putut vorbi) și despre viitorul căutărilor pe internet.

Foto: Alin Dobrin/How to Web

Modelele de limbaj sunt impresionate, au învățat singure limbi străine

„Internaționalizarea unui software e mereu dificilă. De obicei se începe de la engleză și se dezvoltă de acolo. Ce este extrem de valoros la modelele de limbaj este că multe date provin de pe internet, iar internetul conține informații în atât de multe limbi că modelele nu mai trebuie să fie instruite pentru fiecare limbă în parte. Dacă setul de date de instruire include informații din diferite limbi, modelul le poate învăța singur, ceea ce este impresionant. Dar este esențial să primească date de calitate, acesta este provocarea, având în vedere cât de mult gunoi se găsește pe internet.”

În viitor, un singur AI va înțelege text, imagine și audio

„Mai avem mult de cercetat în acest domeniu. Anticipez modele mai avansate care să perceapă și să producă date audio sau video. Idealul ar fi să avem un model unic, care să proceseze diverse tipuri de intrări și să le și producă. Ar fi ceva puternic, pentru că atunci când dispui de modele specializate pentru fiecare sarcină, acestea tind să fie mai puțin robuste. Un model unic ar beneficia de toate datele, în loc să folosească seturi separate de date pentru fiecare model. În ceea ce privește perspectiva pe termen lung, fiecare companie are propriile sale viziuni. Sunt convins că vom vedea numeroase companii care vor inova în zona asistenței computerizate. Google, de exemplu, are Google Assistant și Bard și inovează mult acolo. Direcția va fi dată de ceea ce este mai benefic pentru utilizatori și de ceea ce pare a fi cea mai logică abordare.”

Asistenții digitali vor deveni în sfârșit utili

„Una dintre marile provocări în dezvoltarea uneltelor precum Google Assistant, Alexa sau Siri este nevoia de a stabili mai multe reguli pentru a gestiona fiecare sarcină. Dacă cineva vrea să seteze o alarmă, e nevoie de o echipă de ingineri și manageri de produs care se gândesc la experiența de utilizare. Vrei să faci livrare de mâncare? Trebuie să analizeze toate modurile de gândire ale utilizatorilor. Dacă nu formulezi cerința corect, adesea aceste unelte nu răspund corespunzător. 

Ai putea întreba «Cum este vremea astăzi?» și ar putea funcționa perfect, dar dacă ai spune doar «Cum este vremea?» și nu ai adăuga «astăzi», poate că nu ar funcționa. Este dificil, pentru că e greu să codifici totul. Ceea ce este atât de puternic la modele mari de limbaj este că sunt mult mai robuste, că înțeleg nuanțele limbii umane mult mai ușor decât aceste modele mai rigide și nu trebuie să fie instruite pentru o sarcină foarte specifică. Vom vedea mai multe tehnologii asistive cu care poți vorbi ca și cu un om, ceea ce va fi minunat.

Pentru înțelegerea limbajului natural, asistenții vocali folosesc un model pentru a transforma discursul în text și un altul pentru a procesa acest text. Apoi, un alt model decide cum să genereze text și, în final, un alt model generează discursul audio. Imaginează-ți că primul model înțelege greșit și transcrie incorect ceea ce ai spus. Tot ce urmează este compromis, iar aceasta este o problemă, face ca sistemul să fie fragil.”

Foto: Alin Dobrin/How to Web

Mai are sens ca start-up-urile să personalizeze AI-uri?

„Numeroase start-up-uri se dezvoltă pe baza modelelor fundamentale de la Google, OpenAI sau Anthropic, adăugând un strat suplimentar. Dar apare o dilemă. Dacă te uiți la o companie ca JasperAI, ei au creat o întreagă afacere pe a ajuta oamenilor în redactarea materialelor de marketing și blogurilor mai rapid și mai eficient, ceea ce e remarcabil. Însă modelul de bază evoluează constant și cred că dilema va fi între abilitățile la care vor fi mai bune aceste modele de bază față de cele care pot fi îmbunătățite de start-up-uri. Dacă lucrezi la ceva nișat, cum ar fi domeniul sănătății sau juridic, și dispui de date de calitate, private, este clar că ai un avantaj. Dar dacă lucrezi la abilități mai generale, modelele de bază vor deveni tot mai bune la ele.”

Jurnalismul va fi mai eficient cu AI

„Cred că multe dintre aceste instrumente AI vor ajuta jurnaliștii să fie mai eficienți. Mi-ai spus că folosești AI pentru înregistrare și că te ajută să transcrii. Cred că multe dintre aceste unelte te vor ajuta să creezi conținut mai bun. AI-ul poate funcționa ca ca un corector, un coautor, poate verifica acuratețea informației. Am vorbit cu mulți jurnaliști despre cum folosesc AI în munca lor, sunt cu adevărat curios să văd cum îi poate ajuta, cum îi poate face mai eficienți.”

Google a ratat startul pentru că mizele au fost prea mari

„Google acordă o mare importanță siguranței, eticii și responsabilității, este unul dintre lucrurile care îmi plac la a lucra acolo. Google are și mai mult de pierdut dacă ceva nu merge bine, mizele sunt mai mari. Când Google a anunțat Bard, a existat o greșeală de tipar, legată de telescopul Hubble, iar prețul acțiunilor Google a scăzut cu cinci procente – doar de la o simplă greșeală în materialul de marketing. De aceea, Google trebuie să fie extrem de atent. Compania a realizat multe inovații, cum ar fi articolul original despre transformator și alte cercetări care sunt folosite pentru inteligența artificială, dar Google vrea să fie atent și să facă lucrurile corect. Sunt mulți oameni de la Google care se gândesc la cum să implementeze AI-ul.”

Căutarea pe internet se va schimba radical

„Cea mai mare afacere a Google este serviciul de căutare, folosit de mulți oameni pentru a obține informațiile de care au nevoie. Oamenii se bazează pe căutarea Google ca pe un fapt real. Și cred că încă se fac multe cercetări despre cum să faci aceste AI-uri mai sigure, astfel încât să nu disemineze informații eronate. Dacă oamenii pun întrebări foarte sensibile pe Google, iar aceste modele greșesc, aceasta poate avea un impact negativ semnificativ asupra vieților lor.

Cred că serviciul de căutare se preocupă foarte mult de oferirea celei mai bune experiențe pentru utilizatori și de crearea unui ecosistem sănătos. Dar apar noi tipuri de comportament. 

Până acum câțiva ani, dacă plănuiam o călătorie în România, înainte de apariția AI generativ, aș fi mers pe Google și aș fi căutat «cele mai bune lucruri de făcut în București», «cele mai bune hoteluri din București» și probabil aș fi avut o serie de interogări diferite. Dar de fapt ceea ce vreau să spun este «Merg la București pentru o conferință, voi fi acolo câteva zile, probabil voi avea ceva timp liber seara. Ce aș putea face în timpul ăsta? Iată ce îmi place să fac, dă-mi un răspuns.» 

Vom începe să vedem că oamenii pot obține astfel informațiile pe care le caută și cred că va fi foarte important să creăm un ecosistem sănătos, iar Google se gândește la asta. Dar eu nu sunt implicat în aceste discuții.”



Text de

Mihai Ghiduc

Redactor-șef. A oscilat între print (Opinia studențească, Men's Health, Maxim, Marie Claire) și online (Vice, Glamour, Slow Forward) până l-a prins din urmă revoluția tehnologică.

AI&ROBOȚI|FYI

AI-urile ușoare și fără abonament se înmulțesc

De
În timp ce „Big AI” îți cere 20 de dolari pe lună, apar modele alternative pe care le-ai putea folosi gratuit. Dacă știi programare. Sau dacă-ți cumperi ochelari.
AI&ROBOȚI|FYI

Boston Dynamics a lansat un model electric al robotului umanoid Atlas, care va fi testat prima dată în fabricile auto Hyundai

De
Boston Dynamics, liderul mondial în dezvoltarea de roboți mobili, și-a luat la revedere de la unul dintre modelele principale, dar nu pentru mult timp.
MONEY|MS TALKS

Click, click & click pentru antrenarea AI-ului. Crowdworking-ul sau munca pentru câțiva cenți

De
Am discutat cu o cercetătoare despre conceptul de crowdworking, folosit printre altele la antrenarea motoarelor inteligenței artificiale, în care oamenii dau click pe imagini, pentru câțiva eurocenți, pentru a crea tehnologia viitorului.  
TEHNOLOGIE|MS TALKS

TikTok: „Nu acceptăm reclame politice, dar politicienii pot cere voturi pe platformă”

De
În timp ce SUA iau în discuție chiar interzicerea TikTok, platforma investește în centre de date, pentru a securiza informațiile utilizatorilor europeni, în speranța că va atenua la timp îngrijorările politicienilor.