Vertigo3d/Getty Image

Slow Forward: ChatGPT va sta de vorbă cu tine

De Mihai Ghiduc 26.09.2023

Proiectele de inteligență artificială sunt tot mai multe și mai îndrăznețe, însă tot firma lui Sam Altman vine cu inovațiile cele mai apetisante.

Bătălia pentru AI n-a fost câștigată încă de OpenAI – sau cel puțin așa crede concurența. Sunt mișcări serioase pe piață și investiții masive în căutarea inteligenței artificiale generală sau, mai degrabă, a unor aplicații practice suficient de apetisante ca să le pui după un paywall.

OpenAI este însă în continuare în pole position și tocmai și-a întărit avansul cu noi anunțuri.

Agitație mare pe piața AI

De la OpenAI și Microsoft la Amazon și Google, toată lumea investește în AI. Până și Apple, care lucrează de zor la Ajax, chatbot-ul lor „secret”.„Apple is reportedly spending ‘millions of dollars a day’ training AI”, theverge.com

Tot OpenAI se mișcă cel mai rapid, cu ChatGPT audio și DALL-E 3

OpenAI face pasul următor spre ceea ce era de așteptat să devină AI-ul conversațional, anume spre audio. Dacă nu-l luăm în considerare pe ION, consilierul pierdut al fostului premier al României, ChatGPT va deveni primul AI cu care poți sta de vorbă.„ChatGPT can now see, hear, and speak”, openai.com (Și da, nimeni nu-l ia în considerare pe ION.)

Voi profita de ocazie să mă laud că am scris la finalul anului trecut: „faptul că [ChatGPT] funcționează printr-un prompt scris, nu unul vocal, e un impediment temporar”. Temporar a însemnat nouă luni.

Pe lângă voce, AI-ul de la OpenAI va reacționa și la imagini. Va fi un Google Lens mai deștept, deși unii ar spune că e deja AI-ul din Her.Detalii pe imdb.com

CITEȘTE ȘI: ChatGPT e o fereastră asupra viitorului și ce-am văzut îmi dă sentimente amestecate 

Noile funcții vor deveni disponibile abonaților Plus și Enterprise, în aplicația mobilă ChatGPT, în următoarele două săptămâni.

OpenAI a anunțat și a treia iterație a lui DALL-E,Detalii pe openai.com AI-ul care generează imagini, pe care o va face disponibilă clienților ChatGPT Plus și Enterprise din octombrie, probabil contra unei plăți suplimentare. Ideea ar fi că acum poți folosi ChatGPT pentru a genera și apoi rafina prompturile, iar noul model este mult mai precis. 

Imaginile generate cu DALL-E 3 vor aparține celui care le-a comandat, ca și până acum. Nu doar că nu ți se cer drepturi de autor, dar OpenAI încearcă activ să evite acuzațiile de încălcare a copyright-ului. Compania nu te lasă să ceri ca imaginile să fie făcute în stilul unui artist în viață și le dă acestora dreptul de a opta pentru ca operele lor să nu fie folosite în antrenamente viitoare. 

Desigur, asta nu acoperă toate cazurile de încălcare a copyright-ului (care protejează operele timp de 70 de ani după moartea autorului), iar varianta opt-out presupune un efort activ al artiștilor de a se exclude din baza de date.

Spotify va traduce podcasturile cu AI

O funcție care va fi disponibilă pentru cele mai populare podcasturi de pe Spotify va folosi inteligența artificială pentru a le traduce în alte limbi.Le poți găsi deja pe spotify.com Partea interesantă este că va fi folosită vocea prezentatorului și în celelalte limbi. Produsul se bazează tot pe un software de la OpenAI, numit Whisper. 

Desigur, se vor ridica noi discuții legate de privacy și siguranță dacă genul acesta de tool va deveni răspândit. De asemenea, nu este foarte clar ce se va întâmpla cu vocea invitaților din podcasturile traduse, atunci când aceștia există, sau care este protecția legală a vocii unei anumite persoane.

Microsoft își lansează Copilotul

Cei mai câștigați din avansurile făcute de OpenAI sunt cei de la Microsoft, care au susținut și finanțat start-up-ul. Așa că evenimentul recent de lansare a noilor produse din gama Surface (Laptop Go 3 și  Laptop Studio 2) a devenit unul despre AI.

Microsoft a anunțat„Announcing Microsoft Copilot, your everyday AI companion”, microsoft.com că toate funcționalitățile AI-ului de până acum vor fi disponibile ca un produs unitar în toate produsele companiei, iar acest lucru se va întâmpla începând cu 26 septembrie, odată cu următorul update de Windows 11. Microsoft Copilot propune 150 de funcții noi, inclusiv o (foarte utilă) funcție de căutare a informației prin fișiere și mail-uri și utilizării acesteia în documente.

În plus, Microsoft a anunțat că  DALL-E 3 va fi disponibil în Bing, alături de un un (mai puțin util) asistent de shopping care îți comandă produsele dintr-o fotografie.

Claude s-a împrietenit cu Amazon

Modele AI conversaționale cer resurse și e clar că fără procesare în cloud este aproape imposibil să oferi astfel de servicii. Așa că nu degeaba cei mai avansați au fost cei cu acces la servere: OpenAI (prin Microsoft) și Google. Era cumva de așteptat ca și cel mai mare serviciu de cloud, Amazon Web Services, să intre în cursă. 

Amazon a devenit partener minoritar„Anthropic \ Expanding access to safer AI with Amazon”, anthropic.com al celor de la Anthropic, cu o investiție de 4 miliarde de euro, alături de acces la serverele și puterea de calcul a companiei pentru modelul de limbaj Claude. 

Acesta este oferit deja ca API, prin Amazon Bedrock,„Claude on Amazon Bedrock”, aws.amazon.com clienților interesați să-și dezvolte modele AI proprii bazate pe Claude. De exemplu, Lonely Planet îl folosește deja pentru a genera itinerarii personalizate folosind baza de date de articole a publicației.

Google adaugă Bard în aplicații și ar putea lansa Gemini

Google a anunțat că introduce extensii„Bard can now connect to your Google apps and services”, blog.google pentru aplicațiile sale, care vor putea folosi de acum Bard. Astfel, modelul de limbaj al gigantului tech va fi disponibil în Gmail, Drive, YouTube, Flights, Docs sau Drive. 

Extensiile sunt însă disponibile doar în engleză și, cel puțin pentru moment, nu par a fi disponibile din România. Cum însă Bard e cam inutil, prin comparație cu ChatGPT, lipsa accesului nu e mare pierdere.

Google speră însă să treacă în fruntea cursei AI cu noul lor model, Gemini, anunțat în mai la Google I/O. Acesta va fi unul multimodal, adică va genera cel puțin text și imagine, dacă nu și alte medii (audio sau video) și e dezvoltat în colaborare cu DeepMind, compania deținută de Google care a creat multe dintre tehnologiile care stau la baza avansurilor actuale în inteligența artificială. 

Problema e că momentan nu prea se știe mare lucru despre Gemini, dacă nu iei în calcul numeroasele pagini de SEO care fac trafic pe seama curioșilor. The Information,„Google Nears Release of Gemini AI to Challenge OpenAI”, theinformation.com un site de tehnologie din San Francisco, a scris că lansarea e aproape și că firme apropiate de Google au deja acces la noul model, dar până acum nu a confirmat nimeni informația. 

Google investește (și) în start-up-uri AI, inclusiv românești

Google a anunțat pe 24 septembrie„AI startups changing the future of healthcare”, blog.google o listă celor 30 de start-up-uri de sănătate care folosesc inteligența artificială finanțate prin programul Google for Startups. Proiectele sunt din Europa, Orientul Mijlociu și Africa. 

Pe această listă este și Rayscape,Detalii pe rayscape.ai un start-up românesc pentru radiologiști, care își propune să îi ajute în interpretarea radiografiilor și tomografiilor computerizate pentru a depista cu precizie mai ridicată tumorile.

De asemenea, Google a demarat și programul AI First in Europe,„Inaugural Google for Startups Accelerator: AI First cohort”, google.com un accelerator pentru care au fost selectate 13 start-up-uri, inclusiv ZayaAIDetalii pe zaya.ai din România, tot un proiect de health tech care își propune să ajute medicii în diagnosticarea pacienților.

Nikon Fx

Alte știri, pe scurt

Nikon Zf, o cameră retro cool

După ce aspectul retro i-a lăsat pe cei de la Fujifilm fără stocuri de X100V, iată că și Nikon lansează o cameră mirrorless cu aspect retro.„Nikon releases the Z f full-frame mirrorless camera”, nikon.com Aceasta este, însă, una cu senzor full frame și obiective interschimbabile, care folosește același senzor EXPEED 7 ca și modelul Z9.

Modelul, care costă 2.500 de euro, fără obiectiv, se bazează pe aspectul lui Nikon FM2,Detalii pe wikipedia.org produsă de companie între 1982 și 2001, o cameră iubită de fotografi pentru că era rezistentă și folosea mecanisme clasice, mecanice, în locul circuitelor integrate tot mai la modă încă din anii 1970.

Fujifilm GFX 100 a trecut la versiunea II

Camera mirrorless cu senzor de format mediu de la Fujifilm a primit un upgrade.„Fujifilm launches Mirrorless digital camera FUJIFILM GFX100 II”, fujifilm.com Camera vine cu senzor nou, de 102 MP, procesor nou, autofocus cu recunoașterea persoanelor cu AI și posibilitatea de a trage până la 8 cadre/secundă, precum și cu capabilități video îmbunătățite (până la clipuri 8K/30p). În plus, camera e ceva mai mică decât predecesoarea sa. Prețul e însă unul pe măsură: 8.000 de euro.

Recomandările Mindcraft Stories

  1. Discuția despre utilizarea AI-ului în literatură continuă, iar Wired explorează acest lucru într-un articol scris de jurnalista și scriitoarea Vauhini Vara.„Confessions of a Viral AI Writer”, wired.com Aceasta a publicat în 2021 un text„Ghosts”, thebeliever.net despre moartea surorii ei, scris cu GPT-3, într-o vreme când nu toată lumea avea acces la modele de limbaj. Textul a devenit viral. Autoarea revine asupra poveștii pentru a explora dilemele etice și creative ale utilizării AI-ului în literatură, dar și pentru a vedea care este părerea, pro sau contra, altor creatori;
  2.  New York Magazine s-a apucat să scrie despre personaje importante din lumea tech, cum ar fi Elon Musk,„What Does Walter Isaacson Know About Elon Musk?”, nymag.com de la Tesla, SpaceX și X, sau Sam Altman,„Who Is OpenAI’s Sam Altman? Meet the Oppenheimer of Our Age”, nymag.com de la OpenAI. Primul text se concentrează pe biografia scrisă de Walter Isaacson, o carte care a produs deja controverse, cum ar fi dezvăluirea faptului că Musk a blocat accesul ucrainean la Starlink pentru a salva flota rusă de un atac. Profilul lui Altman e un text mai clasic, care trece prin întreaga viață a șefului OpenAI, pentru a ajunge la întrebări despre puterea pe care a căpătat-o acesta după succesul ChatGPT;
  3. 404 scrie„The End of Privacy is a Taylor Swift Fan TikTok Account Armed with Facial Recognition Tech”, 404media.co despre un cont de TikTok al cărui creator folosește tehnologie de recunoaștere facială pentru a dezvălui detalii personale despre oameni care apar în diverse clipuri virale, fără acordul acestora (așa numitul doxing). Faptul că acest lucru e posibil cu tehnologie la care are acces oricine este îngrijorător, la fel și faptul că TikTok nu a șters contul cu 90.000 de urmăritori (pe care 404 nu-l numește).


Text de

Mihai Ghiduc

Redactor-șef. A oscilat între print (Opinia studențească, Men's Health, Maxim, Marie Claire) și online (Vice, Glamour, Slow Forward) până l-a prins din urmă revoluția tehnologică.

SOCIETATE|FYI

Accesul la arhivele publice rămâne limitat în România

De
Deși legislația majorității țărilor UE s-a aliniat cu recomandările Consiliului Europei, accesul efectiv la arhive rămâne problematic, inclusiv în România, arată un studiu recent. 
AI&ROBOȚI|FYI

AI-urile ușoare și fără abonament se înmulțesc

De
În timp ce „Big AI” îți cere 20 de dolari pe lună, apar modele alternative pe care le-ai putea folosi gratuit. Dacă știi programare. Sau dacă-ți cumperi ochelari.
MEDIU|FYI

5 firme produc 24% dintre deșeurile de plastic a căror sursă poate fi identificată

De
Un nou studiu arată că 56 de companii, în frunte cu Coca-Cola, sunt responsabile pentru mai mult de jumătate din poluarea cu plastic produs de branduri. Fiecare creștere de 1% în producția de plastic corespunde unei creșteri de 1% în nivelul poluării cu plastic din mediul înconjurător.
SPAȚIU|FYI

NASA a reușit să restabilească comunicațiile cu Voyager 1, după cinci luni de încercări

De
Cel mai îndepărtat obiect creat de om a trecut printr-o ședință de troubleshooting efectuată de la 24 de miliarde de kilometri distanță.