Jaap Arriens/NurPhoto via Getty Images
DeepSeek vs OpenAI. Chiar s-a spart bula?16 min read
Aproape imediat după ce Trump anunța o investiție de 500 de miliarde de dolari în AI, DeepSeek, un model chinezesc, șoca lumea cu rezultate similare lui ChatGPT, obținute cu mai puțină procesare și consum de energie. Și nu e singura veste care vine din China.
La câteva zile de la învestire, Donald Trump stătea alături de Sam Altman, Larry Ellison și Masayoshi Son pentru a anunțat // „President Trump highlights investing $500 billion in ‘Stargate’ AI project”, apnews.com // o investiție de 500 de miliarde de dolari în centre de date texane pentru dezvoltarea inteligenței artificiale, un parteneriat între OpenAI, Oracle și SoftBank.
În scurt timp, tot entuziasmul ăsta se evapora, odată cu lansarea modelului chinezesc DeepSeek-R1.
Americanii vor să domine viitorul AI
Anunțul suna grozav. OpenAI, compania care a pornit trendul AI, alături de unul dintre cei mai mari jucători de pe piața centrelor de date, cu sprijin direct de la Casa Albă, ar fi putut duce SUA și mai în fața celorlalte națiuni în acest domeniu, cu consecințe cât se poate de benefice pentru dominația tehnologică a ultimelor decenii.
E un prim pas în direcția tratamentului pentru cancer, aproape că a spus // „Trump’s AI deal fueling early cancer detection: Oracle’s Larry Ellison”, foxbusiness.com // – oarecum ironic, Trump tocmai bloca fondurile pentru cercetări concrete în domeniul cancerului finanțate de // „‘Never seen anything like this’: Trump’s team halts NIH meetings and travel”, nature.com //
N-au lipsit nici criticile. Unele au fost mai degrabă politice, de la cea privind repoziționarea lui Altman de partea lui Trump la intervenția, mai mult sau mai puțin așteptată, a lui Musk, împotriva proiectului. Însă altele atenționau că OpenAI n-a livrat pe măsura promisiunilor, pentru că se cam termină datele pe care modelele pot fi antrenate – mai ales că 25% din bazele de date importante au blocat // „A.I. Companies Are Running Out of Training Data: Study”, observer.com // –, motiv pentru care se folosesc tot mai des // „In machine learning, synthetic data can offer real performance improvements”, news.mit.edu // adică unele generate de alte AI-uri. Iar banii de la Trump sunt o subvenție mascată.
Chiar și așa, tendința era clară. SUA – mai ales în condițiile în care deja Biden a blocat accesul altor țări, în special China, la cipuri performante – urma să domine lumea inteligenței artificiale măcar în următorul deceniu. Iar atât de vânata inteligență artificială generală urma să vină din America.
CITEȘTE ȘI: Restricțiile americane privind exportul de plăci video vor afecta și gamerii din România
La fel ca o1, cu doar 6 milioane de dolari?
// Detalii pe deepseek.com // a schimbat toată această paradigmă. Finanțat de compania chineză Fire Flyer din Hangzhou, laboratorul fondat de // Detalii pe wikipedia.org // se laudă că a produs modelul R1 cu o zecime din costurile folosite de Meta pentru Llama3, dar și că obține rezultate similare sau mai bune ca ChatGPT o1 cu costuri între de 30 și 50 de ori mai reduse.
Firma spune, într-un // „DeepSeek-V3 Technical Report arxiv.org // că a folosit un cluster de 2.048 de plăci grafice NVidia H800 (nu cele mai performante) pentru a antrena un model DeepSeek-V3, pe care se bazează // O comparație a celor două modele chinezești, aici: docsbot.ai // Întreg procesul de antrenare a durat // Unitate de măsură a calculelor făcute cu plăci grafice. // adică costul total a fost de 5,532 milioane de dolari, semnificativ sub cel al modelelor occidentale.
Pentru a face față limitărilor, cercetătorii chinezi au apelat la tot felul de trucuri, pe care de altfel le detaliază în lucrarea făcută publică la // O privire mai atentă asupra acesora găsești aici: nextplatform.com //
// „How does DeepSeek R1 really fare against OpenAI’s best reasoning models?”, arstechnica.com // confirmă afirmațiile legate de rezultat. Modelul chinezesc chiar poate concura cu cele de top de la OpenAI, asta dacă nu-l întrebi de chestii politice sensibile pentru chinezi, ca // „We tried out DeepSeek. It worked well, until we asked it about Tiananmen Square and Taiwan”, theguardian.com //
Iar ăsta e chiar un avantaj, pentru că accesul la DeepSeek e gratuit și are o licență deschisă MIT, adică poți și // De pe ollama.com // și să-l rulezi local, pe un computer (relativ) accesibil ca preț, cu placă grafică dedicată. Pe X, cineva a calculat la // Detalii pe x.com // costurile unui computer care poate genera șase-opt tokenuri pe secundă (adică cuvinte sau semne de punctuație). Nu chiar cel mai rapid partener de dialog din lume.
Între panică și neîncredere
Apariția DeepSeek a fost primită cu reacții mixte. Piața s-a panicat, iar acțiunile Nvidia au scăzut semnificativ. Pierderile au fost de 600 de miliarde de dolari într-o singură zi, un // „Nvidia sheds almost $600 billion in market cap, biggest one-day loss in U.S. history”, cnbc.com // Nu e însă cazul să fie plâns nimeni, prețul unei acțiuni a rămas mai mare decât era anul trecut în primăvară și deja crește din nou.
Cealaltă reacție a fost de neîncredere. Au apărut tot felul de opinii care spun că nu este OK ca un model atât de performant să fie antrenat atât de ieftin și pe atât de puține cipuri. Alexander Wang, de la Scale AI, // „Is DeepSeek lying? CEO of Scale AI Alexandr Wang says the Chinese startup is using 50,000 Nvidia H100 chips but workers can’t talk about it”, indiatimes.com // chiar cifra de 50.00 de chipuri Nvidia H100, despre care chinezii nu vorbesc pentru că, în teorie, n-ar fi trebuit să le poată avea, din cauza restricțiilor impuse de SUA.
Hugging Face, o comunitate de specialiști AI, a lansat chiar o inițiativă, numită // „Open-R1: a fully open reproduction of DeepSeek-R1”, huggingface.co // de a replica modelul chinezesc, cu aceleași metode descrise în lucrare, atât pentru a demonstra dacă afirmațiile se susțin, cât și pentru învăța și eventual dezvolta noile tehnici folosite.
Apoi, DeepSeek e acuzată că // „DeepSeek’s Popular AI App Is Explicitly Sending US Data to China”, wired.com // ceea ce ar încălca tot felul de legi referitoare la viață privată. Iar cea mai nouă acuzație vine chiar de la // „OpenAI has evidence that its models helped train China’s DeepSeek”, theverge.com // firma chineză ar fi folosit chiar ChatGPT o1 pentru a antrena modelul, printr-un proces numit distilare.
Ironia că OpenAI acuză o firmă de încălcarea proprietății intelectuale, după ce și-au bazat toată afacerea pe această tehnică n-a scăpat nimănui.
A existat chiar și // „DeepSeek hit by cyberattack as users flock to Chinese AI startup”, reuters.com // asupra DeepSeek, deși e posibil doar să fie o problemă de trafic cauzată de numărul mare de accesări și descărcări ale aplicației.
Viitorul sună bine
Pornind de la presupunerea că nu e doar o farsă elaborată, DeepSeek demonstrează că, atunci când accesul la mai multă putere de procesare nu e posibil, există soluții alternative. Mai multe plăci grafice care să ingurgiteze cantități tot mai mari de date nu înseamnă că modelele AI existente vor deveni mai bune proporțional cu investițiile.
Necesitatea unor abordări alternative a fost exprimată chiar și de // „OpenAI and others seek new path to smarter AI as current methods hit limitations”, reuters.com // 1i destule voci din lumea AI spun că drumul spre AGI necesită descoperiri noi. Din punctul de vedere al cercetătorilor, apariția DeepSeek-R1 e o veste cât se poate de bună.
Politic vorbind, s-ar putea să fie semnul că așteptata dominație americană asupra lumii AI-ul să nu se concretizeze, mai ales dacă metode alternative care folosesc tot mai puțină putere de procesare vor fi dezvoltate în continuare. Dacă nu contează plăcile sau energia consumată, cum vor putea fi opriți alții să creeze AI-uri tot mai performante?
Cât despre bula economică apărută în jurul AI-ului, mă îndoiesc că se va sparge cu adevărat. Ciclul de știri tot mai scurt va arunca în curând în umbră întreaga discuție, investitorii vor începe din nou să creadă în promisiunile diverselor start-up-uri din domeniu, iar fermele de GPU-uri din Texas se vor concretiza oricum, pentru că utilizări i se vor găsi cu siguranță.
S-ar putea însă ca planurile de abonamente de zeci sau sute de dolari pe lună să nu mai fie atât de apetisante pentru utilizatori, dacă vor avea acces la modele decente care costă semnificativ mai puțin sau, dacă sunt rulate local, chiar deloc. Și, brusc, investițiile alea de sute de miliarde nu vor mai fi în viitor, ci se vor transforma în subvenții pentru a susține niște firme în prezent. Unii ar spune că deja sunt.