TurboQuant sperie piața memoriilor, dar nu schimbă cererea structurală de HBM

Algoritmul TurboQuant prezentat de Google promite să reducă de aproximativ șase ori memoria KV cache necesară pentru modele mari de limbaj în faza de inferență, ceea ce înseamnă nevoi mai mici de DRAM standard pentru anumite sarcini AI. Bursa a reacționat brutal: Samsung, SK Hynix și Micron au fost vândute agresiv pe scenariul unui viitor cu mai puține comenzi de memorii convenționale pentru servere AI.

Dacă însă scoatem emoția din ecuație, concluzia este mai nuanțată. TurboQuant este deocamdată un rezultat de laborator orientat spre optimizarea rulării, în timp ce povestea cu adevărat critică pentru investițiile în infrastructură AI rămâne high bandwidth memory, DRAM stivuită lipită de GPU pentru antrenarea modelelor, unde oferta este limitată, contractele sunt pe termen lung, iar cererea continuă să crească. Din perspectiva producătorilor de HBM, fundamentalele superciclului de memorie nu arată semne că s ar fi schimbat peste noapte.

Tehnologia revoluționară stârnește panică pe piață

Google Research $GOOG a prezentat un nou algoritm de compresie a memoriei numit TurboQuant , despre care cercetătorii spun că poate comprima memoria cache cheie utilizată în modelele mari de limbaj de cel puțin șase ori mai rapid cu o inferență de până la opt ori mai rapidă, fără a sacrifica precizia .

Reacția pieței a fost imediată și dramatică. Joi, acțiunile celor mai mari doi producători de cipuri de memorie din lume, SK Hynix și Samsung $SSNLF, au scăzut cu 6% și, respectiv, aproape 5% în tranzacțiile din Coreea de Sud. Samsung Electronics a închis în scădere cu 4,71%, în timp ce SK Hynix a scăzut cu 6,23%, determinând scăderea indicelui de referință sud-coreean KOSPI cu 3,22% .

O tendință similară a continuat pe piețele din SUA, unde acțiunile unor companii precum Micron Technology $MU, care a scăzut cu 7% , și SanDisk $SNDK, care a scăzut cu 6,8% . Aceste mișcări au urmat scăderilor acțiunilor SanDisk și Micron în SUA miercuri .

Cum funcționează TurboQuant și de ce îi sperie pe investitori

TurboQuant reprezintă o abordare revoluționară pentru rezolvarea unuia dintre cele mai mari blocaje ale inteligenței artificiale - cerințele enorme de memorie în timpul operațiunilor de inferență. TurboQuant este o metodă de compresie care realizează o reducere ridicată a dimensiunii modelului cu zero pierderi de precizie, ceea ce o face ideală pentru a sprijini atât compresia cache-ului cheie (KC), cât și căutarea vectorială.

Tehnologia funcționează în două faze. Prima fază utilizează PolarQuant, care gândește diferit cartografierea spațiului înalt-dimensional. În loc să utilizeze coordonatele carteziene standard (X, Y, Z), PolarQuant convertește vectorii în coordonate polare constând dintr-o rază și un set de unghiuri. Descoperirea constă în geometrie: după o rotație aleatorie, distribuția acestor unghiuri devine foarte previzibilă și concentrată.

A doua fază acționează ca un corector de erori matematice. Chiar și cu eficiența PolarQuant, rămâne o cantitate reziduală de eroare. TurboQuant aplică o transformare Johnson-Lindenstrauss (QJL) cuantificată pe 1 bit la aceste date reziduale.

Impactul real asupra pieței rămâne o întrebare

În ciuda reacției imediate a pieței, analiștii avertizează împotriva îngrijorărilor exagerate. Ray Wang, analist de memorii la SemiAnalysis, a declarat că cercetarea Google nu va duce neapărat la necesitatea de a avea mai puține cipuri. Valorile cache sunt "un blocaj cheie care trebuie abordat pentru modele și performanțe hardware mai bune", a spus el. Wang a spus că va fi "greu de evitat un consum mai mare de memorie" ca urmare a îmbunătățirii performanței modelelor .

De asemenea, este important să se facă distincția între diferitele tipuri de memorie. Trebuie remarcat faptul că, în comparație cu cipurile DRAM standard, această tehnologie va avea un impact mai mic asupra HBM (High Bandwidth Memory). TurboQuant este utilizat în principal pentru a optimiza inferența modelelor AI, o fază care necesită în principal numai cipuri DRAM obișnuite. Cu toate acestea, HBM rămâne o necesitate în faza de formare a IA.

Potrivit unui raport CNBC, în ciuda scăderii acțiunilor de joi, o furtună perfectă de factori continuă să sprijine piața memoriilor pe termen lung. Cererea semnificativă, cuplată cu deficitul de aprovizionare, a împins prețurile memoriilor la niveluri fără precedent și a susținut creșterile pentru Samsung, SK Hynix și Micron .

Fundamentele structurale rămân solide

De asemenea, este esențial să ne amintim că TurboQuant este încă doar un proiect de cercetare. Este demn de remarcat faptul că TurboQuant nu a fost încă implementat pe o scară mai largă; este încă o descoperire de laborator în acest moment. Acest lucru face mai dificile comparațiile cu ceva precum DeepSeek sau chiar cu compania fictivă Pied Piper.

Datele arată că dimensiunea pieței HBM va crește cu 58% până la 54,6 miliarde de dolari în 2026, reprezentând aproape 40% din piața DRAM. Creșterea bruscă a cererii a dus la un dezechilibru între cerere și ofertă. În ciuda faptului că Samsung, SK Hynix și Micron au alocat 70% din capacitatea lor nouă/additională pentru HBM, există în continuare un deficit de capacitate de 50-60% pentru HBM.

Potrivit analiștilor de la Wells Fargo, actualizarea Google TurboQuant ar putea fi, de fapt, un aspect pozitiv pentru companiile de memorii. Deși acest tip de descoperire ar putea părea negativ pentru companiile de memorii, ideea paradoxului Jevons sugerează că se poate întâmpla contrariul - eficientizarea inteligenței artificiale reduce costurile, ceea ce poate încuraja utilizarea și cererea pe scară mult mai largă.

Factorii structurali legați de infrastructura IA, constrângerile de aprovizionare și piețele HBM restrânse susțin o perspectivă pe termen lung solidă. Investitorii ar trebui să facă distincția între zgomotul pe termen scurt și tendințele fundamentale ancorate în penuria persistentă de memorie și creșterea volumului de lucru al IA .


Niciun comentariu încă
Informațiile din acest articol au doar caracter educațional și nu servesc ca sfaturi de investiții. Autorii prezintă doar faptele cunoscute de ei și nu extrag nicio concluzie sau recomandare pentru cititori. Citiți Termenii și condițiile noastre
Menu StockBot
Tracker
Upgrade