Nvidia perspėja: DI skaičiavimų paklausa sparčiai auga

Nvidia perspėja: DI skaičiavimų paklausa sparčiai auga

Komentarai

7 Minutės

Nvidia generalinė direktorė perspėja apie augančią DI skaičiavimų paklausą

Las Vegase surengtoje viešoje pristatymo sesijoje Nvidia generalinis direktorius Jensen Huang pažymėjo, kad dirbtinio intelekto (DI) skaičiavimo lenktynės stipriai įsismarkauja: GPU ir DI infrastruktūros paklausa auga itin greitai. Huang apibūdino šią tendenciją kaip intensyvias lenktynes dėl kitos DI kartos ribos, nurodydamas, kad modelių sudėtingumas ir reikalavimai skaičiavimo ištekliams auga eksponentiškai.

Skaičiavimo augimas lenkia pasiūlą

Huang aiškino, kad DI modelių dydžiai ir treniruočių apkrovos kasmet auga maždaug dešimteriopai, kas lemia dramatišką reikiamos skaičiavimo galios padidėjimą. Kaip jis pabrėžė, skaičiavimo apimtys, reikalingos pažengusiems modeliams treniruoti, sparčiai didėja, o kartu kyla ir Nvidia GPU bei kitų aukštos spartos akceleratorių paklausa. Greitas skaičiavimo spartinimas tiesiogiai lemia spartesnius pažangius atradimus ir eksperimentus DI srityje.

Tokios tendencijos turi didelį poveikį pagrindiniams sektoriaus dalyviams: debesų kompiuterijos paslaugų tiekėjams (cloud providers), didelėms įmonėms, DI startuoliams ir puslaidininkių gamintojams, kurie tiekia specializuotus grafikos procesorius (GPU) bei didelio našumo akceleratorius. Auganti paklausa daro įtaką tiek techninei įrangai, tiek duomenų centrų architektūrai, energijos tiekimui ir aušinimo sprendimams.

Skaičiavimo poreikio augimas apima kelis aspektus: treniravimo (training) skaičiavimus, kur reikalingos didelės TFLOP/FP/INT operacijų apimtys, bei inferencijos (pritaikymo) darbą, kuris tampa vis labiau paskirstytas. Didesni modeliai reikalauja daugiau VRAM atminties, didesnės pralaidumo atminties (HBM), greitesnių tinklo sąsajų (NVLink, PCIe Gen) ir specializuotų akceleratorių operacijoms su dideliais matricų daugybos reikalavimais.

Be to, įmonės susiduria su svarbiu sprendimu tarp investicijų į specializuotus ASIC sprendimus ir lanksčios GPU/AĮ akceleratorių talpos. ASIC sprendimai, pavyzdžiui, skirti kriptovaliutų kasimui, paprastai pasižymi aukštu energijos efektyvumu konkrečiuose algoritmuose, tačiau GPU ir bendros paskirties akceleratoriai suteikia daugiau lankstumo DI modelių tyrimams ir skirtingų darbų vykdymui.

Ką tai reiškia kriptovaliutų kasybai ir Bitcoin kalnakasiams

Auganti DI skaičiavimo paklausa jau sutraukia kriptovaliutų sektoriaus dėmesį. Per pastaruosius kelerius metus kelios Bitcoin (BTC) kasybos įmonės dalinai ar visiškai nukreipė dalį pajėgumų į DI darbo krūvius ir GPU pagrindu veikiančias užduotis. Didėjanti Bitcoin kasybos sunkumo kreivė, kartu su galimybe uždirbti didesnes arba stabilesnes pajamas per DI skaičiavimus, skatina tokius perorientavimus, ypač operatoriams, valdančiais didelio masto duomenų centrus.

Didėjant DI skaičiavimo poreikiui, kai kurie Bitcoin kalnakasiai gali išplėsti savo įrangos portfelį ir įtraukti GPU bei specializuotus AI akceleratorius, o kiti nuomos būdu suteiks laisvą pajėgumą debesų ar DI klientams. Tokios permainos gali paveikti GPU prieinamumą tradicinei kriptovaliutų kasybai bei paspartinti konsolidaciją tarp debesų paslaugų, DI tiekėjų ir kripto infrastruktūros operatorių.

Ekonominis motyvas yra akivaizdus: jei GPU naudojimas treniravimui arba inferencijai generuoja geresnį pajamų srautą už kilovatvalandę (kWh) nei klasikinis BTC kasybos pelningumas, operatoriai turi paskatą perskirstyti serverių talpą. Be to, nuomojant skaičiavimo laiką ar siūlant „bare-metal“ GPU nuomos paslaugas, įmonės gali diversifikuoti pajamų srautus ir sumažinti riziką, susijusią su vienos veiklos modelio priklausomybe.

Techninė pusė taip pat svarbi: DI treniravimui būtina aukšta atminties pralaidumo architektūra (HBM3/3e), žemos latencijos ryšiai tarp akceleratorių (NVLink, Infiniband) ir specializuota infrastruktūra energijos tiekimui bei aušinimui. Kasybos fermos, perorientuotos į DI skaičiavimus, dažnai turi investuoti į modifikuotus šasi, efektyvesnes aušinimo sistemas ir elektros paskirstymo sistemas, kad atitiktų DI darbo krūvių reikalavimus. Tai reiškia papildomas kapitalo investicijas, tačiau su potencialiai aukštesne grąža.

Ilgalaikėje perspektyvoje šie pokyčiai gali keisti hosting’o kainodarą, aparatūros prieinamumą ir pajamų modelius kriptovaliutų sektoriuje. Bendrovės, kurios sugebės optimaliai subalansuoti ASIC-Bitcoin ir GPU/akceleratorius DI darbams, gali įgyti konkurencinį pranašumą tiek kiekvienoje srityje, tiek per bendrą infrastruktūros efektyvumą.

Nvidia Rubin ir Vera lustai žada didelius našumo šuolius

Huang taip pat išdėstė Nvidia plėtros planus ir patvirtino, kad kompanijos kitos kartos Rubin ir Vera lustai jau pilnai gaminami ir vykdomas diegimas pagal numatytą grafiką. Rubin ir Vera, suprojektuoti veikti kartu, turėtų suteikti iki penkių kartų didesnį DI skaičiavimo našumą, palyginti su ankstesnėmis kartomis, teigia Nvidia. Tokie našumo šuoliai reikšmingai padidina duomenų centrų galios poreikį, atminties pralaidumą (HBM) ir pažangius aušinimo sprendimus.

Techninis kontekstas yra toks: naujos architektūros dažnai apima geresnę matricos operacijų pagreitintą logiką, padidintą atminties pralaidumą, daugiau papildomų specializuotų vienetų (tensor cores ar jų analogai) bei efektyvesnį energijos valdymą. Rubin ir Vera deriniai gali optimizuoti treniravimo potencialą (higher throughput training) ir inferencijos efektyvumą dideliems modeliams, ypač kalbant apie didelės apimties transformerių ir multimodalius modelius.

Tokie lustai taip pat paskatins paklausą komponentams: didelės spartos atminties (HBM3/3e), maitinimo moduliams (PDUs), pažangiems aušinimo sprendimams (skysčio aušinimas, tiesioginis skystis ant lustų) ir paspartintiems tinklo sprendimams (Ethernet 400G, Infiniband HDR). Duomenų centro operatoriai ir įmonės, planuojančios diegti Rubin/Vera klasės įrangą, turi įvertinti energijos sąnaudas, kaštus, infrastruktūros paruošimo reikalavimus ir ilgalaikį ekonominį modelį.

Šie lustai taip pat gali turėti įtakos tiek aparatūros gamintojams, tiek tiekimo grandinėms. Gaminimo pajėgumai, litografijos pažanga ir komponentų prieinamumas gali tapti ribojančiais veiksniais. Tai reiškia, kad paslaugų tiekėjai, kurie anksti užsitikrins prieigą prie naujos kartos GPU ir akceleratorių, galės pasiūlyti konkurencingas DI paslaugas ir pritraukti klientus reikalaujančius didelio našumo treniravimų.

Žvelgiant į priekį: konkurencija, pajėgumai ir kriptovaliutos

DI skaičiavimo paklausos ir kriptovaliutų kasybos sąveika toliau vystysis. Kalnakasiams strateginis sprendimas tarp investicijų į Bitcoin ASIC įrangą ir lanksčios GPU/akceleratorių talpos DI gali tapti esminiu. Kai kurie operatoriai galės pasinaudoti dvigubu verslo modeliu: kasybai tinkama talpa naktimis arba sezoniniu periodu, o DI treniravimams ir inferencijai – piko metu arba pagal sutartis su debesų/DI klientais.

Platesnei kripto ir blokų grandinės bendruomenei auganti DI infrastruktūros paklausa gali pakeisti hosting'o kainas, įrangos tiekimo grandines ir ilgalaikius pajamų modelius. Auganti GPU paklausa gali didinti jų kainas pardavime ir nuomoje, todėl mažesniems kriptovaliutų kasybos operatoriams gali tekti konkuruoti dėl tiekimo arba rinktis alternatyvas. Vienu metu tai gali paskatinti naujus verslo modelius: specializuotas duomenų centro nuoma DI ir kripto hibridiniams sprendimams, arba partnerystes tarp debesų paslaugų ir kasybos bendrovių.

Be to, konkurencija tarp įmonių, užsitikrinančių efektyviausią aukštos spartos GPU ir DI akceleratorių prieigą, gali lemti greitesnius technologinius proveržius. Įmonės, kurios optimizuoja tiek aparatūros panaudojimą, tiek energijos vartojimo efektyvumą, ir kurios turi prieigą prie modernios atminties bei tinklo architektūros, greičiausiai pasieks reikšmingesnius rezultatus DI modelių kūrime.

Svarbu pabrėžti, kad skaičiavimo pajėgumų paklausa nėra vien tik techninis iššūkis — tai strateginis ekonominis veiksnys. Sprendimai dėl investicijų į aparatūrą, energetiką, aušinimą ir duomenų centro infrastruktūrą turės tiesioginį poveikį tiek DI ekosistemai, tiek kriptovaliutų kasybai. Taigi, kompanijos, kurios laiku adaptuojasi ir diversifikuoja savo pajėgumus, įgaus pranašumą greitai besikeičiančioje rinkoje.

Apibendrinant, Nvidia žinutė buvo aiški: skaičiavimai yra ribojantis veiksnys, o įmonės, kurios užsitikrins efektyviausią ir aukštos spartos GPU bei DI akceleratorių talpą, gali pasiekti kitus proveržius greičiau — tai turės reikšmingų pasekmių DI vystymuisi, Bitcoin kasybai ir plačiajai kripto ekosistemai. Renkantis infrastruktūrą, svarbu atsižvelgti į asociacijas tarp aparatūros našumo, energijos sąnaudų, aušinimo reikalavimų ir potencialių pajamų modelių.

Šaltinis: cointelegraph

Palikite komentarą

Komentarai