GPT-4 možno už v dohľadnej budúcnosti nebude špičkou na trhu s modelmi generatívnej umelej inteligencie (AI). Spoločnosť Tachyum totiž oznámila, že prijala prvú významnú objednávku od americkej firmy na vybudovanie rozsiahleho systému postaveného na jej 5 nm univerzálnych procesoroch Prodigy. Tento systém má poskytnúť počítačový výkon vyše 50 exaflopov, čo exponenciálne prevýši výpočtovú kapacitu dnešných superpočítačov pre inferenciu alebo generatívnu, AI.
Prejsť na:
Prvý univerzálny procesor Prodigy je navrhnutý tak, aby vďaka svojmu špičkovému výkonu pre hyperškálovovanie, vysokovýkonné výpočty a pracovné záťaže umelej inteligencie transformoval kapacitu, efektivitu a ekonomiku dátových centier.
Nepredstaviteľný výkon
Po dokončení má systém postavený na čipoch Prodigy poskytovať až 25 000-násobný multiplikátor v porovnaní so svetovo najrýchlejším konvenčným superpočítačom, ktorý bol postavený iba tento rok. Okrem toho má dosahovať 25 000-krát väčšiu kapacitu pre AI ako súčasné modely pre ChatGPT4.
Superpočítače v kategórii „exascale“ dokážu rýchlo analyzovať a spracovať obrovské objemy dát na riešenie komplexných problémov, ktoré boli predtým neriešiteľné. Čip Prodigy prekonáva tradičné „exascale“ schopnosti tým, že poskytuje špičkový výkon, výrazne znižuje spotrebu energie, zlepšuje využiteľnosť serverov a priestorovú efektivitu.
Exponenciálny nárast pamäte, úložného priestoru a výpočtovej kapacity čipu Prodigy umožňuje prelomové riešenia v oblasti dátových centier, pracovných záťaží AI a HPC pre vládne projekty, výskum a akademickú sféru, podnikanie, výrobu a ďalšie odvetvia.
Viac pamäte, než koľko je treba
Ľudský mozog pozostáva z približne 100 miliárd neurónov a okolo 200 biliónov synaptických spojení. Za predpokladu alokácie niekoľkých bajtov na jedno synaptické pripojenie by to vyžadovalo 100 TB pamäte. Preto bude mať systém postavený na čipoch Prodigy so stovkami petabajtov DRAM až 100-krát viac pamäte, ako je potrebné.
Inštalácia tohto riešenia s podporou Prodigy má začať v roku 2024 a plnú kapacitu dosiahne v roku 2025. Toto sú parametre systému, ktorý bude dodaný:
- 8 zettaflopov výpočtového výkonu na učenie AI pre veľké jazykové modely.
- 16 zettaflopov pre spracovanie obrazu a videa.
- Možnosť napasovať viac ako 100 000 modelov parametrov PALM2 530B ALEBO 25 000 modelov parametrov ChatGPT4 1.7T so základnou pamäťou a 100 000 modelov parametrov ChatGPT4 1.7T so štvornásobnou základnou DRAM.
- Rozšíriteľná pamäť základného modelu systému.
- Stovky petabajtov pamäte DRAM a exabajtov primárneho flash úložiska.
- 4-soketové, kvapalinou chladené uzly pripojené k 400G RoCE (RDMA – Remote Direct Memory Access over Converged Ethernet) ethernetu so schopnosťou zdvojnásobiť na 800G neblokujúcu a nezabezpečenú prepínaciu štruktúru.
Proprietárna inferenčná IP (duševné vlastníctvo) TPU od spoločnosti Tachyum podporuje dátový typ Tachyum AI (TAI) a poskytuje ešte viac prelomovú efektivitu pre video formáty a veľké dátové formáty jazykových modelov, ktoré by inak vyžadovali nadmerne veľa energie a drahé multiplikátory pre maticové násobenie.
Slováci urobia dieru do sveta
„Bezprecedentný rozsah a výpočtový výkon, ktorý je vyžadovaný ako súčasť tejto inštalácie, by jednoducho nemohol poskytnúť žiadny výrobca čipov na súčasnom trhu,“ hovorí Dr. Radoslav Danilák, zakladateľ a generálny riaditeľ spoločnosti Tachyum. „Hoci niektoré startupy dodávajú miliardy dolárov na základe prísľubu, že niekedy v budúcnosti dosiahnu podobnú kapacitu, iba Tachyum je v pozícii, ktorá umožňuje ekonomicky vybudovať rádovo väčšie stroje, ktoré potenciálne umožnia prechod na kognitívnu AI, so začiatkom projektu neskôr v tomto roku. Táto objednávka je dôkazom našej pozície first-to-market (prvého na trhu) a našej schopnosti dosiahnuť pozitívny vplyv na celosvetové trhy s umelou inteligenciou.“
Ako univerzálny procesor ponúkajúci špičkový výkon pre všetky pracovné zaťaženia, môžu servery dátových centier plynule a dynamicky prepínať medzi výpočtovými doménami, ako sú AI/ML, HPC a cloud, len s jednou architektúrou. Odstránením potreby drahého špecializovaného hardvéru pre AI a výrazným zvýšením využitia serverov,
Prodigy výrazne znižuje CAPEX a OPEX a zároveň poskytuje bezprecedentný výkon, spotrebu a ekonomiku dátového centra. Prodigy integruje až 192 vysokovýkonných na mieru navrhnutých 64-bitových výpočtových jadier, čo mu umožňuje dosahovať až 4,5-násobne vyšší výkon v porovnaní s najvýkonnejšími x86 procesormi pre cloudové záťaže. V porovnaní s najvýkonnejším súčasným GPU má technológia ponúknuť až 3-násobný výkon pre HPC. V prípade AI aplikácií má byť rast výkonu 6-násobný.