NVIDIA nám v rámci veľtrhu CES 2024 oficiálne predstavila svoje najnovšie grafické karty z radu RTX 40 SUPER. Odhalené boli celkovo tri modely, pričom všetky z nich ponúkajú viac ako slušné kapacity. To však nie sú jediné novinky, ktoré spoločnosť prináša. Oznámených bolo niekoľko nových notebookov od rôznych popredných výrobcov. Tie umožňujú ešte lepšie využitie AI, a to aj vďaka NVIDIA RTX.
Kapitoly článku:
NVIDIA má na trhu s čipmi pre AI dlhú históriu. A po novom si túto pozíciu ešte väčšmi upevňuje. Aktuálne prináša viacero šikovných AI nástrojov, ako napríklad model pre generovanie obrazu z textových príkazov Stable Diffusion X pomocou NVIDIA TensorRT. NVIDIA RTX Remix zase umožňuje využitie AI pre generovanie textúr. Ďalšími príkladmi môžu byť mikroslužby NVIDIA ACE a hry využívajúce DLSS 3.
NVIDIA TensorRT-LLM je open-source knižnica urýchľujúca a optimalizujúca výkon inferencie v najnovších veľkých jazykových modeloch (LLM). Po novom podporuje ešte viac vopred optimalizovaných modelov pre PC. Tento mesiac sa objavuje aj funkcia Chat with RTX, technologická ukážka spoločnosti NVIDIA, ktorá je posilnená vďaka TensorRT-LLM a nadšencom umožňuje AI integrovať so svojimi poznámkami, dokumentami a ďalším obsahom.
„Generatívna umelá inteligencia je najvýznamnejšou platformou zmenou v histórii výpočtovej techniky a zmení každé odvetvie, vrátane herného,“ hovorí Jensen Huang, zakladateľ a generálny riaditeľ NVIDIA. „S viac ako 100 miliónmi počítačov a pracovných staníc využívajúcich RTX AI predstavuje NVIDIA masívnu inštalovanú základňu pre vývojárov a hráčov, ktorí si môžu naplno dopriať kúzlo generatívnej AI.“
NVIDIA berie možnosť lokálneho prevádzkovania (na vlastnom PC) generatívnej AI ako kritickú pre aplikácie, pri ktorých je treba dbať na ochranu súkromia, odozvu či prevádzkové náklady. Vyžaduje však aj veľkú inštalovanú základňu systémov pripravených na takúto práci a taktiež správne vývojárske nástroje pre ladenie a optimalizáciu modelov AI pre PC.
Aby NVIDIA dokázala splniť tieto potreby, prináša inovácie naprieč celým technologickým portfóliom. Vďaka tomu môže priniesť nové zážitky, pričom stavia na viac ako 500 aplikáciách a hrách pre PC s podporou AI akcelerovanej pomocou NVIDIA RTX.
RTX AI pre počítače a pracovné stanice
Nové grafické karty NVIDIA RTX umožňujú prevádzkovať širokú škálu aplikácií s maximálnym výkonom. Taktiež odomykajú plný potenciál využitia generatívnej AJ na PC. Jadrá Tensor obsiahnuté v týchto kartách taktiež výrazne akcelerujú výkon AI v najnáročnejších aplikáciách, a to pre zábavu i na prácu.
Podrobnejšie sme sa čerstvo predstaveným kartám RTX 40 SUPER venovali v samostatnom článku, preto nižšie uvádzame len stručný prehľad.
Nová séria obsahuje tri grafické karty, a to GeFroce RTX 4080 SUPER, RTX 4070 Ti SUPER a RTX 4070 SUPER. Všetky ponúkajú v oblasti AI priam vynikajúci výkon. RTX 4080 SUPER dokáže s využitím AI generovať video 1,5-násobne a obrázky 1,7-násobne rýchlejšie v porovnaní s GeForce RTX 3080 Ti. Jadrá Tensor v GPU SUPER zvládnu spracovať až 836 biliónov operácií za sekundu, čo prináša inovatívne možnosti využitia AI v hrách, tvorbe a každodennej produktivite.
V cieli kariet RTX 40 SUPER napomáhajú viacerí poprední výrobcovia, vrátane Acer, ASUS, Dell, HP, Lenovo, MSI, Razer a Samsung, ktorí aktuálne uvádzajú na trhu novú vlnu notebookov využívajúcich RTX AI, takže mnoho používateľov má k dispozícii kompletnú sadu funkcií pre generatívnu AI hneď po prvom spustení. Nové systémy, ktoré prinášajú 20 až 60-násobne vyšší výkon v porovnaní s použitím neurónových výpočtových jednotiek, sa začnú predávať tento mesiac.
Pokiaľ ide o mobilné pracovné stanice, tie s GPU z rodiny RTX dokážu prevádzkovať softvér NVIDIA AI Enterprise, vrátane TensorRT a NVIDIA RAPIDS pre zjednodušený a bezpečný vývoj generatívnej AI a dátovú vedu. Až 3-ročná licencia pre NVIDIA AI Enterprise je k dispozícii ku každej GPU NVIDIA A800 40 GB Active, čo z nej robí ideálnu platformu pre vývoj AI a dátovú vedu.
Nová paleta nástrojov pre tvorbu AI modelov
NVIDIA nedávno predstavila NVIDIA AI Workbench, čo je jednotná, jednoducho použiteľná sada nástrojov, ktoré vývojárom pomáhajú rýchlo tvoriť, testovať a prispôsobovať predtrénované generatívne modely AI a LLM pri nárokoch na výkon a operačnú pamäť na úrovni osobných počítačov.
Táto sada nástrojov bude vydaná v beta verzii ešte tento mesiac a ponúkne zjednodušený prístup k populárnym repozitárom, ako sú Hugging Face, GitHub či NVIDIA NGC. Zjednodušené bude aj používateľské rozhranie, ktoré vývojárom umožní pohodlnejšiu reprodukciu a migráciu projektov aj spoluprácu na nich.
Projekty je pritom možné škálovať prakticky kamkoľvek, či už ide o dátové centrum, verejný cloud alebo NVIDIA DGX Cloud. Potom je možné ich preniesť späť do lokálnych RTX systémov na osobnom počítači alebo pracovnej stanici, kde možno vykonávať inferencie a menej náročné úpravy.
Okrem toho NVIDIA vďaka spolupráci s HP zjednodušuje vývoj AI modelov. HP AI Studio, centralizovaná platforma pre dátovú vedu, bude po novom obsahovať modely a koncové body z NVIDIA AI Foundation. Tie zahŕňajú modely akcelerované pomocou RTX a sady pre vývoj softvéru. Používatelia tak budú môcť jednoduchšie vyhľadávať, importovať a nasadzovať optimalizované modely na PC aj v cloude.
NVIDIA taktiež nedávno rozšírila TensorRT o textové aplikácie pomocou TensorRT-LLM pre Windows. Najnovšia aktualizácia knižnice, ktorá je k dispozícii už teraz, pridáva do rozrastajúceho sa zoznamu vopred optimalizovaných modelov pre PC Phi-2, ktoré beží až 5-násobne rýchlejšie v porovnaní s inými inferenčnými backendmi.
Akcelerácia AI prináša na PC nové zážitky
Spoločnosť NVIDIA spoločne so svojimi partnermi z vývojárskej komunity v rámci CES 2024 uvádza nové aplikácie a služby pre PC poháňané generatívnou AI. Medzi ne patria:
- NVIDIA RTX Remix – platforma pre tvorbu RTX remasterov klasických hier. V beta verzii, ktorá vyjde koncom tohto mesiaca, ponúkne nástroje využívajúce generatívnu AI, ktoré dokážu transformovať základné textúry z klasických hier do 4K materiálov pre rendering.
- NVIDIA ACE – balíček mikroslužieb, vrátane generatívnych modelov AI, ktoré umožňujú vývojárom obohacovať hry o inteligentných, dynamických digitálnych avatarov.
- TensorRT pre Stable Diffusion XL (SDXL Turbo) a modely latentnej konzistencie – dve najobľúbenejšie metódy akcelerácie Stable Diffusion. V oboch prípadoch zvyšuje TensorRT výkon až o 60 % v porovnaní s predchádzajúcou najrýchlejšou implementáciou. K dispozícii je aj aktualizovaná verzia rozšírení TensorRT pre webové rozhranie Stable Diffusion WebUI, vrátane akcelerácie pre SDXL, SDXL Turbo, LCM-Low-Rank Adaptation (LoRA) a vylepšenej podpory LoRA.
- NVIDIA DLSS 3 s funkciou Frame Generation – technológia využívajúca AI k až 4-násobnému zvýšeniu snímkovacej frekvencie v porovnaní s natívnym vykresľovaním, ktorá sa objaví v 12 zo 14 novo oznámených RTX Hier, vrátane Horizon Forbidden West, Pax Dei a Dragon’s Dogma 2.
Čo sa týka funkcie Chat s RTX, tá bude k dispozícii ešte tento mesiac, pričom nadšencom AI umožní jednoduché prepojenie PC LLM s vlastnými dátami pomocou obľúbenej techniky známej ako Retrieval-augmented generation (RAG). Demo, akcelerované technológiou TensorRT-LLM, umožňuje rýchlu interakciu s poznámkami, dokumentami a ďalším obsahom. Okrem toho bude k dispozícii ako referenčný projekt s otvoreným zdrojovým kódom, takže vývojári budú môcť jednoducho implementovať rovnaké funkcie do vlastných aplikácií.
NVIDIA ACE
V tejto sekcii článku sa viac povenujeme novo predstavených produkčných mikroslužieb pre NVIDIA Avatar Cloud Engine (ACE), ktoré sme vyššie spomenuli viac-menej len letmo.
Ako už bolo spomenuté, tieto služby umožňujú vývojárom hier, nástrojov a middlevéru integrovať najmodernejšie generatívne modely AI do digitálnych avatarov v hrách a aplikáciách. K tomuto účeli poslúži napr. technológia NVIDIA Audio2FAce (A2F) pre tvorbu expresívnych animácií tváre zo zvukových zdrojov, či NVIDIA Riva Automatic Speech Recognition (ASR) na vytváranie prispôsobiteľných viacjazyčných aplikácií rozpoznávajúcich reč a umožňujúcich preklad pomocou generatívnej AI.
Medzi vývojárov používajúcich NVIDIA ACE patrí Charisma.AI, Convai, Inworld, miHoYo, NetEase Games, Ourpalm, Tencent, Ubisoft a UneeQ.
„Technológie generatívnej umelej inteligencie mení prakticky všetko, čo poznáme, a to sa týka aj tvorby hier a ich hrania,“ hovorí Keita lida, viceprezident pre vzťahy s vývojármi v NVIDIA. „NVIDIA ACE otvára vývojárom hier nové možnosti tým, že ich svety oživý realistickými digitálnymi postavami a zároveň odstraňuje potrebu vopred napísaných dialógov, čo prináša pohlcujúcejší zážitok.“
Využívané špičkami priemyslu
Špičkoví vývojári hier a interaktívnych avatarov sú priekopníkmi v spôsoboch, akými možno technológiu ACE a generatívnu AI využiť k premene interakcií medzi hráčmi a nehrateľnými postavami (NPC) v hrách a aplikáciách. „Ide o významný okamžik pre umelú inteligenciu v hrách,“ uviedla spoločnosť Tencent Games. „NVIDIA ACE a Tencent Games pomôžu položiť základy, ktoré do videohier prinesú digitálnych avatarov s individuálnymi osobnosťami a interakciami.“
Život herným postavám
NPC boli v minulosti navrhované s vopred určenými reakciami a animáciami tváre. To obmedzovalo interakcie s hráčmi, ktoré boli štandardne transakčné, krátkodobé a v dôsledku toho ich väčšina hráčov preskakovala.
„Generatívne postavy poháňané umelou inteligenciou vo virtuálnych svetov otvárajú rôzne prípady použitia a zážitky, ktoré skôr neboli možné,“ hovorí Purnendu Mikhersjee, zakladateľ a generálny riaditeľ spoločnosti Convai. „Convai využíva technológiu Riva ASR a A2F k tomu, aby umožnila realistické NPC s nízkou dobou odozvy a prirodzenými animáciami.“
Pre adekvátnu demonštráciu schopností ACE spoločnosť NVIDIA v rámci spolupráce s Convai rozšírila demoverziu NVIDIA Kairos, ktorá mala premiéru minulý rok na veľtrhu Computex, o zástup nových funkcií a začlenení mikroslužieb ACE.
V najnovšej verzii dema Kairos sa vo veľkej miere používajú technológie Riva ASR a A2F, ktoré zlepšujú interaktivitu NPC. Nový framework Convai teraz umožňuje NPC konverzovať medzi sebou a dáva im povedomie o objektoch, čo im umožňuje zdvíhať a doručovať predmety do požadovaných oblastí. NPC tak získavajú aj schopnosť sprevádzať hráča k cieľu a putovať hernými svetmi.