Keď sa povie umelá inteligencia, mnohí si predstavia luxusné laboratóriá v Silicon Valley, gigantické investície a špičkové superpočítače. Najnovšie diskusie však poukazujú na zdanlivo nepochopiteľný rozpor: Spojené štáty do AI vkladajú približne 500 miliárd dolárov, kým Čína dokáže konkurovať riešeniami, ktoré si vyžiadali len 5,5 milióna na tréning. Odpoveď pritom tkvie najmä v otvorenosti kódu, nákladovej efektivite a ochote improvizovať pri nedostatku špičkového hardvéru.
Mnoho firiem v Číne stavia na modeli „open source“ – ten im umožňuje rýchlo získavať spätnú väzbu od širokej komunity a zároveň zrýchľovať inovácie. Zatiaľ čo Amerika investuje do luxusných klastrov grafických procesorov, Čína neraz preskočí nákladné fázy a nachádza spôsoby, ako trénovať systémy s minimálnymi zdrojmi. V čom ale spočíva jadro tejto stratégie a aké následky môže priniesť v najbližších piatich rokoch?
Čo je to DeepSeek
DeepSeek je príkladom čínskeho prístupu k open-source umelej inteligencii. Podľa MIT Technology Review využíva minimalizované modely a efektívne algoritmy, vďaka čomu konkuruje americkým lídrom, ktorí míňajú obrovské sumy na infraštruktúru. DeepSeek nezaprie inšpiráciu jazykovými modelmi z dielne západných výskumníkov, no kód sprístupňuje komunite a optimalizuje ho pre nižší výpočtový výkon.
Za kľúčové považuje zníženie počtu parametrov a efektívnu prácu s pamäťou. Čínske obmedzenia pri dovoze špičkových čipov prinútili vývojárov, aby hľadali riešenia, ktoré nevyžadujú tisíce grafických procesorov. Tento prístup sa zdá byť nezlučiteľný s očakávaniami, že na svetovú špičku je nevyhnutný obrovský rozpočet. DeepSeek však dokazuje, že cieľ možno dosiahnuť „ľahšou cestou“.
Je DeepSeek zadarmo?
Licencovanie DeepSeek sa líši podľa konkrétnych verzií, no väčšina z nich sa prezentuje ako otvorené a prístupné. Podľa The Diplomat je základný kód často dostupný na platformách typu GitHub, čo umožňuje vývojárom ho okamžite stiahnuť a testovať. Ide tak o kontrast k veľkým americkým projektom, ktoré ostávajú komerčne uzamknuté alebo sprístupňujú len API.
DeepSeek má však aj rozšírenia určené pre podnikové nasadenie. Za takéto verzie môžu firmy platiť licenciu, ak vyžadujú podporu, cloudové riešenia či školenia. Pre výskumníkov a startupy s menším rozpočtom je však lákavé, že k základnému modelu sa môžu dostať bez vysokých vstupných nákladov.
DeepSeek r1 vs ChatGPT o1
Mnohé porovnania vznikli po tom, ako čínsky model DeepSeek r1 vstúpil na scénu ako priama výzva pre ChatGPT o1 – nástupcu populárnych veľkých jazykových modelov od OpenAI. Hoci ChatGPT o1 operuje s masívnou infraštruktúrou financovanou americkým kapitálom, DeepSeek r1 používa minimalistický prístup k architektúre.
Rozdiely sa prejavujú napríklad pri kreatívnych úlohách, kde ChatGPT (so svojimi obrovskými trénovacími datasetmi) generuje pútavejšie odpovede. DeepSeek r1 je však prekvapivo konkurenčný pri štruktúrovaných zadaniach, kde ide skôr o presnosť než o fantáziu. BBC News zdôrazňuje, že menší čínsky model dokonca drží krok v oblasti logických riešení pre priemyselné aplikácie, hoci v konverzačnom rozhraní stráca na pútavosť odpovedí.
Ako DeepSeek funguje
Vývoj DeepSeek bol podľa LiveScience motivovaný nedostatkom najmodernejších grafických čipov. Čínski inžinieri teda optimalizovali tréning tak, aby sa obišli niektoré fázy tradičného (a nákladného) fine-tuningu. Zamerali sa na zachovanie rozumnej presnosti pomocou menších dátových súborov a opakovane testovaných parametrov. V praxi to prináša model s menšou spotrebou pamäte a energií.
Z komerčného hľadiska to znamená, že menšie firmy nemusia nakupovať extrémne drahý hardvér na tréning a prevádzku, čo prispieva k demokratizácii AI naprieč rôznymi krajinami. Túto stratégiu Čína prezentuje ako výhodu pre krajiny v Afrike či Južnej Amerike, ktoré hľadajú lacnejšie alternatívy k západným veľko-rozpočtovým riešeniam.
Je DeepSeek open source?
Väčšina verzií DeepSeek je prezentovaná ako open source, pričom detailné informácie o licencii a použití zverejňuje China Briefing. Čínske spoločnosti si takto získavajú dôveru komunity, keďže ktokoľvek dokáže do kódu nazrieť, vylepšovať ho a modifikovať. Táto otvorenosť prináša zrýchlenie inovácií, no zároveň vyvoláva obavy ohľadom bezpečnostných rizík.
Ak sa open-source AI ľahko dostane do rúk užívateľov s nekalými úmyslami, môže dôjsť k tvorbe sofistikovaných nástrojov na hackerské či dezinformačné kampane. Vlády preto začínajú uvažovať o nových regulačných rámcoch, aby udržali otvorenosť a kontrolu v rozumnej rovnováhe.
Porovnávacia tabuľka: Amerika vs. Čína v AI
Parameter | USA | Čína |
---|---|---|
Dominantný prístup | Mohutné investície, uzavreté riešenia | Open source, lacné tréningy |
Ročné náklady na AI (odhady) | Až 500 mld. dolárov | ~5,5 mil. dolárov na kľúčové modely |
Kľúčové riziko | Prebytok infraštruktúry, ekonomické fiasko | Sankcie, nedostatok špičkových GPU |
Rozšírenie po svete | Silná pozícia v USA, Európe, Japonsku, Kanade atď. | Partnerstvá s rozvojovými krajinami |
Budúca priorita | Využitie masívnych HPC centier | Efektívne, lacné, otvorené modely |
(Zdroje: SchiffGold, China Briefing, CNBC)
Pozitívne dopady a výzvy
- Pozitívne dopady: Vďaka čínskym open-source modelom môže byť AI dostupnejšia malým firmám a univerzitám po celom svete. Podľa Carnegie Endowment for International Peace sa tak uľahčí prenos nových nápadov a urýchli globálna kolaborácia. Technologické objavy by sa mohli rýchlo šíriť, pretože modely s nízkym hardvérovým dopytom umožnia výskum aj na starších počítačoch
- Výzvy: Otvorenosť kódu zjednodušuje prístup k pokročilým nástrojom, čo môže vyvolať obavy zo zneužitia. Súčasne rastú geopolitické tlaky, keďže USA vnímajú rast čínskej AI ako ohrozenie svojho technologického prvenstva. Wilson Center predpokladá, že ak Čína získa väčší globálny zber dát, využije ho na ďalšie zdokonaľovanie modelov
Dopad na trh so smartfónmi
Keď sa povie pokročilá AI, netreba zabúdať, že jej prejavy sa stále viac integrujú do mobilných zariadení. Samsung Galaxy S, Apple iPhone či Google Pixel už masívne nasadzujú strojové učenie na fotoaparát, prediktívny text či rozpoznávanie hlasu. Galaxy S24 napríklad prišiel s novým AI režimom fotoaparátu, zatiaľ čo iPhone 16 Pro Max vylepšuje strojové učenie v iOS pre vyššiu presnosť rozpoznania tváre.
Ak budú menšie a lacnejšie AI modely ešte výkonnejšie a ľahšie implementovateľné, môže to znamenať, že už pri Galaxy S25 či OnePlus 14 budeme mať lokálne bežiace generatívne nástroje. To by prinieslo novú vlnu aplikácií na úrovni telefónu bez nutnosti pripojenia na centralizované cloudy. Tým sa znížia latencie a zlepší súkromie (keďže dáta ostanú v zariadení), no vývoj bude závisieť od toho, ako úspešné budú open-source projekty typu DeepSeek a ako ich zoberú do úvahy giganti ako Apple či Samsung.
Čo nás čaká v najbližších piatich rokoch
Môžeme sa dočkať:
- Rozmachu lokálnych AI aplikácií, kde malé spoločnosti predbehnú drahé korporátne riešenia
- Geopolitického napätia, keďže USA budú chcieť obmedziť prístup Číny k najnovšiemu hardvéru a Čína zase bude zdokonaľovať svoje low-cost metodiky
…ale aj zintenzívnenia regulačných snáh, lebo otvorená AI prináša riziká spojené s bezpečnosťou, a zároveň šancu na zosilnenie inovácií v rozvojových krajinách. Je dosť možné, že takéto nasadenie umelej inteligencie vyprovokuje vznik nových štandardov pre dohľad, licencovanie alebo etické kódexy.
Prichádza nový AI kapitola?
V priebehu piatich rokov môže kraľovať flexibilita a schopnosť rýchlo sa adaptovať na premenlivé podmienky. Ak USA zaujmú ofenzívny postoj a zdvojnásobia kontrolu nad exportom pokročilých čipov, Čína môže pokračovať v ceste nízkonákladovej, otvorenej umelej inteligencie, čím získa sympatie krajín, ktoré vyhľadávajú cenovo dostupné riešenia. Obe strany pritom riskujú, že v dôsledku geopolitických sporov utrpí globálna spolupráca.
Na druhej strane, ak sa aspoň čiastočne zachovajú mosty medzi americkými a čínskymi výskumníkmi, rozdelenie AI sveta na dve konkurenčné vetvy nemusí byť také hlboké. Ako Time Magazine píše, open-source iniciatívy môžu nakoniec priniesť novú éru produktívneho zdieľania poznatkov, v ktorej sa kladie dôraz na konkrétne technické riešenia viac než na národné hranice či objem kapitálu.