Umelá inteligencia (AI) je azda najväčším trendom modernej doby. Podľa niektorých dát dokonca ide o najrýchlejšie rastúci technologický trend v histórii, nakoľko má prekonávať internet, smartfóny aj sociálne siete. No ako býva zvykom, všetko má svoje „ale“, pričom AI rozhodne nie je výnimkou. Ako informuje portál Medium, postupne sa začali objavovať nečakané obavy z vyčerpania kľúčového zdroja. A nie, nie je ním elektrická energia.
Hoci je pravda, že si AI vyžaduje obrovské množstvo elektriny, čo automaticky znamená početné emisie poškodzujúce naše životné prostredie, zdrojov, ktoré technológia vo veľkom čerpá, je viacero.
S rozmachom generatívnych modelov a iných systémov na báze AI rapídne stúpol dopyt po údajoch, na základe ktorých prebiehajú tréningové procesy. Týchto údajov je veľmi veľa, no majú svoj limit, ktorý sa môže vyčerpať. A poniektorí sa obávajú toho, že k vyčerpaniu raz skutočne dôjde.
Kvantá informácií
Netreba zabúdať na to, že hoci AI dokáže „myslieť“ sama za seba, túto schopnosť nezískala len-tak. Stále ide o ľudský výtvor, čo znamená, že svoje schopnosti musela nadobudnúť na základe informácií zo skutočného sveta. Tieto informácie pritom nie sú potrebné len v rámci tréningových procesov, ale aj v priebehu prevádzky.
AI je technológia, ktorá neustále napreduje a zdokonaľuje sa, čo priamo vedie k zvýšenej potrebe kvalitnejších a bohatších zdrojov údajov. Podľa správy inštitútu Epoch AI môže dopyt po takýchto zdrojoch zaznamenať ohromujúci nárast najmä medzi rokmi 2026 až 2032. Možnú situáciu prirovnáva k tzv. zlatej horúčke.
Háčik je v tom, že kopa informácií, ktoré sú k dispozícii v online priestore, nemôžu byť využité na trénovanie AI modelov. Firmy sa prevažne spoliehajú na blogové príspevky, príspevky publikované na sociálnych sieťach či webové články. Objem informácií poskytovaných týmito zdrojmi však nie je neobmedzený. A keď to skombinujeme s exponenciálne rastúcimi nárokmi vývojárov, dostávame sa k riziku, že jedného dňa dôjde k ich úplnému vyčerpaniu.
Hľadajú alternatívy
Samozrejme, spoločnosti vyvíjajúce AI modely si toto riziko veľmi dobre uvedomujú, preto už teraz rozmýšľajú nad prípadnou náhradou či náhradami. A zdá sa, že jednu už našli. Sú ňou syntetické údaje, čiže údaje, ktoré nepochádzajú od človeka, ale od iných AI systémov. Takýto zdroj by mohol poskytnúť aspoň dočasnú alternatívu po vyčerpaní terajších možností.
Ani toto riešenie však nie je dokonalé. Informácie poskytované AI modelmi totiž nie sú vždy stopercentne presné alebo pravdivé, čo zase vedie k obavám z nadmerného šírenia dezinformácií a zavádzajúcich poznatkov.
Preto sa nateraz zdajú byť vhodnejším riešením služby akýchsi sprostredkovateľov informácií. Ide o subjekty, ktoré sa špecializujú na získavanie a licencovanie nedostatočne využívaných údajov. Tieto služby už využila napríklad spoločnosť OpenAI, ktorá investovala nemalé finančné prostriedky do licenčných zmlúv s platformami Shutterstock a Associated Press, a to za účelom získania prístupu k ich bohatým dátovým archívom.
Viacero východísk
Ťažko povedať, ako sa celá situácia vyvinie, nakoľko zahŕňa viacero premenných. Ako bolo avizované vyššie, v rozmachu AI modelov do istej miery bránia aj právne obmedzenia, ktoré znemožňujú využívanie určitých údajov na internete. Stretnúť sa s nimi môžeme hlavne na území Európskej únie (EÚ) kde platí mnoho legislatív cieliacich na ochranu osobných údajov.
V tomto smere však nie sú veľmi zhovievavé ani čínske zákony, ktoré podporujú vývoj AI len v rámci domácich subjektov.
Stojí však za zmienku, že sú aj iné východiská. Viacerí výskumníci aktívne pracujú napríklad na tom, aby sa AI modely dokázali efektívne učiť aj na základe menších súboroch údajov