Viacero popredných technologických firiem sa preteká v tom, ktorá z nich dokáže ponúknuť lepší, resp. výkonnejší AI model. Mnohí by si mohli myslieť, že tomuto segmentu dominuje OpenAI so svojím modelom ChatGPT. A hoci to kedysi bola pravda, dnes sa má vec inak. Google totiž výrazne vylepšil svoju Gemini AI, ktorá tak mnohonásobne prekonáva ChatGPT a dokáže lepšie porozumieť kontextu, na ktorý cieli používateľ, píše portál Živé.sk.
Kapitoly článku:
Google pôvodne predstavil Gemini AI v decembri minulého roku ako pokročilý AI model nahrádzajúci dovtedy používaný model Bard.
Nový softvér operuje na troch úrovniach odlišujúcich sa výkonom a náročnosťou. Najnižšou verziou je „Nano“, ktorá dokáže vykonávať úlohy priamo na zariadeniach, vrátane smartfónov. Prostredná verzia nesie označenie „Pro“. Je o čosi výkonnejšia, čiže dokáže pracovať so širším spektrom údajov a vykonávať aj náročnejšie úlohy. Najvyššou verziou je „Ultra“, ktorá figuruje ako najväčší a najsilnejší AI model Google so schopnosťou poradiť si aj s tými najintenzívnejšími úlohami.
Krátko po tom, čo bola Gemini AI uvedená do prevádzky, sa k nám dostali prvé recenzie. Tie v mnohých prípadoch tvrdia, že model je náramne pokročilý. Niekedy vraj svojimi kapacitami dokonca naháňa hrôzu. Jedným z prvých recenzentov bol aj Ethan Mollick, profesor na Wharton School of the University of Pennsylvania. Ten uviedol, že GPT-4 aj Gemini miestami nepôsobia ako programy, ale ako ilúzie bytostí: „Je v nich zvláštnosť, nie je to vnímavosť, no nie je to ani ako konverzovanie s programom… Je to ilúzia osoby na druhom konci linky, hoci tam nikto nie je.“
Mollick taktiež uviedol, že Gemini má trochu inú „osobnosť“ ako ChatGPT. Model od Google je podľa neho o čosi priateľskejší, príjemnejší a používa viac slovných hračiek.
Gemini 1.5 Pro
Po novom sa Google rozhodol posunúť kapacity Gemini AI ešte ďalej, a to formou verzie Gemini 1.5. V príspevku na blogu konkrétne opísal verziu Gemini 1.5 Pro, ktorá vraj už je k dispozícii na testovanie vybraným vývojárom.
Verzia Gemini 1.5 Pro má mnohonásobne výkonnejšia a schopnejšia ako ChatGPT. Svedčí o tom napríklad schopnosť spracúvania až milióna tokenov. Pre lepšie pochopenie – tokeny v tejto súvislosti označujú vstupné informácie, ktoré pre interakciu s modelom zadávajú používatelia. Zadané informácie si model dokáže vložiť do svojej pamäte a na základe nich neskôr poskytovať adekvátnejšie, čiže presnejšie výstupy.
Platí totiž, že čím viac tokenov dokáže AI model spracovať, tým lepšie dokáže porozumieť kontextu príkazu zadaného používateľom.
V tomto ohľade má Gemini 1.5 Pro výrazne navrch pred konkurenciou. Pre porovnanie, GPT-4 Turbo dokáže spracovať 128 000 tokenov, Claude 2.1 maximálne 200 000 tokenov. Pokiaľ hovoríme o medzigeneračnom pokroku, ten je ešte výraznejší. Gemini 1.0 Pro totiž dokázal spracovať len 32 000 tokenov.
A tu vraj ambície Google nekončia. Údajne už chystá ďalšie vylepšenie, ktorý posunie vrchnú hranicu na až 10 miliónov tokenov.
Skôr pre firmy
Takéto masívne vylepšenie však nepocítia ani tak bežní používatelia, ale skôr firmy, ktoré používajú AI na skvalitnenie svojich služieb. Týka sa totiž verzie „Pro“, ktorá nefunguje na smartfónoch. Ide o verziu pre náročnejšie úlohy, takže sa hodí predovšetkým tým, ktorí jej dokážu poskytnúť väčšie množstvo dát.
Inými slovami, navýšenie množstva tokenov, s ktorými model dokáže pracovať, sa nepretaví do fungovania nám prístupných chatbotov. No to neznamená, že sa nás nijak nedotkne. Ak sa firmy rozhodnú adoptovať a využiť novú verziu Gemini AI, môžu nám byť schopné poskytnúť rýchlejšie, presnejšie a obecne kvalitnejšie služby.
Gemini 1.5 Pro pritom nemusí pracovať len s textom. Keďže ide o multimodálny model, dokáže porozumieť aj obrázkom, zvukom či kombináciám podporovaných vstupov.
Google sa rozhodol správne
Je dôležité poznamenať, že AI modely stále majú ďaleko od dokonalosti. Ich najväčším nedostatkom však nie je ani tak objem údajov, s ktorým dokážu pracovať. Odborníci videli (a vidia) problém skôr vo vyhodnocovaní kontextu. Dávnejšie sme na našom webe publikovali článok, v ktorom sme vás informovali, že podľa viacerých odborníkov si budú AI modely vždy niektoré informácie a poznatky vymýšľať.
Práve túto slabú stránku sa Google snaží postupne eliminovať. Ako sme už spomenuli vyššie, čím viac tokenov dokáže AI model spracovať, tým lepšie dokáže porozumieť kontextu a poskytnúť tak presnejšie a správnejšie odpovede.
„Ja osobne to vnímam ako jeden z ďalších úspešných krokov k ďalším vylepšeniam transformerov, kde je snaha o širší kontext, efektívnejší výpočet, spracovanie rôznorodých dát, efektívnejšie využívanie architektúry typu Mixture of Experts… atď,“ konštatuje Vanda Benešová, odborníčka na umelú inteligenciu z Ústavu počítačového inžinierstva a aplikovanej informatiky na FIIT STU.