Spoločnosť OpenAI, ktorá stojí za mimoriadne obľúbeným generatívnym modelom umelej inteligencie (AI) – ChatGPT – prichádza s veľkolepým oznámením. Predstavila novú verziu modelu s označením o3, ktorá bude priamym nástupcom o1. Súčasťou novej generácie bude aj model o3-mini, navrhnutý na špecifické úlohy, informuje TechCrunch.
OpenAI tvrdí, že o3 v určitých podmienkach dosiahne úroveň blízku tzv. všeobecnej umelej inteligencii (AGI), i keď s určitými výhradami.
Možno sa pýtate, prečo si spoločnosť zvolila označenie o3 a nie o2. Dôvod je celkom prostý. Podľa The Information sa spoločnosť chcela vyhnúť konfliktu s telekomunikačným operátorom O2, čo nepriamo potvrdil aj Sam Altman, generálny riaditeľ, počas livestreamu.
Nateraz dvojica nových modelov nie je verejne dostupná. Bezpečnostní odborníci však môžu na základe registrácie získať náhľad menšieho modelu o3-mini.
Plná verzia o3-mini by mala byť sprístupnená koncom tohto mesiaca, pričom vydanie plnej verzie o3 je naplánované na neskôr, nateraz v bližšie nešpecifikovanom dátume. Tento plán však môže byť v rozpore s nedávnymi vyjadreniami Altman, ktorý by pred vydaním nových modelov preferoval existenciu federálneho testovacieho rámca na monitorovanie a znižovanie rizík.
Pokrok, ktorý nie je bez kompromisov
Modely s logickým myslením, akým je o1, sa ukázali byť náchylnejšie na pokusy o klamanie používateľov. A keďže o3 má byť ešte chytrejší, vznikajú obavy, či tento problém nebude ešte vážnejší. OpenAI sa však oháňa technikou „deliberatívneho zarovnania“, ktorá by mala výrazne obmedziť generovanie klamlivých výsledkov.
Riziko chýb má znížiť aj schopnosť modelu overovať svoje vlastné fakty. Ide o kľúčový a náramne dôležitý proces, ktorý si však pýta svoju daň, konkrétne v podobe dlhšej odozvy – generovanie odpovedí môže trvať dlhší čas. No asi sa všetci zhodneme na tom, že oneskorené správne odpovede sú lepšie ako bleskové nesprávne odpovede. Model o3 má byť podstatne spoľahlivejší aj pri komplexnejších otázkach z oblastí ako fyzika, veda či matematika.
Vyškolený bol metódou posilňovaného učenia, čo znamená, že pred poskytnutím konkrétnej odpovede nad ňou dôkladne „popremýšľa“. V praxi model pred odpoveďou analyzuje súvisiace podnety a vysvetľuje svoje myslenie. Tiež umožňuje nastaviť „čas na premýšľanie“ – na nízke, stredné alebo vysoké výpočtové zaťaženie.
AI chytrejšia ako človek?
Vyššie sme spomenuli všeobecnú umelú inteligenciu, skrátene AGI. Týmto pojmom sa označujú systémy, ktoré dokážu vykonávať také isté úlohy ako človek. Podľa OpenAI dosiahol o3 v teste ARC-AGI skóre 87,5 percenta, konkrétne pri vysokom výpočtovom nastavení, čím výrazne prekonáva o1. Na nižších nastaveniach však výsledky citeľne klesajú.
Kritici, ako François Chollet, upozorňujú, že o3 má zásadné rozdiely oproti ľudskej inteligencii. Napríklad zlyháva na jednoduchých úlohách, ktoré by pre človeka boli triviálne.
Pokiaľ ide o testy v benchmarkoch, o3 prekonáva svojho predchodcu v nasledovných oblastiach:
- Programovanie: o3 dosiahol o 22,8 percenta lepšie výsledky v teste SWE-Bench Verified a získal Codeforces hodnotenie 2 727, čo ho radí do top 0,8 percenta programátorov;
- Matematika: Skóroval 96,7 percenta v 2024 American Invitational Mathematics Exam;
- Veda: Dosiahol 87,7 percenta v otázkach z biológie, fyziky a chémie na úrovni absolventov.
OpenAI spolupracuje s nadáciou ARC-AGI na vývoji ďalšej generácie benchmarkov a plánuje ďalšie testovanie modelov. Napriek dosiahnutým pokrokom však otázka, či logické modely dokážu udržať tempo zlepšovania, zostáva otvorená.