Apple v oblasti umelej inteligencie výrazne zaostáva. Zatiaľ čo ostatní technologickí giganti už stihli predstaviť vlastné generatívne modely a systémy, ten kalifornský vyčkáva. Nevyčakáva však so založenými rukami. Práve naopak, vyvíja značné úsilie, aby na trh časom priniesol umelú inteligenciu, ktorá konkurencii vytrie zrak. A postupne už začína ceriť zúbky – jej nový systém AI po výkonnostnej stránke prekonáva dokonca aj GPT-4.
Ako píše server MacRumors, výskumníci v Apple vyvinuli systém umelej inteligencie s názvom Reference Resolution as Language Modeling, čiže ReALM. Jeho cieľom je „radikálne zlepšiť“ spôsob, akým hlasoví asistenti rozumejú zadaným príkazom a reagujú na ne.
Apple vo svojej výskumnej práci naznačuje spôsob, ako môžu veľké jazykové modely riešiť spracúvanie referencií, ktorý zahŕňa dešifrovanie nejednoznačných odkazov na entity na obrazovke, ako aj pochopenie kontextu rozhovoru. Jednoduchšie povedané, ReALM môže umožniť intuitívnejšie a prirodzenejšie interakcie s podporovanými zariadeniami.
Zámená aj nepriame odkazy
Spracúvanie odkazov je pritom veľmi dôležitou súčasťou porozumenia prirodzenému jazyku. Používatelia vďaka nemu môžu pri zadávaní príkazov používať napríklad aj zámená či nepriame odkazy. Táto schopnosť bola v minulosti pre hlasových asistentov značnou výzvou. Limitovala ju najmä potreba interpretácie širokej škály slovných odkazov a vizuálnych informácií.
Systém ReALM sa nedokonalosti snaží odstrániť tým, že zložitý proces spracúvania odkazov mení na záležitosť čisto jazykového modelovania. Týmto spôsobom dokáže porozumieť odkazom na vizuálne prvky zobrazené na obrazovke zariadenia a začleniť toto pochopenie do toku konverzácie.
ReALM taktiež dokáže rekonštruovať vizuálne rozloženie obrazovky pomocou textových reprezentácií. To zahŕňa rozbor entít na obrazovke a ich umiestnenia s cieľom vytvoriť textový formát zachytávajúci obsah a štruktúru obrazovky. Táto stratégia v kombinácií so špecifickým vylaďovaním jazykových modelov na úlohy späté so spracúvaním referencií môže priniesť kapacity, ktoré by prekonávali doposiaľ zaužívané metódy. Prekonávať by mali dokonca aj model GPT-4 od spoločnosti OpenAI.
Užitočnejší asistenti
Ak by sme to mali zosumarizovať – ReALM môže používateľom umožniť oveľa efektívnejšiu interakciu s digitálnymi asistentmi, ktorí by dokázali porozumieť tomu, čo sa práve odohráva na obrazovke zariadenia, bez potreby presných alebo podrobných pokynov. Hlasoví asistenti by sa tak mohli stať prínosnými pomocníkmi v rôznych oblastiach našich každodenných životov, napríklad pri používaní navigačných systémov v autách.
Prečítajte si tiež:
- Hrozia mastné pokuty: EÚ má toho dosť, na koberček si predvolala Apple, Google aj Meta
- Je Apple s AI skutočne tak pozadu, ako si myslíme? Tim Cook tvrdí, že nie
- Apple s AI nepomôže len Google. Technológiu si vraj požičia aj od Číňanov
Vznik systému ReALM naznačuje, že Apple má v oblasti umelej inteligencie naozaj veľké plány. Očakáva sa, že v nemalej miere jej pomôže Google, s ktorým má rokovať o poskytnutí licencie na model Gemini. Očakáva sa, že viac detailov ohľadne snahy Apple v rámci AI sa dozvieme počas nadchádzajúcej vývojárskej konferencie WWDC, ktorá sa bude konať v júni.