Prečo je internet dobrý sluha a zlý pán?

Rozvoj internetu ako celosvetovej počítačovej siete a neskorší vznik webu na zdieľanie informácií, sú vynálezy azda podobnej dôležitosti ako bol vynález kníhtlače. 

Obe tieto technológie zásadným spôsobom prispeli k tomu, že poznatky a informácie máme prakticky “poruke”. Nemusíme zháňať knihy, dlho čakať na ich dostupnosť v knižnici či prácne hľadať informácie v nich. Dnes nám stačí siahnuť do vrecka a vyťukať jednoduchý dopyt. Odbúrala sa tak obrovská bariéra v prístupe k informáciám.

Okrem toho nám technológie umožnili spájať sa – s priateľmi, rodinou, ale aj cudzincami. Naše sociálne siete sa stali virtuálnymi. 

V posledných rokoch sa k technológiám, ktoré zásadne menia naše životy, začala zaraďovať aj umelá inteligencia. Prečo až teraz? Je to najmä vďaka neustále rastúcej výkonnosti (výpočtovej sile) počítačov, teda ich hardvérovej stránky. Množstvo operácií, ktoré dnes dokážeme na počítači vykonávať, sa posunul na hranicu, kedy už dokážeme efektívne vytvárať tzv. modely neurónových sietí – srdce súčasnej umelej inteligencie. 

Umelá inteligencia dnes ešte stále nie je taká, akú ju vídame vo filmoch. Nemá ľudskú podobu, nemá ani vedomie (a ešte nejaký čas ho mať nebude). Jej aplikácie nás však takmer dennodenne udivujú v tom, aké pokroky dokáže robiť a aké zložité problémy nám pomáha riešiť. 

Umelá inteligencia, obzvlášť v spojení s internetom, nám toho môže veľa dať, ale niekedy môže byť aj trochu nebezpečná. Je dôležité, aby sme nové technológie využívali s rozumom a boli si vedomí rizík, ktoré sú s nimi spojené.

Ale poďme pekne poporiadku. 

Čo je to umelá inteligencia

Umelá inteligencia sú počítačové programy, ktoré vznikli tzv. trénovaním (učením) a vedia riešiť ťažké úlohy, teda spracovávať také vstupy, na ktoré neboli špeciálne natrénované (ktoré predtým nevideli). Trénovanie (učenie) je proces, kedy vytvárame počítačový program (presnejšie: model), avšak nerobíme to “klasickým” programovaním, teda písaním programového kódu, čo bol doteraz dominantný spôsob tvorby počítačových programov.

Model je základná súčiastka umelej inteligencie. V podstate je to čosi, čo dokážeme niečo natrénovať (naučiť). Veľmi výkonným modelom je dnes umelá neurónová sieť, ktorá je inšpirovaná našim mozgom. Ten pozostáva z miliárd neurónov a biliónov prepojení medzi nimi. Túto štruktúru kopíruje aj umelá neurónová sieť, akurát umelé neuróny nie sú živé bunky, ale jednoduché matematické funkcie. 

Umelá neurónová sieť je v podstate obrovská sieť čísel schopná zapamätať si veľmi veľa informácií a riešiť (všeobecné) úlohy, napr. odpovedať na otázku “Je na zobrazenom obrázku pes?” alebo viesť konverzáciu s používateľom na takmer ľubovoľnú tému.

Ako funguje umelá inteligencia?

Životný cyklus umelej inteligencie pozostáva z dvoch základných častí: už spomínaného trénovania a samotnej prevádzky.

Trénovanie, alebo tiež učenie umelej inteligencie (presnejšie: modelu umelej inteligencie) môže prebiehať rôznymi spôsobmi. Jedným z nich je, že modelu “ukazujeme” rôzne príklady úlohy, riešenie ktorej chceme model naučiť. 

Zoberme si príklad: Model chceme naučiť rozpoznávať, či je na obrázku pes alebo nie. V procese trénovania mu preto ukážeme stovky, ba až tisíce obrázkov, kde pes je. Zároveň mu ukážeme ďalšie tisíce obrázkov, kde je nejaký tvor alebo objekt, ktorý psom nie je. Čím viac príkladov – pozitívnych aj negatívnych – máme, tým lepší model dokážeme natrénovať. 

Model si v procese trénovania upravuje svoju vnútornú štruktúru, teda tie miliardy čísel, aby dokázal správne odpovedať. Presný mechanizmus učenia je daný typom (alebo architektúrou) neurónovej siete, ktorá je na tú-ktorú úlohu určená. Poznáme mnoho typov aj architektúr, ale o tých možno niekedy inokedy.

Prevádzka umelej inteligencie je používanie natrénovaného modelu. V našom príklade: modelu ukážeme nový obrázok (ktorý predtým ešte nevidel) a model – na základe svojej vnútornej číselnej štruktúry – odvodí, či ide alebo nejde o psa. Niekedy to môže byť poriadne náročná úloha.

Umelá inteligencia pracujúca s obrázkami je veľmi užitočná v medicíne, napr. pri detekcii ochorení na lekárskych snímkach, alebo v doprave, napr. pri detekcii objektov pre autonómne vozidlá (tie, čo jazdia bez šoféra).

Iným prípadom použitia umelej inteligencie je práca s textom. Vezmime si napríklad taký filter nevyžiadanej pošty (spam filter) vo vašej emailovej aplikácii, ktorý usilovne deteguje, či prijatá pošta pochádza od hodnoverného zdroja alebo ide o nechcený či dokonca škodlivý obsah. Ešte lepším príkladom umelej inteligencie pracujúcej s textom sú inteligentné četboty, ako napr. dnes veľmi známy ChatGPT. Ich základom sú tzv. veľké jazykové modely.

Veľké jazykové modely sú, podobne ako modely na spracovanie obrázkov, modely umelých neurónových sietí. Zaujímavý je proces ich trénovania: Príklady, ktoré takémuto modelu ukazujeme, sú vlastne len vety. Miliardy viet. Opäť platí: čím viac, tým lepšie. Modelu ich však ukazujeme postupne tak, že niektoré slová z tých viet schováme a trénujeme ho na to, aby tie vynechané slová uhádol. Model si, pomocou tých miliárd čísel, čo má v sebe, zakóduje postupnosti slov tak, že ich vie generovať v zmysluplnom poradí. A preto potom v prevádzke do vety “Cez Bratislavu tečie ____” nedoplní slovo “medveď” alebo “vysvedčenie”, ale slová ako “rieka” alebo “Dunaj”. To preto, lebo tie sa omnoho viac podobajú na to, čo videl v príkladoch, z ktorých sa učil.

Fungovanie umelej inteligencie je založené na štatistike. Modely umelej inteligencie ponúkajú na svojom výstupe vždy nie nutne správnu, ale najpravdepodobnejšiu možnosť.

Jeden už trochu starší, ale zato rýdzo slovenský veľký jazykový model si môžete vyskúšať aj tu: https://slovakbert.kinit.sk/.

Okrem spracovania obrázkov či textu môžeme umelú inteligenciu využiť aj pri spracovaní ďalších typov dát. S veľkým úspechom sa používa napr. pri odporúčaní produktov, služieb, filmov či obsahu na sociálnych sieťach.

A tu sa dostávame k málo uvedomelému vzťahu internetu a umelej inteligencie. Ich spojením vzniká super-technológia, veľmi ľahko šíriteľná a veľmi výkonná. Preto na nás môže mať prekvapivo veľký vplyv. Ten môže byť na jednej strane pozitívny, môže mať však aj tienisté stránky. Poďme sa pozrieť na tri prípady spojenia umelej inteligencie a internetu, a niektoré vlastnosti, ktorým by sme mali venovať dostatočnú pozornosť.

Odporúčače 

Všetci dobre poznáme sociálne siete ako Facebook, TikTok či YouTube. Máme ich radi, pretože nám vedia rýchlo ponúknuť pre nás zaujímavý obsah, bez veľkej námahy. Ich jadrom sú odporúčače obsahu, alebo tzv. odporúčacie systémy. Aby vedeli vybrať správny obsah, sledujú naše správanie aj aktivitu našich priateľov. Vedia, čo sa nám páči a čo nie.

Na prvý pohľad to vyzerá v poriadku. Treba si však uvedomiť, že každá sociálna sieť je komerčný produkt, ktorého cieľom je zarobiť. Súčasné zárobkové modely sú nastavené tak, že zarábajú vtedy, keď ich my, používatelia, používame čo najviac. Vtedy nám môžu ponúknuť viac reklamy a plateného obsahu. Odporúčače na sociálnych sieťach nám vyberajú – odporúčajú – často metódami umelej inteligencie obsah nielen taký, ktorý by nás mohol zaujímať, ale najmä taký, ktorý nás tam udrží čo najdlhšie.

Sociálne siete využívajú prirodzené ľudské vlastnosti a mnohé triky, ktorými to dosiahnu. Napríklad často preferujú kontroverzný, emocionálny obsah a hejt, pretože napätie nás priťahuje. Neblahým dôsledkom je, že máme skreslený pohľad na realitu (svet vyzerá negatívnejšie, ako v skutočnosti je). 

Priamo vo svojich používateľských rozhraniach majú mechanizmy rýchleho “odmeňovania” (reakcie, páčiky), ktoré nám spôsobujú náhle uspokojenie a môžu dokonca viesť až k závislosti. Alebo nám odporúčajú ľúbivý obsah. Taký, ktorý sa nám s veľkou pravdepodobnosťou bude páčiť, lebo je v súlade s tým, čo si myslíme. Uzatvárajú nás tak do tzv. informačných bublín, a tým nevedome formujú naše názory a ovplyvňujú nás.

Mimochodom, výskumu informačných bublín sa venujeme aj my, v Kempelenovom inštitúte inteligentných technológií. .

Receptom na to, ako mať pod kontrolou neželaný vplyv týchto technológií, je poznať ich vlastnosti. Nie je nutné ani užitočné ich prestať používať. Určite však treba rozumne obmedziť čas, ktorý im venujeme a vystavovať sa aj inej sociálnej interakcii ako len tej virtuálnej.

Četboty

Pred necelým rokom veľkú senzáciu spôsobilo uvedenie novej generácie četbotov na čele s ChatGPT. Ide o četboty, ktoré už nie sú dopredu naprogramované na interakciu s používateľom podľa zopár scenárov, ako tomu bolo prevažne doteraz. Sú založené na veľkých jazykových modeloch (áno, tých, ktoré sme spomínali vyššie). Tým pádom majú v podstate neohraničené možnosti komunikácie. Trochu iné to je už s ich spoľahlivosťou či dôveryhodnosťou.

Dnešné inteligentné četboty majú úžasné výhody: umožňujú nenáročnú komunikáciu, môžeme sa konečne pýtať ľudskou rečou. Dokážu odpovedať s ohľadom na kontext konverzácie alebo nášho profilu, ktorý si časom vytvorili. Sú rýchlym a obsiahlym zdrojom vedomostí. A to je azda jedna z najväčších výhod: dokážu nás veľa naučiť, naše otázky ich nikdy neunudia, vždy budú ochotné odpovedať znovu a znovu.

Na strane druhej si musíme uvedomiť, že je to stále pomerne nová, experimentálna a nepreskúmaná technológia. Aj keď tak pôsobia, dnešné četboty v skutočnosti nie sú inteligentné (minimálne zatiaľ nie). Obsahujú rôzne predsudky a skreslenia (biasy), ktoré nie sú férové (voči niektorým skupinám ľudí) a môžu nás negatívne ovplyvniť. Napríklad tým, že budú prekrúcať historické skutočnosti, alebo sa negatívne vyjadrovať o niektorých menšinách. Jazykové modely sú len také dobré, aké dobré boli dáta použité na ich trénovanie. A vieme, že v obsahu na internete – a ten je potrebný, pretože na trénovanie potrebujeme obsahu naozaj veľa – môžeme nájsť hocičo. Nie je v ľudských silách tvorcov týchto modelov skontrolovať úplne všetko.

Zároveň platí, že jazykové modely si môžu aj vymýšľať. Keď nevedia odpovedať, vymyslia si nejakú hlúposť. Vtedy hovoríme o tzv. halucinovaní. Je to vlastnosť, ktorá vychádza zo štatistickej podstaty modelov umelej inteligencie, ktoré sú v čatbotoch použité. Je to fenomén, ktorému ešte poriadne nerozumieme ani my výskumníci a sami sa ho snažíme lepšie pochopiť.

Četboty sú technológia s obrovským potenciálom. Nesmieme však zabudať na jej ohraničenia. Aby sme jej nepodľahli, musíme si pripomínať jej limity. Aj keď četboty budia dojem ľudskosti a pôsobia dôveryhodne, nie sú také, lebo nemajú ucelenú predstavu o vonkajšom svete. Nebuďme krátkozrakí a nenechajme sa tým okabátiť. 

Deepfakes (a iné informačné poruchy)

Dípfejky (angl. deepfakes), hoaxy, falošné správy a dezinformácie spoločne označujeme ako informačné poruchy. V poslednej dobe sa s nimi roztrhlo vrece. Šíreniu všetkých týchto neduhov prispievajú práve moderné technológie. Cena vytvorenia falošného obsahu je nízka, dôveryhodnosť vysoká, potenciálny dopad obrovský. Pozor, nevytvára ho umelá inteligencia sama, ale ľudia, ktorí ju zneužívajú, pretože chcú škodiť, alebo len jednoducho získať vo svojom žívote nejakú neférovú výhodu (pozornosť, nasledovateľov, vplyv, …).

Nie je to šokujúce ani nič nové, komunikačná “šikovnosť” hrala dôležitú úlohu v mnohých významných historických momentoch. Avšak komunikácia v dnešnom svete má, aj kvôli moderným technológiám, rôzne charakteristiky, na ktoré nie sme (evolučne) prispôsobení. Informácie sa šíria mimoriadne rýchlo. Môžu zasiahnuť obrovské množstvo prijímateľov naraz. Dnešné diskutované témy sú zložité, nie všetkému rozumieme hneď. Navyše, pri komunikácii existujú rôzne kognitívne (biologické) javy (tzv. konfirmačné skreslenie, nevedomé predsudky, …), ktoré nám znemožňujú prijímať informácie zakaždým racionálne a kriticky. Toto všetko dáva silné predpoklady na to, aby mohla byť komunikácia (šírená internetom) zneužitá na manipuláciu a masívne dezinformačné kampane.

Na tieto poruchy žiaľ neexistuje jednoduchý recept. Riešením je poctivá práca žurnalistov a ďalších mediálnych profesionálov a aj nás vedcov. Musíme napomáhať overovaniu faktov a zefektívňovať prácu tzv. fact-checkerov, strážnych anjelov informácií. Tí, ktorým na tom záleží, sa spájajú do spoločných mediálnych observatórií. Jedno také pre strednú Európu je CEDMO. A my, používatelia internetu a koneční konzumenti informácií, musíme využívať a kultivovať našu najsilnejšiu zbraň: kritické myslenie. Falošné informácie a iné informačné poruchy tu s nami budú ešte dlho, musíme sa s nimi jednoducho naučiť žiť.

Príklady informačných porúch: Falošná fotografia pápeža Františka publikovaná na sociálnej sieti Reddit (vľavo) a vizualizácia odhalenej dezinformácie o koronaviruse (vpravo).

Článok vznikol pre Detskú Univerzitu Komenského, vyšiel aj v DUK zbierke článkov pre ročník 2023.