Ako dokáže umelá inteligencia spozorovať hejt

Hejt nie je len obsah, ktorý negatívne vplýva na atmosféru na sociálnych sieťach. Keďže je namierený proti istým skupinám obyvateľstva, pôsobí zraňujúco a prispieva k polarizácii spoločnosti. V krajných prípadoch môže ísť aj o závažný akt s právnymi dôsledkami pre autorov hejtu. 

Každopádne, hejt možno považovať za jeden z indikátorov, ktoré poukazujú na pochybný zdroj informácií. Aj dátoví vedci spoločnosti Meta zistili, že vyjadrenia, ktoré vyvolávajú hnev, veľmi často obsahovali dezinformácie. Samotné rozpoznanie hejtu v obrovskom a neustále pribúdajúcom objeme online obsahu je pritom problematické. Jeho identifikácia by však pomohla identifikovať aj dezinformácie a uľahčiť fact-checking, čo je našou prioritou v rámci CEDMO hubu.

Umelá inteligencia, konkrétne strojové učenie, dokáže pomôcť nájsť hejt v príslovečnej kope sena nespočítateľného množstva internetových príspevkov. Nástroje umelej inteligencie však nie sú, a ani by nemali byť, konečným sudcom, ktorý hejtera odsúdi. Metódy strojového učenia skôr dokážu pomôcť hejt nájsť napríklad Facebooku, aby jeho administrátori – ľudia – mohli zasiahnuť a problematický príspevok vymazať, prípadne pristúpiť aj k ďalším krokom, ako napríklad zablokovať účet hejtera. V príspevku Addressing Hate Speech with Data Science sme poukázali aj na to, čo umelá inteligencia dokáže a čo už nie. 

Dôvodov, prečo umelá inteligencia nenahradí ľudskú inteligenciu právnikov, sudcov či iných odborníkov z rôznych inštitúcii pri dokazovaní hejtu, je niekoľko. Umelá inteligencia ťažko nájde v texte dôkaz o tom, že niekoho slovné vyjadrenie je útokom (na základe rasy atď.) a podnecuje nenávisť alebo násilie. Automaticky nemáme možnosť zistiť efekt textu na niekoho iného. Takýto účinok, ak má byť použitý v trestno-právnom konaní, musí byť dokázaný  odborníkmi. 

Čo môžeme od strojového učenia čakať

Zámer človeka je náročné určiť a dokázať nielen automaticky, ale aj ľuďmi. Napomôcť však môžu fenomény, ktoré s hejtom bývajú spojené – napríklad klamanie, nezmysly (bullshitting), manipulácia či zavádzanie. 

Vďaka umelej inteligencii dokážeme nájsť prvky v texte, ktoré sú pre hejt charakteristické, ako napríklad agresívne výrazy.  Na to nám dobre poslúžia metódy ako analýza sentimentu, označovanie tém, detekcia jazyka a zámeru konverzácie

Keď hovoríme o automatickej identifikácii hejtu, v súčasnosti tým myslíme skôr hejt v textovej podobe. Analýza hejtu šíreného prostredníctvom obrázkov a videí predstavuje z pohľadu automatického spracovania ešte náročnejší problém. I keď znova môžu napovedať metadáta a kontext, napríklad demografia postujúceho, jeho umiestnenie, čas či spôsob zapojenia ľudí na sociálnych sieťach. Tieto prvky však nestačia na odsúdenie hejtera. Môžu byť použité na pomoc moderátorovi pri hľadaní hejtu v kope sena. Ten už nemusí vynaložiť toľko času a energie, koľko by mu zabralo čítanie všetkých príspevkov. 

Ako proces nachádzania hejtu môže vyzerať

Pri najjednoduchších metódach sa možno pozrieť na zoznamy slov a fráz, využívaných v hejte – napríklad nadávky. Takýto spôsob však nie je veľmi efektívny, lebo nadávky nie vždy znamenajú hejt. Niekedy sú nadávky používané aj v priateľskom tóne. A sofistikovanejší hejter si dá pozor, aby tieto slová priamo nepoužil. 

Zložitejšie modely strojového učenia sú schopné nájsť hejt pomocou štatistických metód. Prvým a najdôležitejším predpokladom je dostatočne veľký dataset hejtu, označený (anotovaný) odborníkmi. Modely sa na týchto dátach následne naučia, ako hejt nájsť aj v inom texte. Fungujú tak, že v dátach hľadajú opakujúce sa vzorce. Všímajú si napríklad, ako často sa nejaké slová v texte nachádzajú. Nápovedou je aj kvalita textu, napríklad jeho čitateľnosť. Bývalý manažér Google Eric Smidt sa vyjadril, že už len kontrola gramatiky by dokázala pomôcť identifikovať hejt. 

Neurónové siete, ktoré sú inšpirované ľudským mozgom, dokážu nájsť aj vlastnosti textu, ktoré sú ľudskému oku skryté. Problémom však býva tieto strojové zistenia človeku vysvetliť. Aj na tom však výskumníci v oblasti umelej inteligencie pracujú

Aj vy budete môcť AI pomôcť nájsť hejt 

Ako sme spomenuli, základom pre automatickú identifikáciu hejtu sú kvalitné dáta, na ktorých sa modely môžu učiť. Problémom však je, že neexistuje široko etablovaný referenčný dataset hejtu, a už vôbec nie pre slovenčinu.

Vytvorili sme preto nástroj, v ktorom môže ktokoľvek nahlásiť hejt, či iné dezinformácie alebo manipulácie v slovenčine. Stačí si nainštalovať rozšírenie do prehliadača. Spolu sa tak pokúsime aspoň lokálne nahradiť to, čo zamýšľal nasadiť samotný Facebook. V roku 2018 Facebook totiž náhodou odhalil tlačidlo na nahlásenie hejtu. Žiaľ tento zámer sa nikdy nedostal do produkčného nasadenia.