Falošné správy, falošné recenzie a falošní používatelia: Ako odlíšiť klamstvo inteligentnými metódami

Dezinformácie (falošné správy) a antisociálne správanie (ako hejtovanie či trolovanie) sú pre digitálne prostredie toxické. Najmä dnes potrebujeme online priestor, kde je možné získať spoľahlivé a pravdivé informácie, ako sa aj bezpečne “stretávať”. Spojili sme preto sily s kolegami zo Slovenská technická univerzita, Univerzita Komenského a Technická univerzita v Košiciach a v spoločnej publikácií sme zosumarizovali niektoré naše doterajšie výskumné aktivity, ktorých cieľom je takýto nežiaduci obsah a neetických používateľov charakterizovať a odhaľovať.

V našich výskumoch využívame inteligentné a znalostne orientované metódy, najmä strojové učenie, deep learning, spracovanie prirodzeného jazyka a dopĺňame ich metódami, bežne používanými v digitálnych sociálnych a humanitných vedách. Okrem iného, sme analyzovali aj česko-slovenskú mediálnu a partizánsku scénu, najmä prepojenia medzi jednotlivými médiami pomocou odkazov. Pre identifikáciu používateľov, pri ktorých je najviac pravdepodobné, že budú zdieľať falošné správy, sme zase skúmali ich sociálny kontext a vlastnosti zdieľaných textov.

Z našich výsledkov vyberáme:

  • Partizánske médiá možno odlíšiť od tradičných aj na základe odkazovania medzi nimi
  • Na detekciu falošných účtov možno využiť sociálny kontext používateľa, výsledky sú však doménovo závislé. Ich detekcia sa značne zlepšila, keď boli pridané aj vlastnosti textu príspevkov používateľov. 
  • Na detekciu falošných recenzií sa nám z rôznych testovaných metód najviac osvedčil model, ktorý využíval na učenie SVM (Support Vector Machine).
Ilustračný obrázok. Zdroj: europarl.europa.eu

V našej práci nechceme byť arbitrom pravdy – klebety a rôzne názory sú súčasťou slobody prejavu a demokracie a ako také nemajú byť obmedzované. V súčasnosti sme však svedkami informačnej vojny – preukázateľne koordinovaných akcií ľudí a botov, ktorých jediným cieľom je narúšať dôveru v spoločnosti. Sme si vedomí, že takýto boj sa nedá vyhrať iba informatickými metódami, aj keď výrazne zefektívňujú manuálnu detekciu. Potrebná je tiež spolupráca s ďalšími odborníkmi, ako sú novinári, učitelia a iné kapacity vo verejnej a neziskovej sfére.

Full citation: Machova K. et al. (2021) Addressing False Information and Abusive Language in Digital Space Using Intelligent Approaches. In: Paralič J., Sinčák P., Hartono P., Mařík V. (eds) Towards Digital Intelligence Society. DISA 2020. Advances in Intelligent Systems and Computing, vol 1281. Springer, Cham. https://doi.org/10.1007/978-3-030-63872-6_1