Home
Research
Web & User Data Processing
RobIndAI: Robustnosť indikátorov dezinformačného obsahu generovaného AI vo viacjazyčnom online priestore

Project

Duration: 11/2024 - 06/2026

Funding agency: Plán obnovy

Project type: Scientific project

Principal investigator: Jakub Šimko

RobIndAI: Robustnosť indikátorov dezinformačného obsahu generovaného AI vo viacjazyčnom online priestore

Projekt RobIndAI bojuje proti zneužívaniu AI na generovanie dezinformačných textov pomocou zvýšenia robustnosti metód detekcie strojovo-generovaného textu. Zameraním RobIndAI je viacjazyčný obsah (najmä jazyky stredoeurópskeho informačného priestoru) v doméne novinových článkov a obsahu sociálnych módií. RobIndAI je koncipovaný ako rozšírenie projektu VIGILANT (Horizontu Európa), ktorého je KInIT riešiteľom.

Cieľom projektu RobIndAI je výskum metód a modelov umelej inteligencie na zvýšenie robustnosti indikátorov dezinformačného obsahu (z webu a sociálnych médií) s orientáciou najmä na detekciu strojovo generovaného textu. Vzhľadom na schopnosť moderných jazykových modelov generovať vysokokvalitný text v rôznych jazykoch, ktorý je pre človeka nerozoznateľný, je obava zo zneužitia tejto technológie rastúca (napr. medzinárodné dezinformačné kampane). Spoľahlivá detekcia strojovo generovaného textu a jeho rozlíšenie od originálneho textu písaného človekom je v tomto ohľade podstatným a veľmi žiadaným indikátorom.

V projekte RobIndAI budú použité metódy a modely zamerané na spracovanie textu a jeho klasifikáciu, fundamentálne multilingválne, prispôsobené predovšetkým potrebám stredoeurópskeho informačného priestoru. V rámci projektu bude realizovaná porovnávacia štúdia efektívnosti existujúcich metód detekcie textu generovaného prostriedkami umelej inteligencie v stredoeurópskych jazykoch. Štúdia efektívnosti bude zameraná okrem identifikácie použiteľnosti jednotlivých detekčných metód v daných jazykoch aj na vyhodnotenie ich odolnosti voči existujúcim útokom a technikám zabránenia detekcie. Oproti už prebiehajúcemu Horizon Europe projektu VIGILANT, prinesie RobIndAI pokročilejšie metódy spracovania textu (predovšetkým založené na najnovších veľkých jazykových modeloch), regionálnu a obsahovo-doménovú špecifickosť metód (spolu s novým datasetom zameraným na náš región), dôraznejšie porovnanie rôznych možností detekcie (osobitný model pre každý jazyk vs. spoločný model pre všetky jazyky), ako aj robustnosť voči novým sofistikovanejším útokom.

Projekt vychádza z predpokladu, že strojovo-generovaný text pomocou AI modelov má charakteristické vzory, ktoré je možné identifikovať pomocou analytických metód a umelej inteligencie. Z hľadiska orientácie na dezinformácie, projekt predpokladá, že strojovo-generovaný text je pozitívnym indikátorom masovo šírených dezinformácií v online priestore.

RobIndAI využíva moderné metódy strojového učenia, spracovania prirodzeného jazyka a analýzu dát na riešenie problému detekcie strojovo-generovaného textu v online médiách. Kľúčovým faktorom tiež bude získavanie kvalitných trénovacích dát a rôznorodý dataset (obohatený o parafrázované texty) pre zabezpečenie účinnosti modelov v reálnom svete.

Tím projektu

Jakub Šimko

Lead and Researcher

Dominik Macko

Researcher

Jakub Kopál

Research Engineer

Michal Spiegel

Volunteer

Adam Škurla

PhD Student

Katarína Házyová

Project Administrator

Marianna Palková

Communications Specialist

Adrián Gavorník

Ethics Specialist

Samuel Budai

Research Engineer

Výsledky

V1.1 Priebežná správa o implementácii a dosiahnutých výsledkoch projektu

V2.1 Správa o výsledkoch komunikácie, diseminácie a exploitácie

V3.1 Výskumná správa o modeloch a metódach robustnej detekcie strojovo-generovaného textu

V3.2 Výskumná správa o optimalizovanej architektúre systému na detekciu strojovo-generovaného textu

Prílohy

Článok prijatý na PAN@CLEF 2025 Robustly Fine-tuned LLM for Binary and Multiclass AI-Generated Text Detection

Článok prijatý do magazínu Computer Beyond speculation Measuring the growing presence of LLM-generated texts in multilingual disinformation

Článok prijatý na EMNLP 2025 A Rigorous Evaluation of LLM Data Generation Strategies for Low-Resource Languages

Článok poslaný na AAAI 2026 Authorship Attribution in Multilingual Machine-Generated Texts

Financované EÚ NextGenerationEU prostredníctvom Plánu obnovy a odolnosti SR v rámci projektu č. 09I01-03-V04-00059.

Súvisiace publikácie

Macko, D., Moro, R., & Srba, I. (2025). Increasing the Robustness of the Fine-tuned Multilingual Machine-Generated Text Detectors. arXiv preprint arXiv:2503.15128.

Macko, D., Ramakrishnan, A. A., Lucas, J. S., Moro, R., Srba, I., Uchendu, A., & Lee, D. (2025). Beyond speculation: Measuring the growing presence of LLM-generated texts in multilingual disinformation. arXiv preprint arXiv:2503.23242.