KInIT na konferencii EMNLP v Singapure

Konferencia EMNLP (Empirical Methods in Natural Language Processing) je jednou z najprestížnejších konferencií o NLP. Naši výskumníci Róbert Móro a Ján Čegiň na tomto podujatí prezentovali 3 KInIT články.

Do hlavného bloku konferencie boli prijaté tri KInIT články

Na túto renomovanú konferenciu NLP sme zaslali tri vedecké príspevky a všetky boli prijaté. Ide o významný míľnik na našej publikačnej ceste.

1. “MULTITuDE: Large-Scale Multilingual Machine-Generated Text Detection Benchmark”  

Tento článok vznikol vďaka spolupráci medzi Penn State University, MIT Lincoln Laboratory, University of Mississippi a KInIT-om. Ide o ukážkový príklad medzinárodnej spolupráce. Článok je tiež výsledkom našej práce na projektoch VIGILANT a vera.ai. Zaoberáme sa v ňom problémom detekcie strojovo-generovaného textu v 11 jazykoch. V rámci článku sme vytvorili a zverejnili benchmarking dataset pre túto úlohu a porovnali existujúce metódy.

Príspevok prezentoval Róbert Móro, článok si môžete prečítať tu.

2. “Multilingual Previously Fact-Checked Claim Retrieval”

V tomto článku sme sa zamerali na problém vyhľadávania overených tvrdení pre rôzne jazyky. Predstavili sme unikátny súbor dát pre túto úlohu, ktorý pokrýva viac ako 30 jazykov. Zároveň sme vykonali rozsiahle porovnanie rôznych modelov na reprezentáciu tvrdení pri tejto úlohe. Tento príspevok prezentoval Róbert Móro a je výsledkom našej práce na projektoch DisAI a CEDMO

Článok je k dispozícii tu.

3. “ChatGPT to Replace Crowdsourcing of Paraphrases for Intent Classification: Higher Diversity and Comparable Model Robustness”

Posledný článok na konferencii prezentoval náš doktorand Ján Čegiň. Jedným zo spoluautorov je Peter Brusilovský z University of Pittsburgh. Príspevok je výsledkom našej práce na projektoch CEDMO a vera.ai. Skúma možnosti použitia veľkých jazykových modelov (LLM), ako je ChatGPT, pre generovanie tréningových dát pomocou parafrázovania pre úlohu „klasifikácie zámeru“. 

Článok nájdete tu.

Stretnutie s partnermi

Okrem rozhovorov a zoznámení sa s mnohými výskumníkmi z komunity NLP, bola konferencia aj príležitosťou stretnúť sa s niektorými našimi spoluautormi a projektovými partnermi. Stretnutie so spoluautormi článku MULTITuDE (Adaku Uchendu, Jason Samuel Lucas a Michiharu Yamashita z Penn State University a MIT Lincoln Laboratory)  bolo úžasné.

Zaujímavou súčasťou programu konferencie bola napr. aj prezentácia Freddyho Heppella z University of Sheffield. KInIT spolupracuje so Sheffieldskou univerzitou na projektoch  vera.ai, VIGILANT a ExU

Bolo tiež skvelé vidieť Simona Ostermanna z DFKI, s ktorým spolupracujeme na projekte DisAI.

O konferencii

Na konferenciu, ktorá sa konala 8. až 10. decembra 2023, prišlo viac ako 2 000 účastníkov. Jedným zo študentských dobrovoľníkov, ktorí pomáhali organizovať podujatie priamo na mieste, bol aj náš doktorand Ján Čegiň. Budúci ročník konferencie sa bude konať v Miami.