Pohľad za oponu medzinárodnej konferencie RecSys očami účastníka

Ako doktorand na Kempelenovom inštitúte inteligentných technológií v Bratislave (KInIT) som sa zúčastnil medzinárodnej konferencie ACM venovanej odporúčacím systémom (RecSys) v Amsterdame.

Systémy odporúčaní, ktorých hlavným účelom je odporúčať obsah na sociálnych sieťach na základe aktivity používateľov a ďalších faktorov, sú čoraz diskutovanejšou témou aj v mainstreamových médiách. Systémy odporúčania výrazne menia to, čo vidíme na sociálnych sieťach, a tým formujú našu používateľskú skúsenosť, ktorá sa premieta do možných zmien našich hodnôt, životného štýlu a rozhodnutí, ktoré robíme ako občania a ľudské bytosti.

Konferencia bola zameraná  nielen na pokroky odporúčacích systémov, napr. ako vytváranie lepších odporúčaní. V poslednej dobe sa toto zameranie posunulo smerom ku skúmaniu predpojatosti, súkromia a férovosti, ako aj skúmaniu vplyvu propagácie predsudkov alebo prehlbovanie nedôvery vo vedcov a autority na používateľov a spoločnosť ako celok.

Na konferenciu som išiel prezentovať našu štúdiu „An Audit of Misinformation Filter Bubbles on YouTube: Bubble Bursting and Recent Behavior Changes“, v ktorom sme skúmali správanie filtračných bublín na YouTube. Neskôr, keď som stál na pódiu a preberal cenu za najlepší článok, pociťoval som hrdosť a prial som si, aby tam stál celý tím. Bol to obrovský úspech, keďže konferencia je na zozname najlepšie hodnotených konferencií (najlepšie hodnotená v CORE).

V tomto článku si prečítate:

  • môj pohľad na konferenciu zvnútra, spolu s najpamätnejšími zážitkami, ktoré som si užil ako prezentujúci a študent –  dobrovoľník,
  • môj výber zaujímavých prezentácií, ako sú tri kľúčové prejavy, niekoľko článkov a prípadových štúdií,
  • informácie o organizácii a pozadí konferencie.

Pohľad zvnútra

Hlavným cieľom každej, nielen vedeckej, konferencie je účasť na prezentáciách iných zaujímavých príspevkov, a budovanie nových kontaktov a prepojení. Je to príležitosť stretnúť sa s ďalšími výskumníkmi pracujúcimi na podobných témach, diskutovať s nimi o svojej práci, získať nové nápady o práci a potenciálne pripraviť cestu pre budúcu spoluprácu. Všetci sme si užili prezentácie článkov a spoločné diskusie o nich. 

Bol som jedným z prezentujúcich, takže počas prestávok a voľna sa pri mne zastavovali iní výskumníci a pýtali sa na prezentovanú prácu a jej podrobnosti, zdieľali svoje nápady a otázky, čo bolo príjemné a zároveň inšpirujúce.

Byť študentským dobrovoľníkom mi zase  umožnilo nahliadnuť do konferenčného prostredia ešte viac zvnútra, a prinieslo ešte viac príležitostí na budovanie kontaktov. Ako dobrovoľníci sme boli pre účastníkov prvým kontaktom. Mali sme oblečené krikľavo oranžové tričká a mikiny, aby nás bolo vidno. Dokonca aj účastníci, ktorí sa možno trochu hanbili hovoriť s ostatnými, sa s nami rozprávali celkom uvoľnene a mali na to dobrý dôvod –  informovať sa. Fungovalo to aj naopak. Keďže som sám introvert, cítil som sa uvoľnenejšie pri nadväzovaní rozhovorov aj s tými, ktorých som považoval za autority. A mal som na to dobrú výhovorku – bola to jedna z našich úloh, ako dobrovoľníkov, komunikovať s ostatnými.

Byť študentským dobrovoľníkom malo pre mňa ešte jednu výhodu. Dobrovoľníci boli zvyčajne študenti doktorandského štúdia alebo mali ukončené magisterského štúdium a zvažovali pokračovať v tom doktorandskom. Jednoducho, ľudia v rovnakom alebo podobnom štádiu výskumnej kariéry ako ja. Na jednom mieste som sa stretol s viac ako 30 ľuďmi, ktorých by som možno inak nestretol. Rozhovory s nimi boli inšpiratívne, produktívne a kreatívne.

Celkovo bola účasť na konferencii na mieste cennou skúsenosťou a nadväzovanie kontaktov naživo je nenahraditeľné. Účasť na konferencii v pozícii študentského dobrovoľníka posunula moje skúsenosti na vyššiu úroveň, napĺňajúcu a plodnejšiu, a odniesol som si z nej viac, ako som si myslel.

Horúcou témou boli predpojatosť a spravodlivosť v odporúčacích systémoch

Okrem kľúčových prejavov odznelo množstvo zaujímavých prednášok. Je dosť ťažké vybrať si z množstva skvelých prác prezentovaných počas konferenčného týždňa, ale pokúsim sa teraz podeliť o niektoré z najzaujímavejších a najinšpiratívnejších so zameraním na predpojatosť, spravodlivosť a problémy dezinformácií v každodennom používaní odporúčacích systémov.

Natali Helberger: Legislatíva a umelá Inteligencia

Natali Helberger, profesorka práva a digitálnych technológií so špeciálnym zameraním na Umelú Inteligenciu na Amsterdamskej univerzite, opísala svoje kľúčové myšlienky o pripravovaných nariadeniach a legislatívnych zmenách, ako je zákon o digitálnych službách a digitálnych trhoch, zákon o riadení údajov a zákon o umelej inteligencii, ktoré v súčasnosti pripravuje/vyvíja Európska komisia.

Navrhované nariadenia sú určené na boj proti problémom filtračných bublínkomôr ozvien (angl. “echo chamber”) tak, že sa snažia primäť  platformy sociálnych médií, aby boli transparentnejšie a vysvetľovali používateľom, že niečo bolo zobrazené alebo skryté a prečo. Je to dôležitý prvý krok, ale nemusí byť dostatočný a môže prichádzať trochu neskoro – keďže používatelia nemusia chcieť nič meniť.

Cynthia Liem: Populárne alebo nie?

Cynthia Liem vo svojom príhovore poskytla multidisciplinárny pohľad na odporúčacie systémy a ich možné problémy, keďže je tiež klaviristkou, ktorá v súčasnosti pracuje na vývoji odporúčacích systémov. Priniesla inšpiratívny pohľad na odporúčania z pohľadu hudobníka, ktorý podporila prípadovou štúdiou zo svojej kariéry..

Opísala, ako sa jedna z naozaj krásnych a komplikovaných piesní, na ktorú zabudla verejnosť, ale aj hudobníci, po 10- až 15-násobnom hraní na koncertoch pomaly stávala populárnejšou a žiadanejšou.

Predpokladala, že to, čo je populárne, nemusí byť to, čo ľudia skutočne hľadajú, a možno chcú nejakú rozmanitosť. Dokonca aj väčšina klasických skladieb, ktoré dnes počúvame, a notoricky známi skladatelia, ako napríklad J. S. Bach, sa stali populárnymi a oslavovanými len nedávno, po viac ako 200 rokoch. Vnímanie toho, čo je populárne, sa v priebehu času mení. Preto je dôležité umožniť ľuďom, aby si vybrali, čo by chceli počúvať bez odporúčaní, a to zmenou spôsobu, akým odporúčania fungujú a umožnením používateľom jednoduchšie skúmanie.

Max Welling: Grafové neurónové siete

Max Welling sa vo svojej hlavnej prednáške zameral na grafové neurónové siete a ich využitie pre systémy odporúčaní. Táto  prezentácia bola zaujímavá najmä pre výskumníkov a vedcov, ktorí sa zúčastnili konferencie, takže v tomto článku nebudem zachádzať do podrobností.

Tim Donkers: Duálne komory ozvien

Filtračné bubliny a komory ozvien sú bežným problémom na platformách sociálnych médií. Stretáva sa, ale mohl sa s nimi stretnúť každý bežný používateľ. Tim Donkers prezentoval príspevok, v ktorom boli tieto echo komory študované.

Predchádzajúce štúdie o komorách ozvien dostali miernu kritiku, pretože považovali komory ozvien iba za výsledok nedostatočného pokrytia. V zásade však existujú dva typy komôr ozvien. Prvý typ je skutočne spôsobený chýbajúcim spojením s inými informáciami. Hovoríme im epistemické a sú skôr zriedkavé. Druhý je ideologický. Existuje prístup k rôznym informáciám, ale existuje aktívna diskreditácia niektorých informácií. Tieto komory ozvien sú bežnejšie a tvoria základ väčšiny konšpiračných teórií a podvodov.

Dor Lavi: Výber uchádzačov o zamestnanie pomocou umelej Inteligencie

My, ako ľudské bytosti, naozaj nie sme schopní byť dokonale objektívni vo všetkých našich rozhodnutiach. Napríklad personalisti, keď sa stretnú so životopismi napísanými v iných jazykoch, môžu si nevedome vytvoriť zaujatý názor a zaobchádzať s kandidátom inak. Okrem toho v nadnárodných spoločnostiach môžu byť popisy práce a životopisy v rôznych jazykoch a ich automatické priraďovanie môže byť zložité. Dor Lavi z Randstadu (agentúra pre personálne služby) v príspevku ukázala, že umelá inteligencia by mohla pomôcť s poskytnutím spravodlivejšieho a nezaujatejšieho prístupu, ktorý dokáže pracovať s popismi práce a životopismi v rôznych jazykoch.

V tejto práci výskumníci použili populárnu techniku nazývanú BERT, alebo presnejšie – viacjazyčný BERT, na reprezentáciu popisov práce a životopisov v strojovo zrozumiteľnom formáte a ich vzájomné priraďovanie. Výsledky boli pôsobivé, pretože ich navrhovaný prístup fungoval naozaj dobre v rôznych jazykoch a profesiách.

Využitie takýchto prístupov môže byť budúcnosťou trhu práce, a tak v ňom môže nájsť uplatnenie aj SlovakBERT, model vyvinutý spoločnosťou GERULATA  v spolupráci s KInITom. Uvidíme.

Daniel Kershaw: Spravodlivosť v odporúčaní recenzenta

Zaujatosť a neférovosť možno vidieť aj v akademickom svete. Tieto problémy boli študované a oponované v prípadovej štúdii prezentovanej v článku Daniela Kershawa z Elsevier. Výsledky ukazujú, že ženy a niektoré zraniteľné skupiny na základe pohlavia, rasy a veku, dostávajú menej uznania a majú horšie akademické metriky v dôsledku zaujatosti. Na základe výsledkov štúdie autori príspevku vyhodnotili rôzne prístupy k riešeniu tohto problému.

Aplikovaním prístupov na riešenie predsudkov, ako je zákaz používania citlivých, chránených prvkov a prvkov, ktoré s nimi vysoko korelujú, môžu poskytnúť spravodlivejšie a nezaujaté hodnotenia recenzií časopisov a môžu efektívnejšie a spravodlivejšie nájsť recenzentov.

Odporúčacie systémy kedysi a dnes

História konferencie ACM RecSys siaha do roku 2007, kedy sa konala v Minnesote v USA. Bola postavená na dedičstve výskumných workshopov a „Recommenders 06 Summer School on the Present and Future of Recommender Systems”. Počas prvého roka RecSys prilákal vedcov z 15 krajín, ktorí odprezentovali 35 dlhých a 23 krátkych príspevkov. Je zaujímavé obzrieť sa späť a porovnať, ako boli systémy odporúčaní vnímané v relatívne nedávnej minulosti. (Zdroj: htps://recsys.acm.org/recsys07/)

Od svojich začiatkov bola konferencia ACM RecSys miestom, kde sa veda stretáva s priemyslom v úzkom vzťahu. Už v roku 2007 sa odporúčacie systémy objavili ako „dôležitá súčasť riešenia problému preťaženia informáciami“ a predpokladalo sa, alebo očakávalo sa, že „poskytnú používateľom proaktívne návrhy, ktoré sú prispôsobené ich konkrétnym informačným potrebám a preferenciám“. Zdá sa prirodzené, že veľké komerčné online služby sa o ne začali čoraz viac zaujímať. (Zdroj: https://dl.acm.org/doi/proceedings/10.1145/1297231)

Úzke prepojenie priemyslu a vedy sa prejavilo aj na 15. ročníku konferencie. Takmer polovica všetkých prezentácií, až 25, pochádzala priamo o sektoru priemyslu. Hlavnými predstaviteľmi priemyslených spoločností boli AstraZeneca, Elsevier, Google, Facebook, Amazon a Netflix. Spolupráca priemyslu a univerzít bola zastúpená vo viac ako 5 prezentáciách.

V minulosti sa konferencia na rôznych miestach po celom svete, ako napríklad Lausanne, New York, Barcelona, Chicago, Dublin, Hong Kong, Silicon Valley, Viedeň, Boston, Como, Vancouver, Kodaň. V roku 2020 sa pre pandémiu Covid-19 prvýkrát uskutočnila online.

V roku 2021 bola konferencia zorganizovaná v hybridnom formáte, pričom časť konferencie sa konala fyzicky v Amsterdame s obmedzeným počtom účastníkov a časť prebiehala online s využitím platformy na streamovanie, sledovanie a komunikáciu s ostatnými účastníkmi, ktorá bola vytvorená špeciálne pre konferenciu. Fyzická časť konferencie trvala 5 dní (od pondelka do piatku), online časť trvala o niečo dlhšie (od soboty do soboty).

Celkovo bolo na konferencii viac ako 60 rečníkov, z ktorých asi polovica prezentovala na mieste a zvyšok virtuálne. Okrem rečníkov sa na nej zúčastnilo aj viac ako 20 ľudí, ktorí prezentovali svoje výsledky pomocou plagátov a ukážok.

Ako to už na konferenciách býva, počas prestávok na kávu bolo veľa príležitostí na spoznávanie ľudí a budovanie nových kontaktov. Okrem toho sa konalo viacero spoločenských podujatí pre online aj offline účastníkov, ako napríklad výlety loďou po meste, karaoke noci na ZOOMe, ranné behy a tak podobne.

Čo sa týka konferencií v nasledujúcich rokoch, nie je ľahké predpovedať, čo nám prinesie budúcnosť. Môžem však povedať, že ak by bola možnosť zúčastniť sa ďalšej konferencie naživo, určite by som do toho išiel znova.