NCC pre HPC na INOFESTe 2024: Festival inovácií v Žiline
V dňoch 17. a 18. septembra 2024 sa v Žiline uskutočnil už piaty ročník festivalu inovácií INOFEST 2024, ktorý zorganizovalo združenie INOVATO. Podujatie sa stalo jedinečnou platformou pre stretnutie odborníkov, podnikateľov, akademikov, inovátorov, študentov, zástupcov štátnej správy a verejnosti, čím posilnilo spoluprácu v oblasti regionálnych inovačných ekosystémov na Slovensku.
Počas dvojdňového programu, ktorý zahŕňal prednášky, workshopy, diskusie a networking, sa zúčastnilo viac ako 200 účastníkov. Hlavným cieľom podujatia bolo prispieť k prepojeniu firiem a ďalších aktérov na národnej úrovni, pričom sa vytvorili nové biznisové príležitosti a inšpirácie na riešenie aktuálnych výziev v podnikateľskom a spoločenskom prostredí.
Program prvého dňa sa zameriaval na kľúčové témy ako automatizácia, robotizácia, vesmírny priemysel a udržateľné riešenia. Na konferencii vystúpili odborníci ako František Duchoň z Národného centra robotiky, ktorý rozprával o pokroku Slovenska v oblasti robotizácie, a Michaela Musilová, astrobiologička a marsonautka, ktorá predstavila možnosti, ako vesmírne technológie môžu zlepšiť život na Zemi.
Popredné miesto patrilo aj témam udržateľnosti, cirkulárnej ekonomiky a modularity, kde napríklad Stanislav Martinec z KOMA Modular hovoril o tom, ako modulárna výstavba môže prispieť k udržateľnej budúcnosti. Počas prvého dňa INOFESTU 2024 sa významná časť programu venovala téme umelej inteligencie pod názvom “Umelá inteligencia ako téma roku 2024”. Libor Bešényi zo spoločnosti XOLUTION ROBOTS sa vo svojej prezentácii zameral na zavádzanie AI do podnikov a upozornil na rozdiel medzi efektívnym a zbytočným nasadzovaním AI. Martin Jančura z ITRANSYS vysvetlil, že nie všetka AI je rovnaká a jej správne pochopenie je kľúčové pre úspech. Martin Haranta z PERBIOTIX poukázal na to, ako môže AI pomôcť aj malým firmám dosiahnuť veľké úspechy. Mária Bieliková z KInIT hovorila o potenciáli AI na transformáciu Slovenska v oblasti podnikania a verejného sektora. Blok ukončil Vladimír Šucha, zástupca Európskej komisie na Slovensku, s prezentáciou “Umelá inteligencia v akcii: Katalyzátor zmien v ekonomike a spoločnosti”. Šucha zdôraznil, že AI je nielen technologickým nástrojom, ale aj katalyzátorom zásadných zmien v ekonomike, vzdelávaní a verejných službách, ktoré môžu zásadne ovplyvniť budúcnosť Slovenska a Európy. Večer sa niesol v znamení inovácií a spoločenského programu, vrátane hudobného vystúpenia Tomáša Bezdedu a slávnostného odovzdávania inovačnej ceny.
Druhý deň festivalu bol venovaný inšpiráciám z biznisu, kde úspešní podnikatelia ako Artur Gevorkyan a Ľubomír Klieštik predstavili svoje príbehy. Beseda s Michaelou Musilovou zaujala najmä mladšiu generáciu, keďže zdieľala svoje zážitky z vedeckých misií a simulácií života na Marse.
Súčasťou programu INOFEST 2024 bol aj špeciálny workshop, na ktorom sa zúčastnilo Národné kompetenčné centrum pre vysokovýkonné počítanie (HPC). Lucia Demovičová predstavila projekt kompetenčného centra, ktoré pomáha firmám a inštitúciám využívať výkonné výpočtové kapacity na riešenie náročných úloh v oblasti výskumu a vývoja.
Michal Pitonák počas svojho vystúpenia priblížil niekoľko úspešných prípadových štúdií (success stories), na ktorých NCC spolupracovalo s rôznymi firmami. Tieto projekty ukázali, ako môže využitie superpočítačov a výpočtových klastrov zrýchliť a zefektívniť inovácie a vývoj produktov v rôznych odvetviach.
Okrem hlavného programu mali účastníci možnosť zúčastniť sa aj sprievodných podujatí, vrátane výstavy inovatívnych technológií, robotických workshopov a diskusií o budúcnosti elektromobility. Jedným z vrcholov festivalu bolo predstavenie možností financovania inovačných projektov, kde odborníci poskytli prehľad o dostupných zdrojoch, vrátane eurofondov a programu Horizont Európa.
INOFEST 2024 v Žiline opäť dokázal, že Slovensko je krajinou, kde inovácie, spolupráca a nové technológie majú svoje miesto a že takýto festival môže byť skvelou príležitosťou na budovanie vzťahov, inšpiráciu a rast v oblasti inovácií.
INOFEST 2024Halyna Hyryavets (National Competence Centre for High-performacne Computing)Lucia Demovičová (National Competence Centre for High-performacne Computing)EuroCC Slovakia Slovak National Competence Centre for High-performance ComputingMichal Pitoňák (Slovak National Competence Centre for High-performance Computing)Lucia Demovčiová and Michal Pitoňák (Inofest 2024)ŽilinaEuroCC Slovakia
Klasifikácia intentov pre bankové chatboty pomocou veľkých jazykových modelov
Tento článok hodnotí použitie veľkých jazykových modelov na klasifikáciu intentov v chatbote s preddefinovanými odpoveďami, určenom pre webové stránky bankového sektora. Zameriavame sa na efektivitu modelu SlovakBERT a porovnávame ho s použitím multilingválnych generatívnych modelov, ako sú Llama 8b instruct a Gemma 7b instruct, v ich predtrénovaných aj fine-tunovaných verziách. Výsledky naznačujú, že SlovakBERT dosahuje lepšie výsledky než ostatné modely, a to v presnosti klasifikácie ako aj v miere falošne pozitívnych predikcií.
Príchod digitálnych technológií výrazne ovplyvnil aj sektor zákazníckych služieb, pričom výrazný posun je pozorovateľný hlavne v integrácii chatbotov do zákazníckej podpory. Tento trend možno pozorovať najmä na webových stránkach firiem, kde chatboty slúžia na zodpovedanie zákazníckych otázok týkajúcich sa daného biznisu. Títo virtuálni asistenti sú kľúčoví pri poskytovaní základných informácií zákazníkom, čím znižujú množstvo pracovných úloh, ktoré by inak museli riešiť pracovníci zákazníckej podpory.
V oblasti vývoja chatbotov bolo možné v posledných rokoch pozorovať obrovský nárast využitia generatívnej umelej inteligencie na tvorbu personalizovaných odpovedí. Napriek tomuto technologickému pokroku niektoré firmy stále uprednostňujú štruktúrovaný prístup k interakciám chatbota. V tomto prípade sú odpovede vopred definované, nie generované počas interakcie. Týmto je zaručená presnosť informácií v odpovediach bota a zároveň je zabezpečené konzistentné dodržiavanie komunikačného štýlu danej firmy. Vývoj chatbotov zvyčajne zahŕňa definovanie špecifických kategórií nazývaných intenty. Každý intent predstavuje konkrétny dopyt zákazníka, čo umožňuje chatbotu poskytnúť adekvátnu odpoveď. Najväčšou výzvou tohto systému je preto presná identifikácia zákazníkovho zámeru (intentu) na základe jeho textového vstupu.
Popis problému
Tento článok je výsledkom spoločného úsilia Národného kompetenčného centra pre vysokovýkonné počítanie a spoločnosti nettle, s.r.o., ktorá je slovenským start-upom zameraným na spracovanie prirodzeného jazyka, chatboty a voiceboty. V rámci tejto spolupráce sa sústredíme na návrh jazykového klasifikátora chatbota pre online prostredie banky. Na spracovanie rozsiahlych výpočtov potrebných na vývoj tohto riešenia boli použité zdroje HPC systému Devana.
V chatbotoch spomenutých v úvode je preferovaná vopred definovaná odpoveď namiesto generovanej. Kľúčovým krokom v počiatočnej fáze vývoja takéhoto chatbota je preto identifikácia súboru intentov v danej doméne. Tento krok je zásadný pre správne fungovanie chatbota a pre poskytovanie presných odpovedí na každý konkrétny intent. Takéto chatboty bývajú vysoko sofistikované a často zahŕňajú široké spektrum intentov, niekedy až niekoľko stoviek. Vývojári vytvárajú rôzne ukážkové frázy pre každý intent, ktoré by mohli používatelia použiť pri otázkach súvisiacich s konkrétnym zámerom. Tieto frázy zohrávajú zásadnú úlohu pri definovaní jednotlivých intentov a slúžia ako trénovacie dáta pre klasifikačný algoritmus.
Náš základný model na klasifikáciu intentov, ktorý nevyužíva hlboké učenie, dosahuje presnosť 67% na reálnych testovacích dátach, podrobnejšie popísaných v ďalšej časti tohto článku. Cieľom práce je vyvinúť model založený na hlbokom učení, ktorý prekoná výkon tohto základného modelu.
Prezentujeme dva rôzne prístupy k riešeniu tejto úlohy. Prvý z nich skúma aplikáciu modelu BERT (Bidirectional Encoder Representations from Transformers), ako základ pre klasifikáciu intentov. Druhý prístup sa zameriava na využitie generatívnych veľkých jazykových modelov (LLM z angl. large language models) pomocou prompt inžinieringu na identifikáciu vhodného intentu, pričom skúmame využitie týchto modelov s fine-tuningom aj bez neho.
Dáta
Naša trénovacia dátová sada pozostáva z párov (text, intent), kde každý text predstavuje príklad dopytu adresovaného chatbotovi, ktorý vyvolá príslušný intent. Táto dátová množina je precízne skomponovaná tak, aby pokrývala celé spektrum preddefinovaných intentov, zaručujúc dostatočný objem textových príkladov pre každú kategóriu.
V našej štúdii pracujeme s rozsiahlym súborom intentov, pričom každý je doplnený o príslušné príklady dopytov. Používame dve trénovacie množiny: ”simple” množinu, ktorá obsahuje 10 až 20 príkladov pre každý intent, a ”generated” množinu, ktorá zahŕňa 20 až 500 príkladov na intent. Množina ”generated” poskytuje väčší objem dát, avšak s opakujúcimi sa frázami v rámci jednotlivých intentov.
Tieto zoskupenia dát sú pripravené na spracovanie supervizovanými klasifikačnými modelmi. Tento proces zahŕňa konverziu množiny intentov do číselného poradia a priradenie každého textového príkladu k príslušnému číslu intentu, po čom nasleduje samotné trénovanie modelu.
Okrem trénovacej sady využívame aj testovaciu dátovú sadu, ktorá obsahuje približne 300 párov (text, intent), získaných z reálnej prevádzky chatbota, čo nám poskytuje autentický obraz interakcií používateľov. Všetky texty v tejto dátovej sade sú manuálne anotované ľudskými anotátormi. Táto sada slúži na hodnotenie výkonu našich klasifikačných modelov porovnávaním predikovaných intentov so skutočnými.
Všetky spomínané dátové množiny sú vlastníctvom spoločnosti nettle, s.r.o., a preto nebudú detailnejšie diskutované.
Vyhodnotenie
V tomto článku sú modely hodnotené predovšetkým na základe ich presnosti meranej na reálnej testovacej dátovej sade obsahujúcej 300 pozorovaní. Každé z týchto pozorovaní patrí do jedného z preddefinovaných intentov, na ktorých boli modely trénované. Presnosť počítame ako pomer správne klasifikovaných vzoriek k celkovému počtu vzoriek. Pre modely, ktorých výstupom je aj pravdepodobnosť predikcie, ako napr. BERT, je vzorka považovaná za správne klasifikovanú iba vtedy, ak jej pravdepodobnosť predikcie do správnej triedy (intentu) prekročí stanovený prah.
Druhotnou metriku používanou na vyhodnotenie modelov je miera falošne pozitívnych predikcií (FPR z angl. false positive rate), kde je preferovaná čo najnižšia hodnota. Na vyhodnotenie tejto metriky používame syntetické dáta, ktoré nepatria do žiadneho intentu. Očakáva sa, že modely budú v tomto prípade produkovať nízke hodnoty pravdepodobnosti predikcie (pre model BERT), alebo klasifikovať tieto vzorky do triedy ”invalid” (pre generatívne jazykové modely).
V celom článku sa pod pojmami presnosť a FPR rozumejú metriky vypočítané týmto spôsobom.
Prístup 1: Klasifikácia intentov pomocou modelov BERT SlovakBERT
Keďže dáta sú v slovenskom jazyku, bolo nevyhnutné vybrať model, ktorý ”rozumie” slovenčine. Preto sme sa rozhodli pre model s názvom SlovakBERT [5], ktorý je prvým verejne dostupným veľkým modelom pre slovenčinu.
Na dosiahnutie najlepšieho výkonu sme vykonali viacero experimentov s optimalizáciou tohto modelu. Tieto pokusy zahŕňali ladenie hyperparametrov, rôzne techniky predspracovania textu a, hlavne, výber trénovacích dát.
Vzhľadom na existenciu dvoch trénovacích dátových množín s relevantnými intentami (”simple” a ”generated”), ako prvé boli vykonané experimenty s rôznymi pomermi vzoriek z týchto dvoch množín. Výsledky ukázali, že optimálny výkon modelu sa dosahuje pri trénovaní pomocou “generated” dátovej sady.
Po výbere dátovej množiny boli vykonané ďalšie experimenty, zamerané na výber správneho predspracovania dát. Testovali sme nasledujúce možnosti:
prevod celého textu na malé písmená,
odstránenie diakritiky z textu
odstránenie interpunkcie z textu.
Ďalej boli testované aj kombinácie týchto troch možností. Keďže použitý model SlovakBERT je citlivý na veľké a malé písmená a tiež na používanie diakritiky, všetky tieto transformácie textu ovplyvňujú celkový výkon modelu trénovaného na týchto dátach.
Zistenia z experimentov odhalili, že najlepšie výsledky sú dosiahnuté, keď je text prevedený na malé písmená a je odstránená diakritika aj interpunkcia.
Ďalším skúmaným aspektom počas experimentálnej fázy bol výber vrstiev, ktoré budú fine-tunované. Testovali sme fine-tunovanie štvrtiny, polovice, troch štvrtín a celého modelu, pričom sme skúmali aj variácie ako napríklad fine-tunovanie celého modelu niekoľko epoch a následné fine-tunovanie zvoleného počtu vrstiev až do konvergencie. Výsledky ukázali, že priemerné zlepšenie získané týmito úpravami je štatisticky nevýznamné. Keďže cieľom je vytvoriť čo najjednoduchší algoritmus, tieto zmeny neboli vo výslednom modeli realizované.
Každý experiment bol vykonaný trikrát až päťkrát na zabezpečenie spoľahlivosti výsledkov.
Najlepší model dosiahol priemernú presnosť 77.2% so smerodajnou odchýlkou 0.012.
Banking-Tailored BERT
Keďže naše dáta obsahujú terminológiu špecifickú pre bankový sektor, rozhodli sme sa využiť model BERT, ktorý bol fine-tunovaný špeciálne na dátach pre sektor bankovníctva a financií. Avšak, keďže tento model rozumie výlučne angličtine, bolo nutné trénovanie dáta preložiť.
Na preklad sme použili DeepL API[1]. Najprv sme preložili trénovaciu, validačnú a testovaciu množinu. Vzhľadom na povahu angličtiny, nebol text ďalej upravovaný (predspracovaný), ako tomu bolo v prípade použitia modelu SlovakBERT v sekcii 2.3.1. Následne sme optimalizovali model BERT pre bankovníctvo na preložených dátach.
Fine-tunovaný model dosiahol sľubné počiatočné výsledky, s presnosťou mierne prevyšujúcou 70%. Bohužiaľ, ďalšie trénovanie a ladenie hyperparametrov nepriniesli zlepšenie. Testovali sme aj ďalšie modely trénované na anglickom jazyku, no všetky priniesli podobné výsledky. Použitie anglického modelu sa ukázalo ako nedostatočné na dosiahnutie lepších výsledkov, pravdepodobne kvôli chybám v preklade. Preklad obsahoval nepresnosti spôsobené ”šumom” v dátach, hlavne v testovacej dátovej sade.
Prístup 2: Klasifikáca intentov pomocou veľkých jazykových modelov
Ako bolo uvedené v sekcii 2, okrem fine-tunovania modelu SlovakBERT a ďalších modelov založených na architektúre BERT, sme skúmali aj využitie generatívnych veľkých jazykových modelov pre klasifikáciu intentov. Zamerali sme sa na inštrukčné modely, kvôli ich schopnosti pracovať s inštrukčnými promptami a tiež schopnosti odpovedať na otázky.
Keďže neexistujú verejne dostupné inštrukčné modely trénované výhradne na slovenčinu, vybrali sme niekoľko multilingválnych modelov: Gemma 7b instruct [6] a Llama3 8b instruct [1]. Na porovnanie ukážeme aj výsledky proprierárneho modelu OpenAI gpt-3.5-turbo, používaného za rovnakých podmienok ako vyššie uvedené verejne dostupné modely.
Podobne ako v článku [4], našou stratégiou je využitie promptov s možnosťami intentov a ich popismi na vykonanie predikcie intentu v režime zero-shot. Očakávame, že výstupom bude možnosť so správnym intentom. Keďže kompletná sada intentov s ich popismi by produkovala veľmi dlhé prompty, používame náš základný model na výber troch najlepších intentov. Dáta pre tieto modely boli pripravené nasledovne:
Každý prompt obsahuje vetu (otázku od používateľa) v slovenčine, štyri možnosti intentov s popismi a inštrukciu na výber najvhodnejšej možnosti. Prvé tri možnosti intentov sú vybrané základným modelom, ktorý má hodnotu Top-3 recall metriky 87%. Posledná možnosť je vždy ”invalid” a mala by byť vybraná, keď žiadna z prvých troch možností nezodpovedá otázke používateľa, alebo ide o otázku mimo rozsahu intentov. V tomto nastavení je najvyššia možná dosiahnuteľná presnosť 87%.
Implementácia predtrénovaného LLM
Na úvod sme implementovali neoptimalizovaný predtrénovaný veľký jazykový model, čo znamená, že daný inštrukčný model bol použitý bez fine-tunovania na našich dátach.
Na zlepšenie výsledkov sme využili prompt inžiniering. Tento proces jemne preformuluje prompt, v našom prípade sme upravovali pokyny pre model, aby odpovedal napr. iba názvom intentu alebo číslom/písmenom, ktoré označuje správnu možnosť. Rovnako sme skúmali rôzne možnosti umiestnenia promptu (rola používateľa/rola systému) a experimentovali sme s rozdelením promptu, kde pokyn pre model bol umiestnený v úlohe systému a otázka spolu s možnosťami v úlohe používateľa.
Napriek týmto snahám tento prístup nepriniesol lepšie výsledky ako fine-tuning modelu SlovakBERT. Avšak, pomohol nám identifikovať najefektívnejšie formáty promptov pre fine-tuning týchto inštrukčných modelov. Tieto kroky boli zásadné pri analyzovaní správania modelov a ich vzorcov odpovedí, čo sme následne využili pri tvorbe stratégií na fine-tunovanie týchto modelov.
Optimalizácia LLM
Prompty, na ktoré predtrénované modely reagovali najlepšie, boli využité pri fine-tuningu modelov. Keďže predtrénované veľké jazykové modely nevyžadujú rozsiahle trénovacie dátové množiny, použili sme našu ”simple” dátovú množinu, podrobne opísanú v sekcii 2.1. Model bol následne fine-tunovaný tak, aby na zadané prompty odpovedal príslušnými názvami intentov.
Kvôli veľkosti vybraných modelov sme použili metódu nazývanú parameter efficient training (PEFT) [2], čo je stratégia zameraná na efektívne využívanie pamäte a znižovanie času výpočtu. PEFT trénuje len malú podmnožinu parametrov, s hodnotami zvyšných vôbec nehýbe, čím sa znižuje počet trénovateľných parametrov. Konkrétne sme použili prístup Low-Rank Adaptation (LoRA) [3].
Na dosiahnutie najlepšieho výkonu boli ladené aj hyperparametre, vrátane rýchlosti učenia, veľkosti dávky, parametra lora alpha v konfigurácii LoRA, počtu krokov akumulácie gradientu a formulácie ”chat template”.
Optimalizácia jazykových modelov si vyžaduje značné výpočtové zdroje, čo znamená potrebu využitia HPC (High Performance Computing) zdrojov na dosiahnutie požadovaného výkonu a efektivity. HPC systém Devana, ktorý je vybavený 4 GPU akcelerátormi NVidia A100 s 40 GB pamäte na každom uzle, poskytuje potrebnú výpočtovú kapacitu. V našom prípade sa oba fine-tunované modely zmestia do pamäte jedného GPU akcelerátora (v plnej veľkosti) s maximálnou veľkosťou dávky 2.
Aj keď využitie všetkých 4 GPU akcelerátorov na jednom uzle by skrátilo čas trénovania a umožnilo väčšiu veľkosť dávky, pre účely benchmarkingu a na zabezpečenie konzistentnosti a porovnateľnosti výsledkov sme vykonali všetky experimenty iba s jedným GPU akcelerátorom.
Toto úsilie viedlo k určitým zlepšeniam vo výkone modelov. Pre model Gemma 7b instruct sa podarilo znížiť počet falošne pozitívnych predikcií. Na druhej strane, pri fine-tuningu modelu Llama3 8b instruct došlo k zlepšeniu oboch metrík (presnosť a počet falošne pozitívnych predikcií). Avšak, ani jeden z týchto modelov po optimalizácii neprekročil schopnosti fine-tunovaného modelu SlovakBERT.
Čo sa týka modelu Gemma 7b instruct, niektoré množiny hyperparametrov priniesli vyššiu presnosť, ale aj vysokú hodnotu FPR, zatiaľčo ďalšie viedli k nižšej presnosti a nízkej hodnoty FPR. Hľadanie množiny hyperparametrov, ktorá by zaistila vyvážené hodnoty presnosti a FPR bolo náročné. Najlepšia konfigurácia dosiahla presnosť mierne prevyšujúcu 70% s hodnotou FPR 4.6%. Porovnaním týchto hodnôt s výkonom tohto modelu bez optimalizácie zisťujeme, že fine-tunovanie iba zľahka zvýšilo presnosť, ale dramaticky redukovalo počet falošne pozitívnych predikcií, takmer o 70%.
Pre model Llama3 8b instruct, najlepšia konfigurácia dosiahla presnosť 75.1% s hodnotou FPR 7.0%. V porovnaní s výkonom modelu bez optimalizácie prinieslo fine-tunovanie vyššiu presnosť a zároveň prispelo k významnému zníženiu hodnoty FPR, ktorá sa znížila na polovicu.
Porovnanie s proprietárnym modelom
Na porovnanie nášho prístupu s proprietárnym veľkým jazykovým modelom sme vykonali experimenty s modelom gpt-3.5-turbo od OpenAI[1]. Použili sme identické prompty na zabezpečenie spravodlivého porovnania a testovali sme ako predtrénovanú, tak aj fine-tunovanú verziu tohto modelu. Bez fine-tuningu dosiahol gpt-3.5-turbo presnosť 76%, hoci vykazoval značnú mieru falošne pozitívnych predikcií. Po fine-tuningu sa presnosť zvýšila na takmer 80% a miera falošne pozitívnych predikcií sa výrazne znížila.
Výsledky
V našej počiatočnej stratégii, ktorá zahŕňala fine-tuning modelu SlovakBERT, sme dosiahli priemernú presnosť 77.2% so štandardnou odchýlkou 0,012, čo predstavuje nárast o 10% v porovnaní s presnosťou základného modelu.
Fine-tuning modelu BERT, špeciálne trénovaný pre bankovníctvo, dosiahol presnosť tesne pod 70%. Tento výsledok prekonáva presnosť základného modelu, avšak nedosahuje výkon fine-tunovaného modelu SlovakBERT.
Následne sme experimentovali s generatívnymi jazykovými modelmi (predtrénovanými, ale nie fine-tunovanými na našich dátach). Hoci tieto modely preukázali sľubné schopnosti, ich výkon bol nižší v porovnaní s fine-tunovaným modelom SlovakBERT. Preto sme pristúpili k fine-tuningu týchto modelov, konkrétne Gemma 7b instruct a Llama3 8b instruct.
Fine-tunovaná verzia modelu Gemma 7b instruct vykazovala finálnu presnosť porovnateľnú s modelom BERT optimalizovaným pre bankovníctvo, a fine-tunovaný model Llama3 8b instruct dosiahol výkon o niečo horší než fine-tunovaný SlovakBERT. Napriek rozsiahlemu úsiliu nájsť konfiguráciu hyperparametrov, ktorá by prekonala schopnosti modelu SlovakBERT, neboli tieto pokusy úspešné. Takže model SlovakBERT je najlepším z porovnávaným modelov.
Všetky výsledky sú zobrazené v Tabuľke 1, vrátane nášho základného modelu a tiež výsledkov proprietárneho modelu od OpenAI pre porovnanie.
Tabuľka 1: Porovnanie hodnôt metrík presnosť a FPR, definovaných v časti 2.2, pre všetky analyzované modely. Hodnoty sú uvedené v percentách.
Záver
Cieľom tohto článku bolo nájsť prístup na riešenie úlohy klasifikácie intentov, ktorý využíva predtrénovaný jazykový model (fine-tunovaný ako aj pôvodný bez fine-tuningu) ako základ pre chatbot pre sektor bankovníctva. Dáta pre našu prácu pozostávali z párov textu a intentu, kde text predstavuje dopyt používateľa (zákazníka) a intent predstavuje príslušný zámer.
Experimentovali sme s viacerými modelmi, vrátane modelu SlovakBERT, BERT pre bankovníctvo a generatívnych modelov Gemma 7b instruct a Llama3 8b instruct. Po pokusoch s dátovými množinami, konfiguráciami hyperparametrov pre fine-tuning a prompt inžinieringu, sa ukázalo, že optimalizácia modelu SlovakBERT je najlepším prístupom, s finálnou presnosťou o niečo vyššou než 77%, čo predstauje nárast o 10% v porovnaní so základným modelom.
Táto štúdia zdôrazňuje efektivitu optimalizácie predtrénovaných jazykových modelov pre vývoj robustného chatbota s presnou klasifikáciou zámerov užívateľov. Tieto poznatky budú v budúcnosti využité na ďalšie zlepšenie výkonu a efektivity v reálnych bankových aplikáciách.
Výskum bol realizovaný s podporou Národného kompetenčného centra pre HPC, projektu EuroCC 2 a Národného Superpočítačového Centra na základe dohody o grante 101101903-EuroCC 2-DIGITAL-EUROHPC-JU-2022-NCC-01.
Literatúra
[1] AI@Meta. Llama 3 model card. 2024. URL: https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md.
[2] Zeyu Han, Chao Gao, Jinyang Liu, Jeff Zhang, and Sai Qian Zhang. Parameter-efficient fine-tuning for large models: A comprehensive survey, 2024. arXiv:2403.14608.
[3] Edward J. Hu, Yelong Shen, Phillip Wallis, Zeyuan Allen-Zhu, Yuanzhi Li, Shean Wang, and Weizhu Chen. Lora: Low-rank adaptation of large language models. CoRR, abs/2106.09685, 2021. URL: https://arxiv.org/abs/2106.09685, arXiv:2106.09685.
[4] Soham Parikh, Quaizar Vohra, Prashil Tumbade, and Mitul Tiwari. Exploring zero and fewshot techniques for intent classification, 2023. URL: https://arxiv.org/abs/2305.07157, arXiv:2305.07157.
[5] Matúš Pikuliak, Štefan Grivalský, Martin Konôpka, Miroslav Blšták, Martin Tamajka, Viktor Bachratý, Marián Šimko, Pavol Balážik, Michal Trnka, and Filip Uhlárik. Slovakbert: Slovak masked language model. CoRR, abs/2109.15254, 2021. URL: https://arxiv.org/abs/2109.15254, arXiv:2109.15254.
[6] Gemma Team, Thomas Mesnard, and Cassidy Hardin et al. Gemma: Open models based on gemini research and technology, 2024. arXiv:2403.08295.
Autori
Bibiána Lajčinová – Národné superpočítačové centrum Patrik Valábek – Národné superpočítačové centrum, Ústav informatizácie, automatizácie a matematiky, Slovenská technická univerzita v Bratislave, Slovenská republika Michal Spišiak – nettle, s.r.o., Bratislava, Slovenská republika
Digitálne dvojčatá spoločnosti: Simulácie poháňané výpočtami na HPC25 jún-Pridajte sa k nášmu inšpiratívnemu webináru a zistite, ako umelá inteligencia a multiagentové simulačné technológie pomáhajú výskumníkom pochopiť a predikovať komplexné spoločenské javy. Na podujatí vystúpia poprední odborníci na kultúrnu kybernetiku, kognitívne modelovanie a simulácie digitálnych dvojčiat v národnom meradle.
Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)23 jún-Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.
HPC webinár pre MSP: Príklady reálneho využitia HPC v Poľsku, Česku a na Slovensku
Dňa 4. septembra sa uskutočnil informatívny webinár, ktorý zdôraznil potenciál vysokovýkonného počítania prostredníctvom reálnych úspešných príbehov a pútavých projektov realizovaných s podporou Národných kompetenčných centier pre HPC. Okrem príkladov realizovaných v slovenskom NCC, webinár predstavil aj odborné znalosti a skúsenosti susedných kompetenčných centier v Českej republike a Poľsku.
Michal Pitoňák zdieľal skúsenosti zo štyroch úspešných prípadov použitia HPC, vrátane prenosu a optimalizácie pracovného toku CFD výpočtov v HPC prostredí, detekcie anomálií v časových radoch na prevenciu gamblingu pomocou hlbokého učenia, identifikácie entít pre extrakciu adries z transkriptovaných rozhovorov s využitím syntetických dát a merania štrukturálnych parametrov kapsúl použitím techník AI a ML. Tomáš Karásek prezentoval príklady využitia umelej inteligencie pri riešení problémov z inžinierskej praxe, zamerané na energetiku a dopravu. Szymon Mazurek predstavil iniciatívu SpeakLeash, komunitou riadený projekt na rozvoj ekosystému národných veľkých jazykových modelov (LLM) v Poľsku.
STE PODNIKATEĽ? AKO ODHALÍTE, ŽE VAŠA FIRMA JE POD KYBERNETICKÝM ÚTOKOM?
V dnešnej digitálnej ére, keď sa technológie stali základnou súčasťou podnikania, sa kybernetické útoky stávajú alarmujúcou realitou pre firmy všetkých veľkostí. S narastajúcim počtom hrozieb a sofistikovanosťou útokov je nevyhnutné, aby firmy investovali do vzdelávania zamestnancov a zabezpečenia svojich systémov.
S narastajúcim počtom digitálnych zariadení a online služieb sa zvyšuje aj riziko kybernetických útokov, ktoré môžu mať závažné následky pre jednotlivcov aj organizácie. Prevencia a včasná detekcia sú kľúčové pre ochranu citlivých údajov a zníženie rizika finančných strát. Rôzne formy hrozieb, ako sú phishing, ransomware a DDoS útoky, sú čoraz sofistikovanejšie a vyžadujú si proaktívny prístup k ochrane údajov.
NAJČASTEJŠIE KYBERNETICKÉ ÚTOKY
Kybernetické útoky sa zvyčajne odohrávajú v niekoľkých fázach. Najprv ide o prípravu a prieskum, kde útočníci zbierajú informácie o cieli. „Môže ísť o analýzu verejných profilov na sociálnych sieťach, webových stránkach firmy alebo o zistenie technických špecifikácií a systémov. Po zhromaždení potrebných informácií sa útočníci snažia získať prístup k systémom firmy. Môže to zahŕňať phishingové e-maily, ktoré obsahujú škodlivé odkazy alebo prílohy, ale aj využívanie zraniteľností v softvéri. Ak majú útočníci prístup, začínajú s krádežou údajov, inštaláciou malvéru alebo priamym útokom na servery. V prípade ransomwaru sa údaje zašifrujú a útočníci požadujú výkupné,“ vysvetľuje Ondrej Kreheľ, spoluzakladateľ Conference®, ktorá sa venuje organizovaniu konferencií o kybernetickej bezpečnosti.
DDoS útoky sú zamerané na preťaženie serverov a sietí, čím spôsobujú výpadok služieb. Môžu mať za následok stratu produktivity a finančné straty pre organizácie.
AKO ROZPOZNAŤ A ODHALIŤ KYBERNETICKÝ ÚTOK
Útočníci sú veľmi šikovní a dôslední, preto je pre firmy kľúčové mať zavedené mechanizmy na detekciu a prevenciu kybernetických hrozieb. „Zamestnanci by mali byť pravidelne školení v oblasti kybernetickej bezpečnosti, aby vedeli rozpoznať phishingové e-maily a iné podvodné techniky. Taktiež by sa mala monitorovať a analyzovať sieťová aktivita. Implementácia systémov na monitorovanie sieťovej prevádzky môže pomôcť pri identifikácii nezvyčajných aktivít, ktoré by mohli naznačovať pokus o útok. Pomôže aj pravidelné aktualizovanie a zálohovanie. Udržiavanie softvéru a systémov aktuálnych a pravidelné zálohovanie údajov sú základnými krokmi pre ochranu pred kybernetickými útokmi,“ vymenúva Ondrej Kreheľ, top odborník na kybernetickú bezpečnosť, ktorý pôsobí v New Yorku.
VYDIERANIE A VÝKUPNÉ NIE JE TABU ANI NA SLOVENSKU Krádež či zašifrovanie citlivých údajov spoločnosti a následná žiadosť o výkupné nie je nič nové ani na Slovensku. „Deje sa to aj slovenským firmám, ide aj o miliónové čiastky za obnovenie systémov a vrátenie záloh na to, aby firma mohla pokračovať ďalej. Otázkou teda nie je, či sa to niekedy udeje aj vám, ale kedy sa stanete obeťou kybernetického útoku,“ hovorí O. Kreheľ. Pripomína zároveň, že dôležité je aj vypracovanie plánu reakcie na incidenty, ktorý môže pomôcť firmám rýchlo reagovať na útoky a minimalizovať ich dopady.
KONFERENCIA PONÚKA BOHATÚ ŠKÁLU ODBORNÍKOV
Kybernetická bezpečnosť je dynamický a neustále sa vyvíjajúci proces a v prípade podnikateľov a firiem je nevyhnutné sa ňou zaoberať. Prednášky odborníkov a tréningy so špičkami z odboru ponúka Qubit Conference®, ktorá sa koná 13.-14.11.2024 vo Welness Hoteli Chopok v Jasnej.
Devana: Výzva na podávanie projektov pre štandardný prístup k HPC 3/24
Výpočtové stredisko SAV a Národné superpočítačové centrum otvarujú druhú tohtoročnú Výzvu na podávanie projektov pre štandardný prístup k HPC 3/24. Projekty je možné podávať kontinuálne, pričom počas roka sú štandardne 3 termíny uzávierky, po ktorej sa uskutoční hodnotenie dovtedy podaných žiadostí. O prístup je možné požiadať výhradne prostredníctvom používateľského portálu register.nscc.sk.
Štandardný prístup k vysokovýkonným výpočtovým prostriedkom je otvorený pre všetky oblasti vedy a výskumu a to predovšetkým pre projekty väčšieho rozsahu. Tieto projekty by mali preukázať excelentnosť v danej oblasti a jasný potenciál priniesť inovatívne riešenia súčasných spoločenských a technologických výziev. V žiadosti je potrebné demonštrovať efektívnosť a škálovateľnosť navrhovaných výpočtových postupov a metód v HPC prostredí. Potrebné dáta o výkone a parametroch zvažovaných algoritmov a aplikácií je možné získať v rámci Prístupu pre testovanie a benchmarking.
Alokácie sa udeľujú na jeden (1) rok s možnosťou požiadať o pokračovanie, ak je to potrebné. Prístup je bezplatný za predpokladu splnenia všetkých náležitostí definovaných v Podmienkach výzvy. Podané projekty vyhodnocuje po technickej stránke interný tím VS SAV a NSCC a kvalitu vedecko-výskumnej časti hodnotia vždy dvaja nezávislí externí hodnotitelia.
Dátum otvorenia výzvy: 2.9.2024 Uzávierky pre žiadosti: 1.10. 2024, 17:00 CET Termín pre notifikácie o vyhodnotení projektu: Do 2 týždňov od uzávierky. Termín začiatku čerpania pridelenej alokácie: najneskôr 15. 10. 2024
Oprávnení žiadatelia: O štandardný prístup k HPC môžu žiadať vedci a výskumníci zo slovenských verejných vysokých škôl a Slovenskej akadémie vied, ako aj z organizácií verejnej a štátnej správy a súkromných podnikov registrovaných v Slovenskej republike. Prístup je poskytovaný výhradne pre civilný a nekomerčný open-science výskum a vývoj. Záujemcovia zo súkromných spoločností musia najskôr kontaktovať Národné kompetenčné centrum pre HPC.
Dostupné systémy:HPC systém Devana, univerzálny CPU modul a akcelerovaný GPU modul
Očakávané výstupy projektov:
záverečná správa do 2 mesiacov od ukončenia projektu (bez predĺženia)
peer-review a iné publikácie v domácich a zahraničných vedeckých periodikách s uvedením poďakovania v predpísanom znení reportované prostredníctvom používateľského portálu
aktívna účasť na slovenskej HPC konferencii organizovanej koordinátorom tejto výzvy (poster, iný príspevok)
v prípade oslovenia koordinátorom tejto výzvy informácia o realizovanom projekte (interview, článok do HPC časopisu a iné)
Pozvánka na Qubit Conference® Slovakia 2024: Nezmeškajte jedinečnú príležitosť zúčastniť sa vrcholného podujatia v oblasti kybernetickej bezpečnosti
Qubit Conference® Slovakia 2024 sa blíži a s radosťou vás pozývame na toto prestížne podujatie, ktoré sa uskutoční 13. a 14. novembra 2024 v nádhernom prostredí Kongres & Wellness Hotela Chopok v Jasnej. Ide o jedinečnú príležitosť pre profesionálov z rôznych priemyselných odvetví, aby sa stretli, zdieľali svoje skúsenosti a získali najnovšie poznatky v oblasti kybernetickej bezpečnosti.
Čo na vás čaká?
Konferencia ponúka bohatý a rozmanitý program, ktorý zahŕňa viac ako 30 renomovaných rečníkov a množstvo panelových diskusií a tréningov. Prvý deň bude venovaný piatim kľúčovým panelovým diskusiám, ktoré sa zamerajú na najdôležitejšie výzvy a aktuálne témy v oblasti kybernetickej bezpečnosti:
Radosti a strasti každodennej kyberbezpečnostnej prevádzky: Ako zvládať každodenné výzvy a nepredvídané situácie v oblasti kybernetickej bezpečnosti?
Nebojte sa „GRCu“: Governance, risk a compliance – ako zabezpečiť, aby vaše organizácie spĺňali všetky regulačné požiadavky a zároveň minimalizovali riziká?
Takto sme to vyriešili: Prípadové štúdie riešenia kybernetických incidentov priamo od odborníkov.
Starostlivosť o ľudí v IT od A po Z: Ako efektívne náborovať, rozvíjať a udržať špičkových IT profesionálov?
Future threats: Pohľad na bezpečnosť oknom budúcnosti – aké nové hrozby sa objavujú a ako sa na ne pripraviť?
Prvý konferenčný deň bude zakončený networkingom, kde vás čaká príjemná komunitná atmosféra, kolegovia z brandže a možnosť nadviazať nové biznis spolupráce. Večer vyvrcholí bowlingovým turnajom, ktorý sľubuje skvelú zábavu a príležitosť na neformálne stretnutia s ostatnými účastníkmi.
Druhý deň: Intenzívne tréningy s odborníkmi
Druhý deň konferencie sa zameria na praktické tréningy, ktoré budú vedené skúsenými odborníkmi. Účastníci majú možnosť vybrať si z troch celodenných tréningov:
Riešenie incidentov pomocou open source nástrojov – Tento tréning vedený odborníkom z ESETu, Ladislavom Bačom, sa zameria na efektívne využitie open source nástrojov pri riešení kybernetických incidentov.
Code Strong – mentálna odolnosť v dobe chaosu – Zuzana Reľovská z Wellbeing vás naučí, ako rozvíjať mentálnu odolnosť v čase neustálych zmien a kybernetických hrozieb.
Zvládame cyber riziká kvantitatívne – Michal Hanus z Cyber Rangers predstaví metódy kvantitatívneho hodnotenia a zvládania kybernetických rizík.
Tieto tréningy poskytnú účastníkom hlbšie pochopenie a praktické zručnosti, ktoré môžu okamžite aplikovať vo svojej každodennej práci.
Prečo by ste mali byť súčasťou Qubit Conference® Slovakia 2024?
Qubit Conference® Slovakia 2024 nie je len o prednáškach a tréningoch. Ide o platformu, kde sa stretávajú odborníci na kybernetickú bezpečnosť z rôznych priemyselných odvetví, vrátane financií, energetiky, výroby, telekomunikácií, farmácie, kritickej infraštruktúry, IT a vládnych inštitúcií. Konferencia ponúka jedinečnú príležitosť na networking a výmenu skúseností s kolegami a špecialistami z celého regiónu.
Okrem toho, Qubit Conference® je známa tým, že sa postupne stala kľúčovým podujatím v oblasti kybernetickej bezpečnosti v strednej Európe, kde každý rok privíta viac ako 200 účastníkov. Je to miesto, kde môžete zdieľať najnovšie technológie a stratégie, ktoré formujú budúcnosť digitálnej bezpečnosti.
Registrujte sa ešte dnes!
Nezmeškajte príležitosť zúčastniť sa tejto významnej udalosti. Registrujte sa na Qubit Conference® Slovakia 2024 čo najskôr a zabezpečte si svoje miesto medzi odborníkmi na kybernetickú bezpečnosť. Viac informácií o konferencii a možnosti registrácie nájdete na oficiálnej stránke podujatia.
Tešíme sa na vašu účasť a veríme, že Qubit Conference® Slovakia 2024 vám prinesie nové poznatky, inšpirácie a cenné kontakty, ktoré vás a vašu organizáciu posunú ďalej v oblasti kybernetickej bezpečnosti.
Národné kompetenčné centrum pre vysokovýkonné počítanie (HPC) nadviazalo nové strategické partnerstvo s IT Valley Košice v rámci programu HPC Ambassador. Táto spolupráca má za cieľ posilniť technologické inovácie a rozvoj na východnom Slovensku, čím prispeje k rastu inovačného ekosystému v celej krajine.
Ciele a vízia
Spolupráca sa zameriava na podporu adopcie HPC technológií medzi členmi IT Valley Košice, vrátane firiem, akademických inštitúcií a výskumných organizácií. Týmto krokom chceme vytvoriť podmienky pre rozvoj talentov a inovatívnych firiem, ktoré budú schopné konkurovať na globálnom trhu.
IT Valley Košice sa snaží vybudovať technologicky pokrokové podnikateľské prostredie na východnom Slovensku, a toto partnerstvo výrazne prispieva k tomu, aby sa región stal centrom excelentnosti pre podnikanie, výskum a vzdelávanie.
Spolupráca v praxi
Národné kompetenčné centrum pre HPC bude poskytovať relevantné informácie, školenia a služby pre členov IT Valley Košice, zatiaľ čo IT Valley Košice bude propagovať tieto príležitosti a pomáhať identifikovať organizácie pripravené na využitie HPC technológií. Členovia tak získajú prístup k špičkovej podpore a odborným konzultáciám.
IT Valley Košice bude tiež podporovať prenos vedomostí a technológií medzi akademickým a IT sektorom, pričom sa budú organizovať vzdelávacie podujatia a workshopy zamerané na zvýšenie inovačného potenciálu regiónu. Tešíme sa na úspešnú spoluprácu s IT Valley Košice a na projekty, ktoré podporia inovačné a podnikateľské prostredie na Slovensku.
Na súčasnom rýchlo sa meniacom trhu je kľúčové, aby malé a stredné podniky (MSP) dokázali efektívne využívať nové technológie pre svoju konkurencieschopnosť. Jedným z inovatívnych riešení, ktoré môžu MSP výrazne posunúť vpred, je vysokovýkonná výpočtová technika (High-Performance Computing, HPC).
Ak vás zaujíma, ako môže HPC zlepšiť vaše podnikanie, neváhajte sa pripojiť na špeciálne online podujatie organizované Národným kompetenčným centrom pre HPC. Poduajtiebude prebiehať online 4. septembra 2024 od 14:00 do 15:30 CET. Registráciaje povinná.
Prečo by ste nemali chýbať?
Podujatie sa zameria na možnosti využitia HPC v strednej Európe a poskytne praktické informácie a príklady, ako môžu aj menšie firmy využiť túto technológiu na zlepšenie svojich podnikateľských procesov. HPC môže pomôcť zrýchliť vývoj produktov, optimalizovať výrobné procesy, zlepšiť kvalitu služieb a znížiť náklady, čo je obzvlášť dôležité pre MSP, ktoré hľadajú spôsoby, ako získať konkurenčnú výhodu.
Na čo sa môžete tešiť?
Počas podujatia budete mať možnosť vypočuť si reálne prípadové štúdie z rôznych odvetví, ktoré demonštrujú, ako HPC pomohlo malým a stredným podnikom dosiahnuť svoje ciele. Zistíte, ako strojárske firmy používajú HPC na simulácie a optimalizácie konštrukčných návrhov alebo ako farmaceutické spoločnosti využívajú túto technológiu na urýchlenie vývoja nových liekov.
Spolupráca a podpora
Ďalšou dôležitou témou bude spolupráca medzi MSP a technologickými centrami. Dozviete sa, ako môžu tieto organizácie poskytovať potrebnú infraštruktúru a odborné znalosti, ktoré MSP potrebujú na využitie HPC. Odborníci z Národných kompetenčných centier pre HPC zo strednej Európy vám tiež predstavia možnosti, ako získať prístup k moderným výpočtovým zdrojom, ktoré by inak boli finančne nedostupné.
Registrujte sa ešte dnes!
Nenechajte si ujsť túto jedinečnú príležitosť a pripojte sa k podujatiu 4. septembra 2024, ktoré prebehne online. Je to šanca zadarmo získať cenné informácie, nadviazať nové kontakty a objaviť, ako môže HPC posunúť vaše podnikanie na novú úroveň.
Registráciaje otvorená, preto neváhajte a zabezpečte si svoje miesto už dnes! Pre účastníkov podujatia máme spustenú aj súťaž!
Nechajte sa inšpirovať a zistite, ako môžete vďaka HPC získať konkurenčnú výhodu na globálnom trhu!
Využitie veľkých jazykových modelov na efektívnu analýzu náboženských textov
Analýza a štúdium textov s náboženskými témami boli historicky doménou filozofov, teológov a ďalších špecialistov v sociálnych vedách. S príchodom umelej inteligencie, konkrétne veľkých jazykových modelov, naberá výskum v tejto oblasti nové dimenzie. Tieto moderné technológie môžu byť využité na odhaľovanie skrytých nuáns v náboženských textoch, čím umožňujú hlbšie pochopenie rôznych symbolizmov a odhalenie významov, ktoré sú pre tieto texty charakteristické a môžu byť nejasné. Takéto zrýchlenie analytického procesu umožňuje výskumníkom sústrediť sa len na špecifické aspekty textu relevantné pre ich výskum.
Jednou z úloh, ktorou sa vedci v tejto oblasti zaoberajú, je štúdium diel autorov asociovaných so špecifickými náboženskými skupinami a komunitami. Porovnávaním ich textov s oficiálnymi doktrínami a učeniami ich denominácií môžu výskumníci hlbšie nahliadnuť do presvedčení, viery a uhlov pohľadu komunít, formovaných učeniami vplyvných autorov.
Štúdia sumarizuje prístup využívajúci embeddingové indexy a jazykové modely na efektívnu analýzu textov s náboženskými témami. Primárnym cieľom je vyvinúť nástroj na získavanie informácií, špeciálne navrhnutý na účinné lokalizovanie relevantných častí textu v dokumentoch. Identifikácia nesúladov medzi získanými časťami textu z diel náboženských komunít a oficiálnymi náukami daného náboženstva, z ktorého táto komunita pochádza, nie je cieľom tejto práce a je ponechaná na teológov.
Táto práca vznikla spojeným úsilím Národného superpočítačového centra a Teologickej fakulty Trnavskej univerzity. Na dosiahnutie riešenia, ktoré vyžadovalo numericky náročné spracovanie veľkého objemu dát, boli využité výpočtové zdroje HPC systému Devana.
Dáta
Texty analyzované v tejto štúdii pochádzajú z náboženskej komunity známej ako Hnutie Nazaret (bežne nazývanej aj ”Beňovci”), ktorá sa začala formovať v sedemdesiatych rokoch minulého storočia. Hnutie, o ktorom niektorí vedci hovoria, že má známky sekty, je stále aktívne aj v dnešnej dobe, avšak v redukovanej a zmenenej forme. Jeho zakladateľ, Ján Augustín Beňo (1921 – 2006), bol tajne vysväteným katolíckym kňazom v totalitnej dobe. Beňo nabádal členov hnutia k aktívnemu žitiu viery prostredníctvom každodenného čítania biblických textov a uplatňovania ich posolstva v praxi prostredníctvom konkrétnych rozhodnutí a činov. Hnutie sa rozšírilo po celom Slovensku, pričom komunity existovali takmer v každom väčšom meste. Rozšírilo sa aj do susedných krajín, ako Poľsko, Česká republika, Ukrajina a Maďarsko. V roku 2000 bolo v hnutí približne tristo manželských párov, tisíc deti a stotridsať kňazov a študentov pripravujúcich sa na kňazstvo. Hnutie malo tri hlavné ciele: radikálnu prevenciu v oblasti vzdelania, podporu kňazov, ktorí by mohli pôsobiť ako rodičovské postavy na identifikáciu a rozvoj kňazských povolaní u detí, a výrobu a distribúciu samizdatových materiálov potrebných na katechézu a evanjelizáciu.
Pre výskum bolo k dispozícii 27 dokumentov vytvorených touto komunitou. Tieto dokumenty, ktoré významne vplývali na formovanie ideológie komunity Beňovci, boli reprodukované a distribuované počas komunistického režimu vo forme samizdatov – literatúry zakázanej komunistickým režimom. Po politickom prevrate boli viaceré z týchto dokumentov vytlačené a distribuované verejnosti mimo hnutia. Väčšina z dokumentov pozostávala z textov určených pre ”ranné úvahy” — krátke meditácie nad biblickými textami. Dokumenty taktiež obsahovali zakladateľove komentáre o učeniach Katolíckej cirkvi a vybraných témach týkajúcich sa výchovy detí, spirituálneho vedenia a katechézy pre deti.
Dokumenty obsahovali niekoľko duplicít, avšak pre úlohu získavania a vyhľadávania informácií to nepredstavuje problém. Všetky dokumenty sú napísané výhradne v slovenskom jazyku.
Jeden z dokumentov bol anotovaný pre účely testovania expertom z partnerskej fakulty, ktorý sa dlhodobo venuje Hnutiu Nazaret. Anotáciami myslíme časti textu (zvyčajne odseky, prípadne vety) označené ako patriace do jednej z piatich tried, pričom tieto triedy reprezentujú päť tém:
Direktívna poslušnosť
Hierarchická výchova
Radikálnosť v prevzatí modelu života
Ľudské potreby realizované len v spoločenstve/hnutí a v rodine
Divné/čudné/silné
Každá z týchto tém je doplnená o súbor otázok (dopytov/výrazov), ktoré boli navrhnuté na testovanie riešenia získavania informácií. Cieľom týchto testovacích otázok je vyhodnotiť, koľko relevantných častí textu týkajúcich sa danej témy dokáže náš nástroj získať z anotovaného dokumentu.
Tabuľka 1
Postup riešenia
Existuje viacero metód vhodných na riešenie tejto úlohy, vrátane klasifikácie textu, modelovania témy textu, RAG (z angl. Retrieval-Augmented Generation), alebo optimalizácie predtrénovaného jazykového modelu. Avšak, požiadavkou partnerských teológov, zaoberajúci sa analýzou týchto dokumentov, bola identifikácia konkrétných častí textu relevantných k daným témam, a teda získanie ich presného znenia. Práve preto bola vybraná metóda získavania informácií (z angl. information retrieval). Tento prístup sa líši od metódy RAG, ktorá bežne obsahuje časť získavania informácií a tiež časť generovania nového textu, v tom, že sa sústredí výhradne na identifikáciu relevantných častí textu v dokumentoch a negeneruje žiadny nový text.
Metóda získavania informácií využíva jazykové modely na transformovanie komplexných dát, ako je text, do numerickej reprezentácie, ktorá zachytáva celý význam a kontext daného vstupu. Táto numerická reprezentácia, nazývaná embedding (vo zvyšku textu budeme kvôli jednoduchosti využívať už len tento termín), môže byť použitá na sémantické vyhľadávanie v dokumentoch analyzovaním pozícií a blízkosti embeddingov v multidimenzionálnom vektorovom priestore. Použitím otázok (dopytov) dokáže systém nájsť v dokumentoch relevantné časti textu meraním podobnosti medzi embeddingami otázok a embeddingami segmentovaného textu. Tento prístup nevyžaduje žiadnu optimalizáciu existujúceho jazykového modelu, takže modely môžu byť použité bez akýchkoľvek úprav a pracovaný postup zostáva pomerne jednoduchý.
Výber modelu
Keďže všetky analyzované dokumenty v rámci tejto štúdie sú v slovenskom jazyku, je potrebné, aby zvolený jazykový model ”rozumel” slovenčine, čo značne zúžilo možnosti jeho výberu. K dnešnému dňu existuje len jeden verejne dostupný model, ktorý rozumie výhradne slovenskému jazyku, a niekoľko multilingválnych modelov, ktoré rozumejú slovenčine do určitej miery. Štyri predtrénované modely boli vybrané z malého množstva dostupných možností, prvým z nich je model Slovak-BERT . Slovak-BERT je verejne dostupný model založený na architektúre transformerov. Ďalším vybraným modelom je text-embedding-3-small model. Ide o výkonný proprietárny embedding model dostupným len cez API spoločnosti OpenAI. Tretím modelom je verejne dostupný embedding model BGE M3 , ktorý je výkonným multilingválnym modelom podporujúcim viac než 100 jazykov. Posledným modelom je taktiež multilingválny model z dielne Microsoftu nazývaný E5 , ktorý je rovnako verejne dostupný.
Tieto štyri modely boli použité na získanie vektorových reprezentácií textu. Ich výkon bude detailne diskutovaný v nasledujúcich častiach reportu.
Predspracovanie dát
Prvým krokom predspracovania dát je segmentovanie textu (z angl. chunking). Hlavným dôvodom pre tento krok bolo splniť požiadavku teológov na vyhľadávanie (získavanie) krátkych častí textu. Okrem toho bolo potrebné dokumenty rozdeliť na menšie časti, aj kvôli obmedzenej dĺžke vstupu niektorých jazykových modelov. Na túto úlohu bola použitá knižnica Langchain . Poskytuje hierarchické segmentovanie textu, ktoré produkuje prekrývajúce sa bloky textu definovanej dĺžky (s definovaným prekrytím) tak, aby v nich bol zachovaný kontext. Takto boli vytvorené bloky s dĺžkami 300, 400, 500 a 700 znakov. Následne spracovanie pozostávalo z odstránenia diakritiky, úprava textu na veľké/malé písmená, podľa podmienok modelov a odstránenie vylúčených slov (z angl. stopwords). Odstraňovanie týchto slov je bežnou praxou v úlohách spracovania prirodzeného jazyka, keďže vylúčené slová nenesú žiadnu významovú informáciu. Niektoré modely môžu profitovať z odstránenia vylúčených slov na zlepšenie relevantnosti získaných blokov textu, ale iné môžu ťažiť z ponechania týchto slov, aby bol zachovaný celý kontext nevyhnutný na pochopenie textu.
Tabuľka 2
Vektorové embeddingy
Vektorové embeddingy boli vytvorené z blokov textu s použitím vybraných predtrénovaných jazykových modelov.
V prípade modelu Slovak-BERT, sme pre generovanie embeddingov použili model bez pridaných predikčných vrstiev, a následne sme ukladali iba prvý embedding, ktorý obsahuje celý význam vstupného textu. Ďalšie používané modely priamo produkujú embeddingy vo vhodnej forme, preto nebolo potrebné žiadne dodatočné spracovanie výstupov.
V nasledujúcej časti s výsledkami analyzujeme výkon všetkých vybraných embedding modelov a porovnávame ich schopnosti zachytiť kontext.
Výsledky
Pred uskutočnením kvantitatívnych testov prešli všetky embeddingové indexy predbežným hodnotením, aby sa zistila úroveň porozumenia slovenského jazyka a špecifickej náboženskej terminológie evaluovaných modelov. Predbežné hodnotenie zahŕňalo subjektívne posúdenie relevantnosti získaných častí textu.
Tieto testy odhalili, že embeddingy získané pomocou modelu E5 nie sú dostatočne efektívne pre naše dáta. Keď sme pomocou testovacej otázky hľadali informácie v dokumentoch, väčšina získaných blokov textu obsahovala kľúčové slová použité v otázke, ale neobsahovala kontext otázky. Možným vysvetlením by mohlo byť, že tento model uprednostňuje zhody na úrovni slov pred zhodami kontextu v slovenskom jazyku. Ďalším dôvodom môže byť aj to, že tento model bol natrénovaný na dátach, ktoré neobsahovali veľké množstvo textu v slovenčine, resp. výber textov nebol dostatočne rozmanitý, čo môže viesť k nižšiemu výkonu modelu E5 v slovenčine, aj keď v iných jazykoch dosahuje výborné výsledky. Podotýkame, že tieto pozorovania nie sú definitívne závery, ale skôr hypotézy založené na súčasných, obmedzených výsledkoch. Rozhodli sme sa ďalej nevyhodnocovať výkon embeddingových indexov získaných z E5 modelu, keďže je to irelevantné vzhľadom na neschopnosť modelu zachytiť nuansy náboženského textu. Na druhej strane, schopnosti modelu Slovak-BERT, ktorý je založený na architektúre RoBERTa charakteristickej jej relatívne jednoduchou topológiou, prekonali očakávania. Navyše, výkon text-embedding-3-small a BGE M3 embeddingov splnil očakávania, keďže prvý, subjektívne vyhodnotený, test ukázal veľmi dobré porozumenie kontextu a nuáns v textoch s náboženskými témami a taktiež výborné porozumenie slovenského jazyka.
Preto boli kvantitatívne testy vykonané len pre vektorové databázy využívajúce Slovak-BERT, OpenAI text-embedding-3-small a BGE M3 embeddingy.
Vzhľadom na povahu riešeného problému a charakter testovacích anotácií existuje potenciálna obava týkajúca sa ich kvality. Niektoré časti textu mohli byť nesprávne klasifikované, pretože môžu patriť do viacerých tried. Táto skutočnosť, spolu s možnosťou ľudskej chyby, mohla ovplyvniť konzistentnosť a presnosť anotácií.
Berúc do úvahy túto skutočnosť, sme sa rozhodli zamerať výhradne na vyhodnotenie metriky zvanej recall. Hodnotu tejto metriky meriame ako pomer počtu získaných blokov zhodných s anotáciami, k celkovému počtu anotovaných blokov textu (bez ohľadu na podiel falošne pozitívnych blokov). Recall vyhodnocujeme pre každú tému a pre všetky vektorové databázy s rôznymi dĺžkami blokov textu.
Komplexnosť a interpretačná povaha náboženských štúdií sa pravdepodobne prejavuje nielen v kvalite testovacích anotácií, ale aj v samotných testovacích otázkach. Ako príklad môžeme uviesť testovaciu otázku ”Božia vôľa” pre tému Direktívna poslušnosť. Hoci pozorný čitateľ rozumie, ako táto otázka súvisí s danou témou, nemusí to byť očividné pre jazykový model. Preto, okrem vyhodnotenia pomocou dodaných testovacích otázok budeme vyhodnocovať výkon embeddingov aj s použitím ďalších otázok, ktoré boli získané metódou kontextovej augmentácie. Kontextová augmentácia je technika v prompt inžinieringu používaná na zlepšenie kvality textových dát a je dokumentovaná vo viacerých vedeckých článkoch , . Táto technika spočíva v tom, že sa zvolený jazykový model použije na vytvorenie novej otázky (príp. nového textu) na základe pôvodnej otázky (textu) a doplneného kontextu s cieľom formulovania lepšej otázky. Jazykový model použitý na generovanie nových otázok pomocou tejto techniky bol GPT 3.5 a tieto otázky budeme ďalej v texte označovať ako ”GPT otázky”.
Slovak-BERT embeddingové indexy
Vyhodnotenie metriky recall pre embeddingové indexy využívajúce Slovak-BERT embeddingy pre štyri rôzne veľkosti blokov textu s použitím a bez použitia metódy odstraňovania vylúčených slov je zobrazené na Obrázku 1. Toto vyhodnotenie zahŕňa každú z piatich tém špecifikovaných v Časti 2 a pokrýva pôvodné aj GPT otázky.
Je očividné, že GPT otázky produkujú vo všeobecnosti lepšie výsledky než pôvodné otázky, okrem prípadu posledných dvoch tém, pri ktorých obe sady otázok produkujú podobné výsledky. Je tiež zrejmé, že Slovak-BERT embeddingy vo väčšine prípadov profitujú z odstránenia vylúčených slov. Najvyššia hodnota recall bola dosiahnutá pre tému Radikálnosť v prevzatí modelu života, s veľkosťou blokov textu 700 znakov, s odstránenými vylúčenými slovami, dosahujúc viac než 47%. Na druhej strane, najhoršie výsledky boli získané pre tému Divné/čudné/silné, kde ani jedna sada otázok nedokázala úspešne získať relevantné častí textu z dokumentov. Dokonca, v niektorých prípadoch neboli získane absolútne žiadne relevantné bloky textov.
Hodnoty recall pre všetky témy vyhodnotené pomocou pôvodných aj GPT otázok (pre všetky skúmané veľkosti blokov textu) pre embeddingy generované modelom Slovak-BERT. Indexy embeddingov označené ako +SW obsahujú vylúčené slová, zatiaľ čo -NoSW znamená, že vylúčené slová boli odstránené.
Obrázok 1: Hodnoty recall pre všetky témy vyhodnotené pomocou pôvodných aj GPT otázok (pre všetky skúmané veľkosti blokov textu) pre embeddingy generované modelom Slovak-BERT. Indexy embeddingov označené ako +SW obsahujú vylúčené slová, zatiaľ čo -NoSW znamená, že vylúčené slová boli odstránené.
OpenAI text-embedding-3-small embeddingové indexy
Analogicky k vyhodnoteniu Slovak-BERT embeddingových indexov, grafy s výsledkami pre embeddingy získané modelom text-embedding-3-small sú zobrazené na Obrázku 2. Hodnoty metriky recall sú všeobecne vyššie než tie získané so Slovak-BERT embeddingami. Podobne ako v predchádzajúcom prípade, GPT otázky produkujú lepšie výsledky. Pozorovateľný je taktiež istý trend medzi hodnotou metriky recall a veľkosťou textových blokov — dlhšie bloky textu zvyčajne vykazujú vyššie hodnoty recall.
Zaujímavé zistenie sa týka témy Radikálnosť v prevzatí modelu života. S použitím pôvodných otázok sme nezískali takmer žiadne relevantné výsledky. Naopak, pri použití otázok generovaných pomocou GPT modelu, boli hodnoty recall metriky výrazne vyššie a dosahovali takmer 90% pre bloky textu s veľkosťou 700 znakov.
Čo sa týka odstraňovania vyradených slov, vplyv tejto techniky na embeddingy sa líši. Pre témy 4 a 5 sa ukazuje, že odstránenie vyradených slov je prospešné. Avšak, pre ostatné témy tento krok výhody neprináša.
Témy 4 a 5 vykazovali najslabšie výsledky medzi všetkými témami. Môže to byť spôsobené povahou otázok pre tieto dve témy, keďže sú to citáty a celé vety, na rozdiel od otázok pre ostatné témy, ktoré sú frázy, kľúčové slová alebo výrazy. Zdá sa, že model text-embedding-3-small funguje lepšie s frázovitým typom otázok. Ale na druhej strane, keďže otázky pre témy 4 a 5 sú celé vety, zdá sa embeddingy profitujú z odstránenia vyradených slov, keďže v tomto prípade to môže pomôcť pri zachytení kontextu v dlhých otázkach.
Téma 4 je veľmi špecifická a preto možno vyžaduje detailnejšie testovacie otázky, keďže poskytnuté otázky pravdepodobne neobsahujú všetky nuansy danej témy. Naopak, téma 5 je veľmi všeobecná, vďaka čomu je celkom pochopiteľné, prečo je zachytávanie kontextu tejto témy pomocou embeddingov náročné. Všeobecný charakter tejto témy by mohol profitovať z iného analytického prístupu. Napríklad metóda analýzy sentimentu by mohla zachytiť zvláštnu, čudnú a silnú náladu vo vzťahu k študovaným náboženským témam.
Obrázok 2: Hodnoty recall vyhodnotené pre všetky témy pomocou pôvodných aj GPT otázok, pre všetky embeddingové indexy generované modelom text-embedding-3-small. Embeddingové indexy označené +SW obsahujú vylúčené slová, zatiaľ čo indexy označené -NoSW majú vylúčené slová odstránené.
BGE M3 embeddingové indexy
Grafy s vyhodnotenou metrikou recall pre embeddingové indexy využívajúce BGE M3 embeddingy sú zobrazené na Obrázku 3. Tieto hodnoty ukazujú výkon spadajúci medzi Slovak-BERT a OpenAI text-embedding-3-small embeddingy. V niektorých prípadoch sa nepodarilo dosiahnuť také vysoké hodnoty metriky recall ako pri OpenAI embeddingoch, avšak BGE M3 embeddingy stále vykazujú konkurencieschopný výkon, hlavne ak prihliadneme na skutočnosť, že sa jedná o verejne dostupný model, na rozdiel od OpenAI embeddingového modelu, ku ktorému sa dá pristupovať len cez API, čo môže byť niekedy problémom kvôli zdieľaniu súkromných alebo citlivých dát a taktiež kvôli finančným nákladom.
S týmito embeddingami môžeme pozorovať rovnaký fenomén ako s text-embedding-3-small embeddingami: krátke, frázovité otázky sú preferované pred dlhšími otázkami podávanými formou viet a citátov. Preto sú hodnoty recall pre prvé tri témy vyššie, ako sme diskutovali už v predchádzajúcej časti.
Odstránenie vylúčených slov sa zdá byť užitočné, hlavne pre posledné dve témy.
Obrázok 3: Hodnoty metriky recall pre všetky témy získané s použitím pôvodných aj GPT otázok pre embeddingy vytovrené modelom BGE M3. Značky +SW označujú indexy obsahujúce vylúčené slová, zatiaľčo -NoSW indikuje, že vylúčené slová boli v daných indexoch odstránené.
Záver
Štúdia prezentuje prístup pre analýzu textov s náboženskými témami pomocou numerických reprezentácií textu zvaných embeddingy, generovanými troma vybranými predtrénovanými jazykovými modelmi: Slovak-BERT, OpenAI text-embedding-3-small a BGE M3 model. Výberu modelov predchádzalo posúdenie ich schopnosti ”rozumieť slovenčine” a náboženskej terminológii. Pre zvolené tri modely sme konštatovali dostatočnú schopnosť, čo ich predurčilo ako vhodných kandidátov na zvládnutie úlohy získavania informácií z danej sady dokumentov.
Výzvy týkajúce sa kvality testovacích otázok boli adresované pomocou techniky kontextovej augmentácie. Tento prístup pomohol pri formulovaní vhodnejších otázok, čo viedlo k získavaniu relevantnejších častí textu, ktoré zachytávali všetky nuansy tém, ktoré teológovia v texte hľadajú.
Výsledky demonštrujú, že efektívnosť embeddingov generovaných týmito modelmi, hlavne modelom text-embedding-3-small od OpenAI, je dostatočná na hlboké porozumenie kontextu, aj v slovenskom jazyku. Hodnoty metriky recall pre embeddingy tohto modelu sa líšia v závislosti od témy a použitých testovacích otázok, pričom najlepšia hodnota bola dosiahnutá pre tému Radikálnosť v prevzatí modelu života dosahujúc takmer 90%, s použitím GPT otázok a dĺžky textových blokov 700 znakov. Vo všeobecnosti, text-embedding-3-small model mal najlepšie výsledky s najväčšou analyzovanou dĺžkou blokov textu, vykazujúc mierny trend zvyšujúcej sa hodnoty recall so zväčšujúcou sa dĺžkou blokov textu. Téma Divné/čudné/silné mala najnižšiu hodnotu recall, čo môže byť dôsledkom neurčitosti v špecifikácii tejto témy.
Pre Slovak-BERT embeddingové indexy sú hodnoty recall o niečo nižšie, ale stále pomerne pôsobivé vzhľadom na jednoduchosť tohto jazykového modelu. Lepšie výsledky boli získané v použitím GPT otázok, s najlepšou hodnotou 47,1% pre tému Radikálnosť v prevzatí modelu života s dĺžkou blokov 700 znakov, a s embeddingami vytvorenými z textu s odstránenými vylúčenými slovami. Celkovo, tento model najviac ťažil z odstraňovania vylúčených slov.
Čo sa týka BGE M3 embeddingov, výsledky boli taktiež veľmi dobré, dosahujúc vysokú hodnotu recall metriky, aj keď nie až takú vysokú ako v prípade OpenAI embeddingov. Ale vzhľadom na to, že BGE M3 je verejne dostupný model, sú tieto výsledky pozoruhodné.
Tieto zistenia zdôrazňujú potenciál využitia veľkých jazykových modelov pre špecializované oblasti ako analýza textu s náboženskými témami. Výskum by sa ďalej mohol zaoberať zhlukovaním embeddingov za účelom odhalenia asociácií a inšpirácií autorov týchto diel. Pre teológov, budúca práca spočíva v analýze získaných častí textu s cieľom identifikovať odchýlky od oficiálneho učenia Katolíckej cirkvi, čím sa objasnia interpretácie a pohľady hnutia.
Poďakovanie
Výskum bol realizovaný s podporou Národného kompetenčného centra pre HPC, projektu EuroCC 2 a Národného Superpočítačového Centra na základe dohody o grante 101101903-EuroCC 2-DIGITAL-EUROHPC-JU-2022-NCC-01.
Výskum bol realizovaný s využitím výpočtovej infraštruktúry obstaranej v projekte Národné kompetenčné centrum pre vysokovýkonné počítanie (kód projektu: 311070AKF2) financovaného z Európskeho fondu regionálneho rozvoja, Štrukturálnych fondov EU Informatizácia spoločnosti, operačného programu Integrovaná infraštruktúra 2014-2020.
Bibiána Lajčinová – Národné superpočítačové centrum Jozef Žuffa – Teologická fakulta Trnavskej univerzity v Trnave Milan Urbančok – Teologická fakulta Trnavskej univerzity v Trnave
Literatúra
[1] Matúš Pikuliak, Štefan Grivalský, Martin Konôpka, Miroslav Blšťák, Martin Tamajka, Viktor Bachratý, Marián Šimko, Pavol Balážik, Michal Trnka, and Filip Uhlárik. Slovakbert: Slovak masked language model, 2021.
[2] Jianlv Chen, Shitao Xiao, Peitian Zhang, Kun Luo, Defu Lian, and Zheng Liu. Bge m3-embedding: Multi-lingual, multi-functionality, multi-granularity text embeddings through self-knowledge distillation, 2024.
[3] Liang Wang, Nan Yang, Xiaolong Huang, Linjun Yang, Rangan Majumder, and Furu Wei. Multi-lingual e5 text embeddings: A technical report, 2024.
Digitálne dvojčatá spoločnosti: Simulácie poháňané výpočtami na HPC25 jún-Pridajte sa k nášmu inšpiratívnemu webináru a zistite, ako umelá inteligencia a multiagentové simulačné technológie pomáhajú výskumníkom pochopiť a predikovať komplexné spoločenské javy. Na podujatí vystúpia poprední odborníci na kultúrnu kybernetiku, kognitívne modelovanie a simulácie digitálnych dvojčiat v národnom meradle.
Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)23 jún-Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.
Festival vedy Starmus, známy svojou kombináciou vedeckých prednášok, hudby a umenia, sa tento rok konal v máji v Bratislave. Tento jedinečný festival prilákal množstvo nadšencov vedy, ktorí sa mohli tešiť na inšpiratívne prezentácie a diskusie s poprednými vedcami z celého sveta.
Festival nebol len o pasívnom sledovaní prednášok. Účastníci mali možnosť priamo sa zapojiť do rôznych vedeckých demonštrácií a interaktívnych aktivít, ktoré poskytovali praktické ukážky vedeckých princípov. Stánky s demonštráciami boli obľúbeným miestom, kde si návštevníci mohli vyskúšať rôzne experimenty a technológie.
V rámci diskusných panelov sa odborníci venovali aj etickým otázkam a spoločenskému dopadu nových technológií. Tieto diskusie priniesli hlbšie pochopenie výziev, ktorým čelíme v súvislosti s rýchlym technologickým pokrokom. Jednou z najzaujímavejších prednášok festivalu bola prednáška Neila Lawrencea s názvom “What makes us unique in the age of AI.” Neil Lawrence, renomovaný vedec v oblasti umelej inteligencie, sa venoval širokému spektru tém, ktoré sa týkajú našej jedinečnosti v ére rýchleho rozvoja AI. Diskutoval o tom, ako môžeme zachovať ľudské hodnoty a schopnosti v čase, keď umelá inteligencia stále viac preniká do našich životov. Prednáška bola inšpiratívna a poskytla hlboký pohľad na budúcnosť interakcie medzi ľuďmi a technológiami.
Neil Lawrence hovoril o význame interdisciplinárneho prístupu vo vede a technologickom pokroku. Jeho prezentácia zdôraznila, ako dôležitá je spolupráca medzi rôznymi odbormi na dosiahnutie významných vedeckých objavov. Poukázal na to, že kombinácia rôznych vedeckých disciplín môže viesť k novým a prevratným poznatkom.
Ďalšia časť prednášky sa zamerala na najnovšie objavy vo vesmíre. Lawrence použil vizualizácie a animácie, aby vysvetlil zložité koncepty jednoduchým spôsobom, čím oslovil aj laickú verejnosť. V rámci prednášky sa venoval aj histórii vesmírneho výskumu. Ilustroval svoje body množstvom historických fotografií a videí, čo dodalo jeho prezentácii autentický a informatívny charakter. Ďalšou významnou témou boli prelomy v oblasti genetiky a biotechnológií. Lawrence vysvetlil, ako tieto nové technológie majú potenciál prispieť k liečbe doteraz neliečiteľných chorôb a zlepšiť kvalitu života mnohých ľudí. V diskusiách o umelej inteligencii zdôrazňoval jej schopnosť zmeniť rôzne odvetvia, vrátane medicíny, dopravy a vzdelávania. Kládol dôraz na dôležitosť etiky a zodpovednosti pri vývoji a implementácii AI technológií.
Ďalším dôležitým bodom prednášky bolo rozprávanie o pokrokoch v oblasti obnoviteľných zdrojov energie a udržateľnosti. Zdôraznil, ako dôležité sú investície do solárnej a veternej energie a inovatívnych technológií, ktoré môžu prispieť k zníženiu uhlíkovej stopy. Diskusia sa zameriavala aj na globálne iniciatívy a spoluprácu medzi rôznymi krajinami na riešení klimatických zmien. Lawrence sa tiež zameral na najnovšie technológie v oblasti medicíny, najmä AI, a vysvetlil, ako umelá inteligencia pomáha lekárom rýchlejšie a presnejšie diagnostikovať choroby. Hovoril aj o tom, ako nové technológie umožňujú personalizovanú medicínu, ktorá je šitá na mieru jednotlivým pacientom.
Ďalšou témou bola kvantová technológia v počítačoch a komunikácii. Zdôraznil, ako kvantové počítače môžu revolučne zmeniť rôzne odvetvia, vrátane medicíny a financií, tým, že umožnia rýchlejšie a efektívnejšie spracovanie informácií. Diskutoval tiež o významnosti oceánov pre našu planétu a nutnosti ich ochrany. Upozornil na hrozby ako znečistenie a klimatické zmeny, ktoré ohrozujú morský ekosystém, a zdôraznil potrebu medzinárodnej spolupráce pri ochrane oceánov.
Nakoniec sa venoval problematike vesmírneho odpadu a jeho vplyvu na budúce vesmírne misie. Diskutoval o technológiách a stratégiách, ktoré sa vyvíjajú na riešenie problému rastúceho množstva odpadu na obežnej dráhe. Posledná časť prednášky sa zamerala na výzvy a prínosy prepojenia neurovedy a umelej inteligencie. Diskutoval o tom, ako AI môže pomôcť pochopiť a liečiť neurologické poruchy a ako štúdium mozgu môže prispieť k rozvoju inteligentnejších systémov AI.
Lawrence tiež hovoril o ekologických inováciách a ich potenciáli zmeniť spôsob, akým žijeme a pracujeme. Diskutoval o tom, ako nové technológie môžu prispieť k udržateľnému rozvoju a zníženiu negatívneho vplyvu na životné prostredie. Venoval sa aj téme rozvoja vesmírnych technológií a ich potenciálu zlepšiť život na Zemi. Hovoril o tom, ako výskum vesmíru prispieva k pokroku v oblastiach ako sú materiálové vedy, energetika a komunikácie.
Posledná diskusia sa zamerala na dôležitosť vzdelávania v oblasti vedy a technológie pre budúce generácie. Lawrence zdôraznil potrebu investícií do vzdelávacích programov, ktoré podporujú kritické myslenie a inovatívne riešenia globálnych problémov. Hovoril aj o technológii virtuálnej reality (VR) a jej aplikáciách vo vzdelávaní a zdravotnej starostlivosti. Vysvetlil, ako VR môže zlepšiť učenie tým, že poskytuje imerzívne a interaktívne prostredie, a ako môže pomôcť pacientom pri rehabilitácii a terapii.
Najnovšie informácie zdôrazňovali dôležitosť interdisciplinárneho výskumu a spolupráce medzi rôznymi vedeckými odbormi. Lawrence vysvetlil, ako kombinácia rôznych odborností môže viesť k inovatívnym riešeniam komplexných globálnych problémov, ako sú klimatické zmeny a zdravotné krízy (pandémie).
Vedecké a umelecké projekty
Festival tiež priniesol diskusiu o budúcnosti umenia a vedy. Spolupráca medzi umelcami a vedcami bola prezentovaná prostredníctvom rôznych multimediálnych projektov, ktoré ukázali, ako tieto dva svety môžu spoločne tvoriť inovatívne a inšpiratívne diela.
Starmus festival je nielen oslavou vedy, ale aj platformou na zdieľanie poznatkov a inšpirácie. Tento ročník v Bratislave opäť ukázal, aký dôležitý je dialóg medzi vedou a verejnosťou. Umožnil vedcom, umelcom a širokej verejnosti stretnúť sa, diskutovať a spoločne hľadať riešenia na aktuálne globálne výzvy. Už teraz sa tešíme na ďalšie ročníky a nové objavy, ktoré nám prinesú.
O festivale Starmus
Starmus je festival vedy, umenia a hudby, ktorý vytvorili Garik Israelian, PhD., astrofyzik z Inštitútu astrofyziky Kanárskych ostrovov (IAC), a sir Brian May, PhD., astrofyzik a hlavný gitarista ikonickej rockovej skupiny Queen. Pozostáva z prezentácií astronautov, kozmonautov, nositeľov Nobelovej ceny, mysliteľov a významných osobností z rôznych vedných odborov a hudobných oblastí. Starmus spája týchto výnimočných ľudí, aby sa podelili o svoje znalosti i skúsenosti a aby spoločne hľadali odpovede na veľké otázky ľudstva.
Medaila Stephena Hawkinga za vedeckú komunikáciu
V roku 2015 vytvorili Stephen Hawking a Alexej Leonov spolu s Brianom Mayom Medailu Stephena Hawkinga za vedeckú komunikáciu, ktorá sa udeľuje jednotlivcom a tímom za významný prínos vo vedeckej komunikácii. Medzi predchádzajúcich držiteľov Medaily Stephena Hawkinga patria Dr. Jane Goodallová, Elon Musk, Neil deGrasse Tyson, Brian Eno, Hans Zimmer či dokument Apollo 11.
Tento ročník Starmus festivalu priniesol množstvo nových poznatkov a inšpirácií, ktoré budú ešte dlho rezonovať medzi účastníkmi a širokou verejnosťou. Festival opäť potvrdil svoju dôležitú úlohu v podpore vedy, umenia a vzdelávania na celom svete.
Neil Lawrence StarmusStarmus festivalStarmus BratislavaStarmus SlovakiaFestival StarmusStarmus 2024Starmus BratislavaStarmus Slovakia