Kategórie
Všeobecné

Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)

Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.

Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)

Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.

Účastníci sa oboznámili s viacerými inovatívnymi prístupmi, ktorých cieľom je znížiť jazykovú nerovnosť v ére umelej inteligencie:

  • Generovanie bilingválnych datasetov: Využili sme databázu odborne redigovaných slovenských kníh a model LLaMA 3.3 70B Instruct na preklad medzi slovenčinou a angličtinou, čím vznikli datasety pre trénovanie prekladových modelov a zlepšovanie strojovo preloženej slovenčiny.
  • Sumarizácia vedeckých textov: Pomocou modelu Gemini Flash Experimental a databázy PLOS sme generovali slovenské súhrny vedeckých článkov, čo prispieva k rozvoju odborného jazyka v LLM.
  • Zvýšenie kultúrneho kontextu: Pripravujeme dataset založený na slovenských zdrojoch, ktorý má zlepšiť schopnosť modelov rozumieť kultúrne špecifickým témam a reáliám.

Webinárom sprevádzal Marek Dobeš, spoluautormi projektu sú Radovan Garabík a Peter Bednár. Výskum prebieha s využitím vysokovýkonnej výpočtovej infraštruktúry – slovenského superpočítača Devana a talianskeho Leonarda, prevádzkovaného talianským superpočítačovým centrom Cineca.

Prípadová štúdia poukazuje na možnosti aplikácie týchto metodík aj pre iné jazyky s nízkym počtom zdrojov. Veríme, že skúsenosti z tohto projektu môžu inšpirovať odborníkov po celom svete.

All Hands Meeting v Estónsku 30 sep - V dňoch 23. – 25. septembra 2025 sa zástupkyne Národného kompetenčného centra pre HPC  Halyna Hyryavets a Lucia Malíčková zúčastnili záverečnej konferencie projektov CASTIEL2, EuroCC2, EuroCC4SEE a Centier excelentnosti (CoEs), ktorá sa konala v Tallinne v Estónsku.
MATLAB WORKSHOP: Škálovanie algoritmov a simulácií pomocou paralelných výpočtov  25 sep - Výpočtovo náročné úlohy, spracovanie veľkých objemov dát či opakované spúšťanie simulácií sú každodennou výzvou vo vede aj priemysle. Moderné prístupy umožňujú tieto procesy výrazne urýchliť využitím paralelných výpočtov a dostupného hardvéru – od viacerých CPU jadier až po GPU akceleráciu. MATLAB a Simulink ponúkajú širokú škálu možností, ako tieto zdroje efektívne využiť, a to bez potreby špecializovaných znalostí programovania GPU alebo komplexných HPC riešení.
Výpočtová sila HPC prináša nové možnosti v ochrane medveďa hnedého  23 sep - Vysokovýkonné počítanie (HPC) predstavuje kľúčovú technológiu modernej doby, ktorá zásadne mení spôsob, akým vedci, výskumníci aj firmy riešia zložité problémy. Superpočítače dokážu spracovať obrovské objemy dát a vykonať miliardy výpočtov za sekundu – úlohy, ktoré by na bežných počítačoch trvali mesiace či roky, zvládajú v priebehu hodín alebo dní.