Kategórie
Všeobecné

Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)

Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.

Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)

Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.

Účastníci sa oboznámili s viacerými inovatívnymi prístupmi, ktorých cieľom je znížiť jazykovú nerovnosť v ére umelej inteligencie:

  • Generovanie bilingválnych datasetov: Využili sme databázu odborne redigovaných slovenských kníh a model LLaMA 3.3 70B Instruct na preklad medzi slovenčinou a angličtinou, čím vznikli datasety pre trénovanie prekladových modelov a zlepšovanie strojovo preloženej slovenčiny.
  • Sumarizácia vedeckých textov: Pomocou modelu Gemini Flash Experimental a databázy PLOS sme generovali slovenské súhrny vedeckých článkov, čo prispieva k rozvoju odborného jazyka v LLM.
  • Zvýšenie kultúrneho kontextu: Pripravujeme dataset založený na slovenských zdrojoch, ktorý má zlepšiť schopnosť modelov rozumieť kultúrne špecifickým témam a reáliám.

Webinárom sprevádzal Marek Dobeš, spoluautormi projektu sú Radovan Garabík a Peter Bednár. Výskum prebieha s využitím vysokovýkonnej výpočtovej infraštruktúry – slovenského superpočítača Devana a talianskeho Leonarda, prevádzkovaného talianským superpočítačovým centrom Cineca.

Prípadová štúdia poukazuje na možnosti aplikácie týchto metodík aj pre iné jazyky s nízkym počtom zdrojov. Veríme, že skúsenosti z tohto projektu môžu inšpirovať odborníkov po celom svete.

Simulovanie spoločností: Multiagentové modely AI pre spoločenské hnutia, dynamiku presvedčení a národnú odolnosť 25 jún - Pridajte sa k nášmu inšpiratívnemu webináru a zistite, ako umelá inteligencia a multiagentové simulačné technológie pomáhajú výskumníkom pochopiť a predikovať komplexné spoločenské javy. Na podujatí vystúpia poprední odborníci na kultúrnu kybernetiku, kognitívne modelovanie a simulácie digitálnych dvojčiat v národnom meradle.
Posilňovanie väzieb v rámci EuroCC: Návšteva NCC Slovakia vo FCCN v Lisabone 24 jún - Dňa 24. júna sa zástupkyňa NCC Slovakia, Božidara Pellegrini, stretla s kolegyňami z NCC Portugal v sídle FCCN – Národnej jednotky pre vedecké výpočty pri FCT – Fundação para a Ciência e a Tecnologia, v Lisabone.
Spolupráca, ktorá má zmysel: Národné superpočítačové centrum a TUKE hľadajú spoločné prieniky 16 jún - Lucia Malíčková, projektová koordinátorka Národného superpočítačového centra (NSCC Slovakia) a Národného kompetenčného centra pre vysokovýkonné počítanie (NCC for HPC), sa stretla s doc. Mgr. Marošom Halamom, PhD., docentom Fakulty materiálov, metalurgie a recyklácie Technickej univerzity v Košiciach. Témou ich diskusie boli možnosti užšej spolupráce v oblasti výskumu, výpočtových technológií a podpory mladých výskumníkov.