Kategórie
Všeobecné

Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)

Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.

Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)

Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.

Účastníci sa oboznámili s viacerými inovatívnymi prístupmi, ktorých cieľom je znížiť jazykovú nerovnosť v ére umelej inteligencie:

  • Generovanie bilingválnych datasetov: Využili sme databázu odborne redigovaných slovenských kníh a model LLaMA 3.3 70B Instruct na preklad medzi slovenčinou a angličtinou, čím vznikli datasety pre trénovanie prekladových modelov a zlepšovanie strojovo preloženej slovenčiny.
  • Sumarizácia vedeckých textov: Pomocou modelu Gemini Flash Experimental a databázy PLOS sme generovali slovenské súhrny vedeckých článkov, čo prispieva k rozvoju odborného jazyka v LLM.
  • Zvýšenie kultúrneho kontextu: Pripravujeme dataset založený na slovenských zdrojoch, ktorý má zlepšiť schopnosť modelov rozumieť kultúrne špecifickým témam a reáliám.

Webinárom sprevádzal Marek Dobeš, spoluautormi projektu sú Radovan Garabík a Peter Bednár. Výskum prebieha s využitím vysokovýkonnej výpočtovej infraštruktúry – slovenského superpočítača Devana a talianskeho Leonarda, prevádzkovaného talianským superpočítačovým centrom Cineca.

Prípadová štúdia poukazuje na možnosti aplikácie týchto metodík aj pre iné jazyky s nízkym počtom zdrojov. Veríme, že skúsenosti z tohto projektu môžu inšpirovať odborníkov po celom svete.

Výzva na Business Experiments – podpora pre MSP pri implementácii HPC riešení 28 júl - Dávame do pozornosti druhú otvorenú výzvu v rámci projektu FFplus, ktorá sa zameriava na podporu malých a stredných podnikov (MSP) pri riešení konkrétnych obchodných výziev prostredníctvom vysokovýkonných výpočtov (High Performance Computing – HPC). Cieľom výzvy je realizovať tzv. „business experiments“, ktoré majú demonštrovať, že využitie HPC technológií vedie k riešeniu reálnych problémov a má pozitívny vplyv na podnikanie.
Keď sa technológia stretne s inklúziou: Vízia pre spravodlivú spoločnosť 25 júl - V uplynulých dňoch sa uskutočnilo inšpiratívne stretnutie medzi Luciou Maličkovou, projektovou manažérkou v Národnom superpočítačovom centre a Národnom kompetenčnom centre pre vysokovýkonné počítanie (HPC), a Jánom Bihari, vizionárom, zakladateľom Tibi Digital a myšlienkovým lídrom v oblasti digitalizácie rómskej komunity.
Záznam z webinára: Simulovanie spoločností pomocou AI a digitálnych dvojčiat 23 júl - Nestihli ste náš webinár „Digitálne dvojčatá spoločnosti: Simulácie poháňané výpočtami na HPC“? Záznam je už dostupný online. Webinár priniesol inšpiratívne pohľady na to, ako umelá inteligencia, kognitívne modelovanie a multiagentové simulačné technológie pomáhajú vedcom porozumieť a predikovať komplexné spoločenské javy, ako sú šírenie dezinformácií, radikalizácia či spoločenská súdržnosť.