Kategórie
Všeobecné

Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)

Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.

Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)

Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.

Účastníci sa oboznámili s viacerými inovatívnymi prístupmi, ktorých cieľom je znížiť jazykovú nerovnosť v ére umelej inteligencie:

  • Generovanie bilingválnych datasetov: Využili sme databázu odborne redigovaných slovenských kníh a model LLaMA 3.3 70B Instruct na preklad medzi slovenčinou a angličtinou, čím vznikli datasety pre trénovanie prekladových modelov a zlepšovanie strojovo preloženej slovenčiny.
  • Sumarizácia vedeckých textov: Pomocou modelu Gemini Flash Experimental a databázy PLOS sme generovali slovenské súhrny vedeckých článkov, čo prispieva k rozvoju odborného jazyka v LLM.
  • Zvýšenie kultúrneho kontextu: Pripravujeme dataset založený na slovenských zdrojoch, ktorý má zlepšiť schopnosť modelov rozumieť kultúrne špecifickým témam a reáliám.

Webinárom sprevádzal Marek Dobeš, spoluautormi projektu sú Radovan Garabík a Peter Bednár. Výskum prebieha s využitím vysokovýkonnej výpočtovej infraštruktúry – slovenského superpočítača Devana a talianskeho Leonarda, prevádzkovaného talianským superpočítačovým centrom Cineca.

Prípadová štúdia poukazuje na možnosti aplikácie týchto metodík aj pre iné jazyky s nízkym počtom zdrojov. Veríme, že skúsenosti z tohto projektu môžu inšpirovať odborníkov po celom svete.

Ako vznikajú projekty, ktoré riešia AI v oblasti priemyslu 2025 19 nov - Umelá inteligencia sa stáva neoddeliteľnou súčasťou európskeho priemyslu aj výskumu a zásadne mení spôsob, akým vznikajú inovatívne projekty. Európska komisia preto prichádza s dvomi novými AI stratégiami – jednou zameranou na aplikovanie umelej inteligencie v kľúčových priemyselných sektoroch a druhou na vedecké využitie AI. Tieto iniciatívy prinášajú nové investičné a projektové príležitosti aj pre slovenské inštitúcie a firmy, najmä prostredníctvom programu Horizont Európa.
Online prednáška: HPC & AI – Súperenie alebo spolupráca? 7 nov - Dňa 26. novembra 2025 o 10:00 organizujeme špeciálnu online prednášku venovanú aktuálnej a rýchlo sa vyvíjajúcej téme prepojenia vysokovýkonných výpočtov (HPC) a umelej inteligencie (AI). Naším hosťom bude Erwin Laure, jedna z najvýraznejších osobností európskeho HPC ekosystému.
Success story: Budúcnosť pôdy ukrytá v dátach  5 nov - Vysokovýkonné počítanie (HPC) prináša vedcom možnosť spracovať obrovské objemy dát a objaviť súvislosti, ktoré by inak ostali skryté. Dnes už nie je len nástrojom pre technické odbory – svoj význam nachádza aj v spoločenských a environmentálnych výskumoch. Príkladom je projekt, ktorý využil silu HPC na hlbšie pochopenie vzťahu medzi človekom, pôdou a krajinou.