Kategórie
Všeobecné

Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)

Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.

Záznam z podujatia: Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)

Dňa 11. júna 2025 sa uskutočnil spoločný webinár o modelovaní jazyka, ktorý zorganizovali Národné kompetenčné centrá pre HPC na Slovensku a v Taliansku. Diskusia sa sústredila na výzvy a riešenia spojené s používaním veľkých jazykových modelov (LLM) pre menej rozšírené jazyky, akým je aj slovenčina.

Účastníci sa oboznámili s viacerými inovatívnymi prístupmi, ktorých cieľom je znížiť jazykovú nerovnosť v ére umelej inteligencie:

  • Generovanie bilingválnych datasetov: Využili sme databázu odborne redigovaných slovenských kníh a model LLaMA 3.3 70B Instruct na preklad medzi slovenčinou a angličtinou, čím vznikli datasety pre trénovanie prekladových modelov a zlepšovanie strojovo preloženej slovenčiny.
  • Sumarizácia vedeckých textov: Pomocou modelu Gemini Flash Experimental a databázy PLOS sme generovali slovenské súhrny vedeckých článkov, čo prispieva k rozvoju odborného jazyka v LLM.
  • Zvýšenie kultúrneho kontextu: Pripravujeme dataset založený na slovenských zdrojoch, ktorý má zlepšiť schopnosť modelov rozumieť kultúrne špecifickým témam a reáliám.

Webinárom sprevádzal Marek Dobeš, spoluautormi projektu sú Radovan Garabík a Peter Bednár. Výskum prebieha s využitím vysokovýkonnej výpočtovej infraštruktúry – slovenského superpočítača Devana a talianskeho Leonarda, prevádzkovaného talianským superpočítačovým centrom Cineca.

Prípadová štúdia poukazuje na možnosti aplikácie týchto metodík aj pre iné jazyky s nízkym počtom zdrojov. Veríme, že skúsenosti z tohto projektu môžu inšpirovať odborníkov po celom svete.

Archeológia poháňaná umelou inteligenciou s LLM — Detekcia archeologických lokalít z leteckých snímok 30 okt - Objavte, ako umelá inteligencia a veľké jazykové modely menia spôsob, akým odhaľujeme stopy minulosti. Webinár priblíži, ako pokročilé techniky umelej inteligencie inšpirované LLM dokážu analyzovať letecké a LiDARové snímky a detegovať archeologické lokality s bezprecedentnou presnosťou. Dr. Daniel Canedo z Univerzity v Aveire predstaví praktické príklady, v ktorých Vision Transformers a multimodálne učenie odhaľujú skryté vzory v krajine a spájajú moderné technológie s kultúrnym dedičstvom.
Superpočítač pre každého: odvážte sa objaviť svet moderných výpočtov 28 okt - Kedysi boli superpočítače tajomnou technológiou, ku ktorej mali prístup iba špičkoví vedci vo futuristických laboratóriách. Dnes však začína platiť úplne nový príbeh. Superpočítač môžu využívať aj obyčajní ľudia z univerzít, menších firiem či dokonca zo štátnej správy — všetci, ktorí potrebujú zvládnuť výpočty, na aké bežný počítač jednoducho nestačí.
Webinár amália: Smerom k multimodálnemu LLM pre európsku portugalčinu 27 okt - Pridajte sa k nášmu inšpiratívnemu webináru o vývoji amália, portugalského veľkého jazykového modelu, ktorý prináša bohatstvo európskej portugalčiny do novej éry multimodálnej umelej inteligencie. Na podujatí vystúpi prof. João Magalhães z NOVA LINCS, Universidade NOVA de Lisboa, ktorý predstaví ciele, architektúru a pokrok tohto národného AI projektu. Prednáška sa zameria na to, ako amália kombinuje spracovanie textu, reči, obrazu a videa a ako prispieva k vytváraniu kultúrne ukotvených a dôveryhodných systémov umelej inteligencie pre verejný sektor, akademickú sféru a priemysel.