SÉRIA
Vysokovýkonné počítanie
Záznamy z našich prednášok si môžete pozrieť na YouTube.
Ak by ste mali záujem o konkrétnu tému alebo chceli prezentovať váš výskum, dajte nám vedieť!
![]() |
11 Jún |
Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)
Marek Dobeš Registrácia V projekte sa snažíme prekonať jazykovú bariéru slovenčiny pomocou stratégií využiteľných aj pre iné jazyky s nízkym počtom zdrojov. Generujeme bilingválne dáta využitím slovenských kníh a modelu LLaMA 3.3 70B Instruct, čím vytvárame datasety na preklad a zlepšenie strojovej slovenčiny. S pomocou Gemini Flash a databázy PLOS sumarizujeme vedecké články v slovenčine, aby sme podporili trénovanie modelov v odbornej terminológii. Zároveň pripravujeme dataset zo slovenských zdrojov na posilnenie kultúrneho kontextu a zlepšenie spracovania špecifických tém týkajúcich sa Slovenska.Viac informácií |