Prednášky

SÉRIA
Vysokovýkonné počítanie

Záznamy z našich prednášok si môžete pozrieť na YouTube.

Ak by ste mali záujem o konkrétnu tému alebo chceli prezentovať váš výskum, dajte nám vedieť!



Klikni na obrázok 11 Jún Slovenčina v ére veľkých jazykových modelov (s podporou superpočítača Leonardo)
Marek Dobeš
Registrácia
V projekte sa snažíme prekonať jazykovú bariéru slovenčiny pomocou stratégií využiteľných aj pre iné jazyky s nízkym počtom zdrojov. Generujeme bilingválne dáta využitím slovenských kníh a modelu LLaMA 3.3 70B Instruct, čím vytvárame datasety na preklad a zlepšenie strojovej slovenčiny. S pomocou Gemini Flash a databázy PLOS sumarizujeme vedecké články v slovenčine, aby sme podporili trénovanie modelov v odbornej terminológii. Zároveň pripravujeme dataset zo slovenských zdrojov na posilnenie kultúrneho kontextu a zlepšenie spracovania špecifických tém týkajúcich sa Slovenska.Viac informácií