Kategórie
General

Záznam z podujatia: Slovak Language in the Era of Large Language Models (with the Support of the Leonardo Supercomputer)

On June 11, 2025, a joint webinar on language modeling was held, organized by the National Competence Centres for HPC in Slovakia and Italy. The discussion focused on the challenges and solutions related to using large language models (LLMs) for less-resourced languages such as Slovak.

Recording of the event: Slovak Language in the Era of Large Language Models (with support from the Leonardo supercomputer)

On June 11, 2025, a joint webinar on language modeling was held, organized by the National Competence Centres for HPC in Slovakia and Italy. The discussion focused on the challenges and solutions related to using large language models (LLMs) for less-resourced languages such as Slovak.

Participants were introduced to several innovative approaches aimed at reducing linguistic inequality in the era of artificial intelligence:

  • Generation of bilingual datasets: We used a database of professionally edited Slovak books and the LLaMA 3.3 70B Instruct model to translate between Slovak and English, resulting in datasets for training translation models and improving machine-translated Slovak.
  • Summarization of scientific texts: Using the Gemini Flash Experimental model and the PLOS database, we generated Slovak summaries of scientific articles, contributing to the development of domain-specific language in large language models (LLMs).
  • Enhancing cultural context: We are preparing a dataset based on Slovak sources aimed at improving the models’ ability to understand culturally specific topics and local context.

The webinar was hosted by Marek Dobeš, with Radovan Garabík and Peter Bednár as co-authors of the project. The research is conducted using high-performance computing infrastructure – the Slovak supercomputer Devana and the Italian supercomputer Leonardo, operated by the Cineca supercomputing center in Italy.

The case study highlights the potential for applying these methodologies to other low-resource languages. We believe that the insights gained from this project can inspire experts around the world.

AI-Driven Archaeology with LLMs — Detecting Archaeological Sites from Aerial Imagery 30 Oct - Objavte, ako umelá inteligencia a veľké jazykové modely menia spôsob, akým odhaľujeme stopy minulosti. Webinár priblíži, ako pokročilé techniky umelej inteligencie inšpirované LLM dokážu analyzovať letecké a LiDARové snímky a detegovať archeologické lokality s bezprecedentnou presnosťou. Dr. Daniel Canedo z Univerzity v Aveire predstaví praktické príklady, v ktorých Vision Transformers a multimodálne učenie odhaľujú skryté vzory v krajine a spájajú moderné technológie s kultúrnym dedičstvom.
Superpočítač pre každého: odvážte sa objaviť svet moderných výpočtov 28 Oct - Kedysi boli superpočítače tajomnou technológiou, ku ktorej mali prístup iba špičkoví vedci vo futuristických laboratóriách. Dnes však začína platiť úplne nový príbeh. Superpočítač môžu využívať aj obyčajní ľudia z univerzít, menších firiem či dokonca zo štátnej správy — všetci, ktorí potrebujú zvládnuť výpočty, na aké bežný počítač jednoducho nestačí.
Webinar amália: Towards a Multimodal LLM for European Portuguese 27 Oct - Pridajte sa k nášmu inšpiratívnemu webináru o vývoji amália, portugalského veľkého jazykového modelu, ktorý prináša bohatstvo európskej portugalčiny do novej éry multimodálnej umelej inteligencie. Na podujatí vystúpi prof. João Magalhães z NOVA LINCS, Universidade NOVA de Lisboa, ktorý predstaví ciele, architektúru a pokrok tohto národného AI projektu. Prednáška sa zameria na to, ako amália kombinuje spracovanie textu, reči, obrazu a videa a ako prispieva k vytváraniu kultúrne ukotvených a dôveryhodných systémov umelej inteligencie pre verejný sektor, akademickú sféru a priemysel.