Kategórie
Calls-Current Všeobecné

EuroHPC JU Call for Proposals for Benchmark Access 2024

EuroHPC JU Call for Proposals for Benchmark Access 2024

Cieľom výziev EuroHPC JU Benchmark Access je podporiť výskumníkov a vývojárov HPC aplikácií poskytnutím možnosti otestovať svoje aplikácie na EuroHPC Pre-exascale a Petascale systémoch ešte pred podaním žiadosti o Extreme Scale či Regular Access.

Výzva EuroHPC Benchmark je určená na testy škálovateľnosti kódu a na testovanie AI aplikácií. Tieto výsledky máju byť zahrnuté do návrhu v budúcej výzve EuroHPC Extreme Scale a Regular Access. Maximálna doba pridelenia prístupu k infraštruktúre je tri mesiace.

Dátum otvorenia výzvy: 1.12.2023
Uzávierky pre žiadosti: 1.04.2024 (11:00 CET), 1.05.2024 (11:00 CET) 1.06.2024 (11:00 CET), 1.07.2024 (11:00 CET), 1.08.2024 (11:00 CET), 1.09.2024 (11:00 CET), 1.10.2024 (11:00 CET), 1.11.2024 (11:00 CET), 1.12.2024 (11:00 CET)

Dostupné systémy:

Viac informácií

Kategórie
Calls-Current Všeobecné

EuroHPC JU Call for Proposals for Development Access 2024

EuroHPC JU Call for Proposals for Development Access 2024

Cieľom výziev EuroHPC JU Development Access je podporiť výskumníkov a vývojárov HPC aplikácií poskytnutím príležitosti pre vývoj, testovanie a optimalizáciu aplikácii na EuroHPC Pre-exascale a Petascale systémoch ešte pred podaním žiadosti o Extreme Scale alebo Regular Access. Výzva EuroHPC Development je určená pre projekty zamerané na vývoj a optimalizáciu kódu a algoritmov a na vývoj aplikačných metód AI.

Výzva je určená pre výskumné projekty z akademickej obce a priemyslu a iniciatív financovaných z verejných či súkromných zdrojov, ako sú napríklad centrá excelentnosti alebo kompetenčné centrá. Alokačné obdobie je jeden rok a je obnoviteľné maximálne dvakrát.

Dátum otvorenia výzvy: 1.12.2023
Uzávierky pre žiadosti: : 1.04.2024 (11:00 CET), 1.05.2024 (11:00 CET) 1.06.2024 (11:00 CET), 1.07.2024 (11:00 CET), 1.08.2024 (11:00 CET), 1.09.2024 (11:00 CET), 1.10.2024 (11:00 CET), 1.11.2024 (11:00 CET), 1.12.2024 (11:00 CET).

Dostupné systémy:

Viac informácií

Kategórie
Všeobecné

SOPK: Objavte potenciál superpočítača v praxi

SOPK: Objavte potenciál superpočítača v praxi

Pozývame vás na konzultačno-vzdelávacie stretnutie s expertmi z Národného kompetenčného centra pre HPC.  Podujatie je organizovane pre podniky, ktoré pracujú s veľkým množstvom dát, alebo vyvíjajú svoje vlastné produkty a technológie.

Program:

  • Ako moderne a rýchlo spracovať dáta pomocou HPC
  • Úspešné príklady z portfólia Národného kompetenčného centra pre HPC
  • Aká je dostupnosť HPC služieb na Slovensku a v Európe
  • Ako sa môže podnik zapojiť do bezplatných testovacích projektov
  • Ponuka školení a prednášok Národného kompetenčného centra pre HPC
  • Prehliadka superpočítača Devana
  • Diskusia – v prípade záujmu možnosť dohodnúť osobnú konzultáciu s NCC

Termín: 19.3.2024 (utorok) od 14:00 – 15:30 hod.

Miesto: Výpočtové stredisko SAV, Dúbravská cesta 9, 845 35 Karlova Ves

Vstup: Bezplatne

Viac informácií a registrácia


Odborná konferencia Superpočítač a Slovensko v Bratislave 15 nov - Dňa 14. novembra 2024 sa v hoteli Devín v Bratislave uskutočnila odborná konferencia s názvom Superpočítač a Slovensko, ktorú zorganizovalo Ministerstvo investícií, regionálneho rozvoja a informatizácie SR. Konferencia sa zameriavala na aktuálne trendy a vývoj v oblasti vysokorýchlostného počítania na Slovensku. Súčasťou podujatia bola prezentácia L. Demovičovej z Národného kompetenčného centra pre HPC.
Konferencia vysokovýkonného počítania v Portugalsku 12 nov - V poradí 4. Stretnutie vysokovýkonného počítania 2024, ktoré sa konalo 5. a 6. novembra na Univerzite Beira Interior v Covilhã, sa etablovalo ako kľúčové stretnutie používateľov, technikov a partnerov ekosystému vysokovýkonného počítania v Portugalsku.
REGISTRÁCIA OTVORENÁ: Nová séria populárno-náučných prednášok o zaujímavých HPC aplikáciách 6 okt - Otvorili sme registráciu na sériu prednášok v zimnom semestri 2024, kde sa budeme venovať fascinujúcim témam, v ktorých vysokovýkonné počítanie zohráva kľúčovú úlohu. Tento semester sa zameriame na oblasti ako meteorológia, klimatológia, chémia, veľké jazykové modely a mnoho ďalších.
Kategórie
Všeobecné

Medzinárodný deň žien a dievčat vo vede

Medzinárodný deň žien a dievčat vo vede

Medzinárodný deň žien a dievčat vo vede, ktorý sa každoročne oslavuje 11. februára, vyhlásilo Valné zhromaždenie Organizácie Spojených národov v roku 2015. Tento deň nám pripomína, že ženy a dievčatá zohrávajú vo vede a technike dôležitú úlohu a že je potrebné ich v tom ešte viac podporiť. Príspevok žien vo vede je neoceniteľný, od základného výskumu až po vývoj technológií. Ženy, ako Marie Curie, Rosalind Franklinová a mnohé iné, mali zásadný vplyv na naše pochopenie sveta.

Napriek tomu až do dnešného dňa ich prítomnosť vo vede zostáva poddimenzovaná a často sa stretáva s prekážkami, ako sú predsudky a nerovnosť. Ženy v STEM (Science, Technology, Engineering, and Mathematics) oblastiach čelia viacerým výzvam, vrátane rodových stereotypov a nedostatku mentorov a podpory. Taktiež sa veľmi často stretávajú s horšími podmienkami pre možnosť kariérneho postupu. Tieto prekážky sú veľmi zložité a komplexné, čo si vyžaduje koordinované úsilie na národnej aj medzinárodnej úrovni, aby sme ich mohli prekonať.

Medzinárodný deň žien a dievčat vo vede sa nesie v duchu oslavy, ale tiež ako výzva k akcii. Cieľom je nielen uznať prínosy žien vo vede, ale aj:

  • Zvýšiť povedomie o dôležitosti rodovej rovnosti vo vede a výskume.
  • Podporiť politiky, ktoré otvárajú viac príležitostí pre ženy a dievčatá vo vedeckých disciplínach.
  • Odstrániť prekážky, ktoré bránia ženám v dosahovaní ich plného potenciálu vo vede.
  • Inšpirovať budúce generácie žien, aby nasledovali svoje vášne vo vedeckých a technologických odboroch.

Medzinárodný deň žien a dievčat vo vede je dôležitým pripomenutím toho, že napriek pokrokom, ktoré sme dosiahli, cesta k úplnej rodovej rovnosti vo vede je ešte stále dlhá. Cieľom tohto medzinárodného dňa je poukázať na to, že potrebujeme vytvoriť svet, v ktorom  ženy a dievčatá budú môcť bez obmedzení (pracovných, sociálnych…)  prispievať k vedeckému pokroku a inováciám.

Podľa údajov UNESCO pôsobí v súčasnosti na výskumných pozíciách v celom svete menej ako 30 % žien. Preto je nevyhnutné podporovať plný a rovnocenný prístup žien a dievčat k uplatneniu vo vede.

Pri príležitosti medzinárodného dňa žien a dievčat vo vede by sme vám radi dali do pozornosti zaujímavý článok slovenskej vedkyne Mariany Derzsi na tému “Nové oxidy niklu, medi a paládia“, ktorý nadväzuje na článok “Predikcia nových anorganických zlúčenín“.

Doc. Mgr. Mariana Derzsi, PhD. získala doktorát z fyzikálnej chémie na Ústave anorganickej chémie SAV. Hneď po škole pôsobila v Poľskej akadémii vied v Krakove, neskôr na Varšavskej univerzite a bola tiež hosťujúcou vedkyňou Chemie Parich Tech v Paríži a na Padovskej univerzite v Taliansku. Po desiatich rokoch sa vrátila na Slovensko a už šesť rokov pracuje v Ústave výskumu progresívnych technológií v Trnave na Materiálovotechnologickej fakulte Slovenskej technickej univerzity, kde založila výskumnú skupinu Počítačového modelovania materiálov.

Doc. Mgr. Mariana Derzsi, PhD.
  • Kedy/ako ste zistili, že chcete byť vedkyňou a kto alebo čo Vás inšpirovalo k štúdiu v oblasti STEM?

Už na základnej škole sa mi páčili rozprávky a filmy pre mladistvých s vedeckou tematikou a dokumentárne filmy o prírode. Na strednej škole som si postupne uvedomila, že sa chcem celý život vzdelávať.  Strávila som jeden školský rok v USA a to mi otvorilo ďalšie horizonty. Pocítila som, ako veľmi ma obohatilo ovládanie cudzieho jazyka, ako pomocou neho viem preniknúť do inej kultúry, klásť si nové otázky, premýšľať iným spôsobom a zažiť a skutočne precítiť iné pohľady na tú istú vec. Okrem toho, nebavilo ma memorovanie, potrebovala som veciam rozumieť. Len tak som si ich vedela zapamätať. Preto, keď som si vyberala vysokú školu, bolo mi jasné, že to budú prírodné vedy a jazyky. Začala som teda medziodborové štúdium na Univerzite Komenského: fyziku na FMFI a anglicky jazyk na Filozofickej fakulte. Počas prvého roku ma ešte viac očarila fyzika a predovšetkým atmosféra na FMFI fakulte. Prepadla som knihám od Stephena Hawkinga a postupne som začala hltať všetku medzinárodnú popularizačnú literatúru o fyzike. Na FMFI som stretla veľa vyučujúcich, ktorí nás vysokoškolských poslucháčov brali za rovnocenných partnerov. Prednášky boli inšpirujúce (tie, na ktoré som sa aj dostavila 🙂 ), viacerí prednášajúci boli v našich očiach priam legendy. To bolo všetko úžasné, ale zároveň to umocňovalo pocit zodpovednosti za štúdium. Túžila som byť ako oni. Koncom prvého roku vo mne dozrelo rozhodnutie, že sa chcem naplno venovať fyzike a preto som požiadala o prestup na smer vedecká fyzika a s filozofickou fakultou som sa rozlúčila. Toto bol moment, kedy som vedela že chcem byt vedkyňou a vedome som sa vybrala touto cestou. Nebolo to ľahké. Po tomto rozhodnutí som ešte veľakrát vyletela zo skúšok, dokonca sa mi stalo, že som bola na danej písomke len jediné dievča a len ja som cez tú písomku opakovane neprešla. Všetci chalani to dali. Tiež mi bolo na nejednej doplňujúcej konzultácii naznačené, že som žena, ktorá by snáď mala viac rozmýšľať nad vytvorením rodiny. Dokonca sa ma jeden skúšajúci opýtal, ako to že som prišla k nemu na skúšku, že dievčatá k nemu nechodia, vyberajú si zvyčajne skúšajúcu, cez ktorú ľahšie ‘prejdú’. Nebrala som to v zlom. Dané osoby, ktoré to nadhodili ma nijako nediskriminovali ani nepodceňovali. Naplno sa mi venovali. Myslím si, že boli jednoducho zaskočení, no a keď som si dorobila všetky skúšky, ktoré som si dala za cieľ pred požiadaním o prestup, bolo mi povedané, že prestup mi nebude umožnený. Šokovalo ma to, no nevzdala som to, a našla som cestu. Od vtedy idem po nej.

  • Podporovala vás rodina, priatelia a učitelia v rozhodnutí študovať predmety z oblasti STEM?

Moja rodina, priatelia a učitelia zohrali kľúčové role. Napríklad učiteľka na základnej škole poradila mojim rodičom, aby ma dali na gymnázium. Keby to neurobila, skončila by som na záhradníckej škole. Kto vie, možno by ma tá cesta zaviedla k mikrobiológii. Rodičia boli prekvapení, lebo som patrila skôr medzi priemerných študentov až lajdákov. Ale učiteľka zrejme videla, že tie moje študijné výsledky sú skôr dôsledok môjho nezáujmu, než odrazom mojich schopností. Za to som jej vďačná. Vtedy som začala nad sebou inak rozmýšľať.

Rodičia mi nikdy nevnucovali, čo mám študovať. Nechali ma si slobodne vybrať. Nezabudnem, ako mi otec povedal a išiel mi v tom každý deň príkladom, že si mám v živote nájsť to, čo ma bude baviť a napĺňať a robiť to najlepšie ako dokážem. To sa mi vrylo hlboko pod kožu. Blízki priatelia a spolužiaci mi boli oporou, zrkadlom a výzvou. Zohrali dôležitú rolu v mojom rozhodnutí študovať fyziku. Ja som si neverila a myslela som si, že ako dievča na FMFI nepatrím. Nikdy som nebola na žiadnej vedomostnej olympiáde, neexcelovala som v prírodných vedách a preto sama by som sa neodvážila toto rozhodnutie urobiť. Oni mi dodali sebavedomie a presvedčili ma, že na tých veciach nezáleží. Že mám si ísť za tým, čo ma ťahá a nevzdávať sa, keď som to ani len nevyskúšala. A tak som išla. Tiež som mala spolužiačky, ktoré ma inšpirovali svojim intelektom a prístupom k štúdiu. Boli sme si navzájom výzvou, napríklad v rýchlostnom čítaní anglickej klasickej literatúry na prijímačky.

  • Čo by ste odkázali dievčatám, ktoré by sa chceli venovať STEM oblastiam, no váhajú vstúpiť do oblasti, kde sú ženy nedostatočne zastúpené?

Choďte si za tým, čo vás ťahá a nevzdávajte sa, keď ste to ešte ani len nevyskúšali. No a keď ste to už aj vyskúšali, nevzdávajte sa po prvých zlyhaniach či odmietnutiach. Chcete to, robte to. 

  • Viete nám prosím, v skratke opísať, čomu sa venujete teraz?

Venujem sa počítačovému modelovaniu molekulových a kryštálových štruktúr anorganických materiálov. Od momentu, kedy som sa dozvedela, že celá živá aj neživá príroda je tvorená atómami, ma fascinuje fakt, že to čo v svojej podstate odlišuje jeden predmet či materiál od iného, je predovšetkým spôsob, ako sú v nich atómy usporiadané. Nezávisle od chemického zloženia totižto v princípe vieme docieliť nejakú vlastnosť materiálu tým, že v ňom vhodne usporiadame atómy. Nie za každých podmienok nami požadované usporiadanie atómov bude možné docieliť pre dané chemické zloženie, no vždy vieme nájsť podmienky, za ktorých ich k tomu vieme prinútiť. A tomuto sa v podstate venujem. Zaoberám sa prediktívnym modelovaním nových molekulových a kryštálových štruktúr a štúdiom vzťahu medzi štruktúrou a vlastnosťami materiálov, ktoré z danej štruktúry vyplývajú. Môžeme si to priblížiť na príklade diamantu a grafitu. Oba materiály sú tvorené tým istým chemickým prvkom – uhlíkom. Líšia sa len v tom, ako sú atómy uhlíka v grafite a diamante usporiadané. Jedno usporiadanie spôsobuje, že materiál je priesvitný (prepúšťa celé svetlo), veľmi tvrdý (môžeme s nim rezať sklo) a elektricky nevodivý (izolátor) – to je diamant. Iné usporiadanie spôsobuje, že materiál je nepriesvitný, čierny, lebo pohlcuje všetko svetlo, je mäkký (ľahko odštiepime jednotlivé vrstvy) a jeho elektrické vlastnosti závisia od smeru v kryštáli (v jednom smere je viac, v inom menej vodivý) – to je grafit. Ja sa zameriavam na predpoveď kryštálových štruktúr nových halidov a oxidov prechodných kovov. Zameriavam sa predovšetkým na binárne systémy, to sú zlúčeniny, ktoré sa skladajú z dvoch chemických prvkov. Už aj pri takomto jednoduchom zložení pozorujeme fascinujúcu rozmanitosti možných atómových usporiadaní (molekulových a kryštálových štruktúr) a vlastností, ktoré z nich vyplývajú. Chápanie vzťahu medzi štruktúrou a vlastnosťami nám pomáhajú na základe štruktúry predpovedať správanie sa materiálu a naopak zo správania sa materiálu vieme odvodiť usporiadanie atómov v ňom. To platí pre všetky materiály, anorganické aj organické či zložité biologické systémy. To je jednoducho fascinujúce!


Odborná konferencia Superpočítač a Slovensko v Bratislave 15 nov - Dňa 14. novembra 2024 sa v hoteli Devín v Bratislave uskutočnila odborná konferencia s názvom Superpočítač a Slovensko, ktorú zorganizovalo Ministerstvo investícií, regionálneho rozvoja a informatizácie SR. Konferencia sa zameriavala na aktuálne trendy a vývoj v oblasti vysokorýchlostného počítania na Slovensku. Súčasťou podujatia bola prezentácia L. Demovičovej z Národného kompetenčného centra pre HPC.
Konferencia vysokovýkonného počítania v Portugalsku 12 nov - V poradí 4. Stretnutie vysokovýkonného počítania 2024, ktoré sa konalo 5. a 6. novembra na Univerzite Beira Interior v Covilhã, sa etablovalo ako kľúčové stretnutie používateľov, technikov a partnerov ekosystému vysokovýkonného počítania v Portugalsku.
REGISTRÁCIA OTVORENÁ: Nová séria populárno-náučných prednášok o zaujímavých HPC aplikáciách 6 okt - Otvorili sme registráciu na sériu prednášok v zimnom semestri 2024, kde sa budeme venovať fascinujúcim témam, v ktorých vysokovýkonné počítanie zohráva kľúčovú úlohu. Tento semester sa zameriame na oblasti ako meteorológia, klimatológia, chémia, veľké jazykové modely a mnoho ďalších.
Kategórie
Calls-Finished Všeobecné

Large AI Grand Challenge

Large AI Grand Challenge

Projekt AI-BOOST financovaný z EÚ spustil svoju prvú súťaž, ktorá ponúka až 250.000 eur v bezkapitálovom financovaní až štyrom európskym malým stredným podnikom (MSP) a startupom s vysokým potenciálom, ktoré majú technickú kapacitu a skúsenosti s prácou na rozsiahlych modeloch umelej inteligencie (AI). Rozsiahle modely AI označujú novú generáciu systémov umelej inteligencie na všeobecné použitie, ktoré sa dokážu prispôsobiť rôznym doménam a úlohám bez výrazných úprav. Vďaka svojej prispôsobivosti majú tieto modely obrovský potenciál prispieť k pokroku v rôznych odvetviach.

Pozoruhodné príklady rozsiahlych modelov AI zahŕňajú OpenAI GPT-4 a Meta LLaMA 2. Pre európsku suverenitu je strategicky dôležité, aby európske spoločnosti boli na napredujúcich pozíciách v tejto oblasti a preto EÚ podporuje podniky a ich rozvoj.

Podniky môžu získať:

Hlavným cieľom projektu AI-BOOST, ktorý bude do budúcnosti otvárať aj ďalšie výzvy, je podporiť vedecký pokrok v hlavných oblastiach umelej inteligencie. Prihlásiť sa môžu európske malé a stredné podniky aj startupy s vysokým potenciálom, ktoré majú technické kapacity a skúsenosti s prácou na Large-Scale AI modeloch.

Uzávierky pre žiadosti: 13.02. 2024, 17:00 CET

Príručka pre žiadateľa
Viac informácií

Kategórie
Všeobecné

Zabezpečenie digitálnych hraníc zajtrajška: Qubit Conference®
stanovuje nové trendy kybernetickej bezpečnosti v strednej Európe

Zabezpečenie digitálnych hraníc zajtrajška:
Qubit Conference® stanovuje nové trendy kybernetickej bezpečnosti v strednej Európe

Podujatie známe svojou kvalitnou zostavou odborných prednášok a špičkových rečníkov z celého sveta, sa stalo centrom pre budovanie vzťahov, zdieľanie progresívnych nápadov, technológií a stratégií, ktoré formujú budúcnosť digitálnej bezpečnosti malých aj veľkých podnikov. Qubit Conference® sa stala povinnou udalosťou pre odborníkov, ktorí chcú sledovať najnovšie trendy a inovácie v oblasti kybernetickej bezpečnosti, vďaka čomu z roka na rok rastie nie len počtom účastníkov, ale aj vplyvom na odvetvie.

Konferencia každoročne privíta viac ako 500 účastníkov z desiatok krajín, z čoho v priemere až 44% tvoria noví účastníci, ktorí hľadajú inovácie a výzvy v oblasti kybernetickej bezpečnosti. Podľa posledného prieskumu spokojnosti Qubit Conference®, 100% účastníkov s hrdosťou uvádza, že by konferenciu odporučili každému, kto hľadá výnimočné skúsenosti v oblasti kybernetickej bezpečnosti.

Odhaľovanie trendov, riešení a jedinečná príležitosť pre networking

Digitálne trendy, ale aj hrozby s nimi súvisiace, sú vždy v centre pozornosti. Konferencia pravidelne hostí predstaviteľov technologických spoločností, ktoré sú na čele inovácií v oblasti kybernetickej bezpečnosti. Prezentácie a workshopy sa zameriavajú na predstavenie revolučných riešení, ktoré menia paradigmu v boji proti kybernetickým hrozbám.

Účastníci tak môžu očakávať konkrétne príklady implementácii a návody, ako tieto inovácie integrovať do svojich bezpečnostných stratégií, a to nie len teoreticky, ako poslucháč v hľadisku, ale aj prakticky, prostredníctvom interaktívnych workshopov, kde si každý účastník môže vyskúšať implementáciu nových technológií a riešení, čo poskytuje nespočetné príležitosti na získanie nových schopností a pochopenie ich praktických využití.

Qubit Expo zas predstavuje spoločnosti, ktoré prinášajú najnovšie inovácie v oblasti softvéru, hardvéru, analýzy dát a ďalších oblastí, ktoré posúvajú hranice toho, čo je možné v digitálnej bezpečnosti. S rýchlymi technologickými pokrokmi, prichádza aj jedinečná príležitosť pre networking. Diskusie a workshopy poskytujú účastníkom príležitosti vytvárať nové pracovné či obchodné spojenia.

Qubit Conference® je nepochybne udalosťou, ktorá posúva hranice poznatkov, inovácií a networkingu v oblasti kybernetickej bezpečnosti. Dokazuje to aj posledný prieskumu spokojnosti Qubit Conference®, v ktorom výrazná väčšina, až 97% účastníkov prejavuje záujem zúčastniť sa aj ďalších workshopov a školení, ktoré spoločnosť Qubit pripravuje v blízkej dobe. Zároveň, až 94% účastníkov potvrdzuje, že všetky edukačné aktivity Qubit Conference® sa venujú aktuálnym trendom. Okrem toho, pre viac ako 4/5 účastníkov (83%) predstavuje konferencia výbornú príležitosť na vytváranie nových pracovných vzťahov či získavanie potenciálnych zákazníkov.

Po prvýkrát na pódiu kyber ochrana aj pre malé a stredné podniky

Qubit Conference® rozhodne potvrdzuje svoju pozíciu popredného technologického eventu v strednej Európe. Na jeseň odštartovala sériu webinárov a školení kybernetickej bezpečnosti pre malé a stredné podniky (MSP). Táto iniciatíva zodpovedá narastajúcej potrebe zabezpečenia digitálnej infraštruktúry pre menšie podniky, ktoré sú čoraz viac vystavené komplexným kybernetickým hrozbám.

Diskusia na pódiu bola bohatá na expertízne pohľady od odborníkov, ktorí majú rozsiahle skúsenosti s kybernetickou ochranou. Témou diskusie boli nielen aktuálne hrozby, ale aj konkrétne stratégie a nástroje, ktoré môžu MSP implementovať na zvýšenie svojej kybernetickej odolnosti. Záverečný diskusný panel ponúkol prítomným MSP neoceniteľnú príležitosť priamo interagovať s odborníkmi a získať konkrétne rady pre svoje individuálne potreby.

Rok 2024 otvorí debatu ľudského dotyku v pokročilých technológiách

Qubit Conference® dokazuje, že je viac než len jednorazová udalosť. Organizátori už oznámili plány na rozšírenie a posilnenie komunity, ktorá vzniká v rámci konferencie. Súčasťou toho bude aj pravidelná séria workshopov a stretnutí, ktoré umožnia odborníkom na kybernetickú bezpečnosť, IT a inovácie udržiavať si kontakty a spolupracovať aj po skončení samotnej konferencie.

Ako uvádza Senior Event Producer Qubit Conference® Katarína Gamboš, „Rok 2024 neprinesie len nový začiatok, ale aj revolúciu v tom, ako vnímame a integrujeme ľudský dotyk do pokročilých technológií. Téma nadchádzajúcej Qubit Conference® Prague 2024, “Bringing humans back to cyber,” zavádza do diskusie hodnotu ľudského faktora v ére, kde sa technologický pokrok pohybuje neuveriteľnou rýchlosťou. “Bringing humans back to cyber” nie je len heslo, ale zároveň príležitosť pre odborníkov z celého sveta zdieľať svoje pohľady a nápady na to, ako by sme mali vnímať a začleniť ľudský faktor do technologických inovácií. Na Qubit Conference® Prague 2024 si dávame za cieľ otvoriť diskusiu o tom, ako môžeme my, ako jedinci zabezpečiť, aby technologický pokrok prispieval k prospechu celej spoločnosti a zachovával etické normy.“


Odborná konferencia Superpočítač a Slovensko v Bratislave 15 nov - Dňa 14. novembra 2024 sa v hoteli Devín v Bratislave uskutočnila odborná konferencia s názvom Superpočítač a Slovensko, ktorú zorganizovalo Ministerstvo investícií, regionálneho rozvoja a informatizácie SR. Konferencia sa zameriavala na aktuálne trendy a vývoj v oblasti vysokorýchlostného počítania na Slovensku. Súčasťou podujatia bola prezentácia L. Demovičovej z Národného kompetenčného centra pre HPC.
Konferencia vysokovýkonného počítania v Portugalsku 12 nov - V poradí 4. Stretnutie vysokovýkonného počítania 2024, ktoré sa konalo 5. a 6. novembra na Univerzite Beira Interior v Covilhã, sa etablovalo ako kľúčové stretnutie používateľov, technikov a partnerov ekosystému vysokovýkonného počítania v Portugalsku.
REGISTRÁCIA OTVORENÁ: Nová séria populárno-náučných prednášok o zaujímavých HPC aplikáciách 6 okt - Otvorili sme registráciu na sériu prednášok v zimnom semestri 2024, kde sa budeme venovať fascinujúcim témam, v ktorých vysokovýkonné počítanie zohráva kľúčovú úlohu. Tento semester sa zameriame na oblasti ako meteorológia, klimatológia, chémia, veľké jazykové modely a mnoho ďalších.
Kategórie
Všeobecné

MEDZINÁRODNÁ LETNÁ HPC ŠKOLA 2024

MEDZINÁRODNÁ LETNÁ HPC ŠKOLA 2024

Študenti doktorandského štúdia a postdoktorandi z inštitúcií v Austrálii, Európe, Japonsku a Spojených štátoch sú pozvaní na 13. medzinárodnú letnú školu zameranú na vysokovýkonné počítanie. Letná škola bude prebiehať pod záštitou Centra pre výpočtovú vedu RIKEN v dňoch 7.-12. júla 2024 v Kobe v Japonsku. Prihlásiť sa môžete do 23:59 AOE 31. januára 2024.

Letná škola je financovaná Centrom pre výpočtovú vedu RIKEN (R-CCS), Spoločným podnikom EuroHPC (EuroHPC JU), Superpočítačovým centrom Pawsey (Pawsey) a programom ACCESS. Ďalšími sponzormi sú EPCC (Veľká Británia) a NICIS CHPC (Južná Afrika). Počet prijatých uchádzačov bude závisieť od dostupnosti financovania.

Letná škola predstaví najlepším študentom v oblasti výpočtových vied súčasné aspekty vysokovýkonného počítania (HPC) a analýzy veľkých dát pre rôzne vedecké disciplíny. Podporí networking medzi účastníkmi, poskytne prednášky skúsených lektorov, uľahčí medzinárodnú výmenu a otvorí ďalšie kariérne možnosti. Poprední výpočtoví vedci a odborníci v HPC sfére z partnerských regiónov ponúknu paralelnú výučbu na rôzne témy, napríklad:

  • HPC and Big Data challenges in major scientific disciplines
  • Shared-memory programming
  • Distributed-memory programming
  • GPU programming
  • Performance analysis and optimization on modern CPUs and GPUs
  • Software engineering
  • Numerical libraries
  • Big Data analytics
  • Deep learning
  • Scientific visualization
  • Canadian, European, Japanese, Australian and U.S. HPC-infrastructures

Letná škola bude prínosom pre vedcov z Austrálie, európskych, japonských a amerických inštitúcií, ktorí vo svojom výskume využívajú vysokovýkonnú výpočtovú techniku.

Čo by mali spĺňať uchádzači?

  • Vedomosti v oblasti HPC, nie nutne na úrovni experta, ale skôr vedca, ktorý by mohol profitovať z využitia vysokovýkonného počítania vo svojej vedeckej práci.
  • Doktorand s kvalitným výskumným plánom alebo postdoktorand na začiatku svojej vedeckej kariéry.
  •  Skúsenosti, alebo minimálne záujem o využitie paralelného programovania.
  • Vítaní sú uchádzači z akéhokoľvek výskumného odboru ak ich výskumné aktivity zahŕňajú výpočtovú prácu.

Prvé dva dni programu pozostávajú z dvoch paralelných prednášok. V žiadosti si uchádzač musí vybrať preferovanú tému:

  • An introduction to shared-memory parallelism and accelerator programming.
  • Advanced distributed-memory programming.

Školné, strava a ubytovanie budú hradené pre všetkých prijatých uchádzačov na letnú školu. Cestujúcim do/zo školy budú uhradené aj primerané náklady na let.

Viac informácií o letnej škole


Odborná konferencia Superpočítač a Slovensko v Bratislave 15 nov - Dňa 14. novembra 2024 sa v hoteli Devín v Bratislave uskutočnila odborná konferencia s názvom Superpočítač a Slovensko, ktorú zorganizovalo Ministerstvo investícií, regionálneho rozvoja a informatizácie SR. Konferencia sa zameriavala na aktuálne trendy a vývoj v oblasti vysokorýchlostného počítania na Slovensku. Súčasťou podujatia bola prezentácia L. Demovičovej z Národného kompetenčného centra pre HPC.
Konferencia vysokovýkonného počítania v Portugalsku 12 nov - V poradí 4. Stretnutie vysokovýkonného počítania 2024, ktoré sa konalo 5. a 6. novembra na Univerzite Beira Interior v Covilhã, sa etablovalo ako kľúčové stretnutie používateľov, technikov a partnerov ekosystému vysokovýkonného počítania v Portugalsku.
REGISTRÁCIA OTVORENÁ: Nová séria populárno-náučných prednášok o zaujímavých HPC aplikáciách 6 okt - Otvorili sme registráciu na sériu prednášok v zimnom semestri 2024, kde sa budeme venovať fascinujúcim témam, v ktorých vysokovýkonné počítanie zohráva kľúčovú úlohu. Tento semester sa zameriame na oblasti ako meteorológia, klimatológia, chémia, veľké jazykové modely a mnoho ďalších.
Kategórie
Success-Stories

Identifikácia entít pre extrakciu adries z transkriptovaných rozhovorov s využitím syntetických dát

Identifikácia entít pre extrakciu adries z transkriptovaných rozhovorov s využitím syntetických dát

Podniky vynakladajú vel’ké množstvo úsilia a finančných prostriedkov na komunikáciu s klientmi. Zvyčajne je ciel’om informácie klientom poskytnúť’, niekedy je však naopak potrebné informácie vyžiadať’ (napr. miesto bydliska). Na riešenie tejto požiadavky sa vynakladá značné úsilie, napríklad vývojom chat- a voicebotov, ktoré na jednej strane slúžia na poskytovanie informácií klientom, ale možno ich využiť’ aj na kontaktovanie klienta so žiadosťou o poskytnutie informácií. Konkrétnym príkladom z reálneho života je kontaktovanie klienta prostredníctvom textovej správy alebo telefonicky s cieľom aktualizovať’ jeho kontaktnú adresu. Keďže adresa klienta sa mohla časom zmeniť, podnik potrebuje priebežne aktualizovať tieto informácie vo svojej internej databáze klientov.

Ilustračný obrázok

Pri vyžiadaní takýchto informácií prostredníctvom ”nových” kanálov, akými sú chat- alebo voiceboty, je dôležité overiť’ správnosť’ a formát adresy. V takýchto prípadoch informácie o adrese zvyčajne pochádzajú z voľného textového vstupu, alebo ako transkript (prepis) hovorenej reči do textu. Takéto vstupy môžu obsahovať’ značne množstvo ”šumu” alebo odchýlky voči požadovanému formátu adresy. Na overenie formátu a platnosti adresy je potrebné odfiltrovať’ šum a extrahovať’ zodpovedajúce entity, ktoré tvoria skutočnú, t.j. presnú adresu. Tento proces extrakcie entít zo vstupného textu je označovaný ako rozpoznávanie pomenovaných entít (NER, z angl. ”Named-Entity Recognition”). V našom konkrétnom prípade ide o tieto entity: názov obce, názov ulice, číslo domu a poštové smerovacie číslo. Cieľom tohto reportu je opísať’ vývoj, implementáciu a posúdenie kvality systému NER na extrakciu spomenutých informácií.

POPIS PROBLÉMU

Táto štúdia je výsledkom spoločného úsilia Národného kompetenčného centra pre vysokovýkonné počítanie a spoločnosti nettle, s.r.o., ktorá je slovenským start-upom zameraným na spracovanie prirodzeného jazyka, chatboty a voiceboty. Cieľom bolo vyvinúť’ vysoko presný a spoľahlivý NER model na extrakciu adries, ktorého vstupom je voľný text, ako aj transkript reči do textu. Výsledný NER model predstavuje dôležitý prvok pre vývoj reálnych systémov starostlivosti o zákazníkov, ktorý sa dá využiť’ všade, kde je nutné extrahovanie adresy.

Výzvou tejto štúdie bolo spracovanie dát, ktoré boli dostupné výlučne v slovenskom jazyku. Z tohto dôvodu bol výber základného modelu veľmi obmedzený. Aktuálne je k dispozícii niekoľko verejne dostupných NER modelov pre slovensky jazyk. Tieto modely sú založené na predtrénovanom univerzálnom modeli SlovakBERT [1]. Bohužiaľ’, všetky tieto modely podporujú len niekoľko typov entít, pričom podpora entít relevantných pre extrakciu adries chýba. Priame využitie populárnych veľkých jazykových modelov (LLM, z angl. ”Large Language Models”), ako je GPT, prostredníctvom cloudových rozhraní (API) neprichádza v našom prípade do úvahy, primárne z dôvodov ochrany osobných údajov a časových oneskorení.

Navrhovaným riešením je doladenie (z angl. ”fine-tuning”) modelu SlovakBERT pre NER. Úloha NER je v našom prípade klasifikačná úloha na úrovni tokenov. Cieľom je dosiahnuť’ dostatočnú presnosť’ v rozpoznávaní entít s malým počtom dostupných reálnych pozorovaní. V časti 2.1 opisujeme náš dátový súbor, vrátane procesu tvorby týchto dát. Výrazný nedostatok dostupných, reálnych pozorovaní nás prinútil vytvoriť’ ”syntetické dáta”. V časti 2.2 navrhujeme úpravy SlovakBERT-u s cieľom natrénovať’ a doladiť’ ho pre našu úlohu. V časti 2.3 skúmame iteračné zlepšenia nášho prı́stupu generovania syntetických dát. Záverom, v časti 3, uvádzame výsledky trénovania a diskutujeme výkonnosť’ modelu.

DÁTA

K dispozícii bolo iba 69 zaznamenaných, reálnych vstupov. Všetky tieto vstupy boli navyše značne ovplyvnené šumom, napr. prirodzeným váhaním v reči, chybami pri prepise reči a pod. Preto boli tieto dáta použité výlučne na testovanie. V tabuľke 1 sú uvedené dva príklady zo zhromaždeného súboru dát.

Tabul’ka 1: Dva prı́klady z reálnych dát. V stĺpci Veta je zobrazený pôvodný text adresy. Stĺpec Tokenizovaný text obsahuje tokenizovanú reprezentáciu vety a stĺpec Anotácie obsahuje tag-y pre prı́slušné tokeny. Zdôrazňujeme, že nie každá veta musı́ nevyhnutne obsahovat’ všetky uvažované typy entı́t. Niektoré vety obsahujú šum, zatial’ čo iné obsahujú gramatické/pravopisné chyby: Token ,,Ďalši” nie je súčasťou adresy a názov ulice ,,bauerová” nezačína veľkým písmenom.

Vytváranie syntetického súboru trénovacích dát sa ukázalo ako jediná možnost’ riešenia problému nedostatku pozorovaní. Inšpirovaní 69 reálnymi príkladmi sme pomocou API do OpenAI vygenerovali množstvo podobných, reálne vyzerajúcich príkladov. Na anotovanie vygenerovaného súboru dát sa použila anotačná schéma BIO [2]. Táto schéma, často používaná v NLP na anotovanie tokenov, označuje v sekvencii začiatok (beginning – B), vnútro (inside – I) alebo ”vonkajšok” (outside – O) entít. Používame 9 anotácií: O, B-Ulica, I-Ulica, B-ČísloDomu, I ČísloDomu, B-Obec, I-Obec, B-PSČ, I-PSČ.

Údaje boli generované vo viacerých iteráciách, vid’. časť’ 2.3. Konečný súbor trénovacích dát pozostával z viac ako 104 pozorovaní. Na generovanie bolo použité GPT-3.5-turbo API. Keďže generovanie textu prostredníctvom tohto API je obmedzené počtom tokenov – ako generovaných, tak aj tokenov v prompte –, nebolo možné v rámci promptov použiť’ kompletný zoznam všetkých existujúcich slovenských názvov ulíc a obcí. Preto boli dáta generované so zástupnými znakmi názov ulice a názov obce, ktoré sa následne nahradili náhodne vybranými názvami ulíc a obcí zo zoznamov názvov ulíc, resp. obcí. Kompletný zoznam slovenských názvov ulíc a obcí bol získaný z webových stránok Ministerstva vnútra Slovenskej republiky [3].

Pomocou generatívneho algoritmu OpenAI, dostupného cez API, sa nám podarilo dosiahnuť’ organické vety bez potreby ručného generovania dát, čo výrazne urýchlilo prácu. Použitie tohto prístupu však neprebehlo úplne bez problémov. Vo vygenerovanom súbore sa vyskytovalo mnoho chýb, boli to hlavne nesprávne anotácie, ktoré bolo potrebné ručne opraviť’. Vygenerovaný súbor bol rozdelený tak, že 80% dát bolo použitých na trénovanie modelu, 15% na validáciu a 5% ako syntetické testovacie dáta, aby bolo možné porovnať’ výkonnosť’ modelu na skutočných dátach s výkonom na umelých testovacích dátach.

VÝVOJ A TRÉNOVANIE MODELOV

V práci boli boli použité a porovnané dva predtrénované, všeobecné modely pre slovenský jazyk: SlovakBERT [1] a destilovaná verzia tohto modelu [4]. V tomto texte označujeme destilovanú verziu ako DistilSlovakBERT. SlovakBERT je open source predtrénovaný model slovenského jazyka, ktorý využíva maskované modelovanie jazyka (MLM, z angl. ”Masked Language Modeling”). Bol natrénovaný na všeobecnom slovenskom webovom korpuse, ale dá sa l’ahko prispôsobit’ na riešenie nových úloh [1]. Dis-tilSlovakBERT je predtrénovaný model získaný z modelu SlovakBERT metódou nazývanou ”destilácia znalostí”, ktorá výrazne zmenšuje vel’kost’ modelu pri zachovaní (až 97%) jeho schopností porozumiet’ jazyku.

Oba modely boli upravané pridaním vrstvy klasifikácie, čím sa v oboch prípadoch získali modely vhodné pre úlohy NER. Posledná klasifikačná vrstva pozostáva z 9 neurónov zodpovedajúcich 9 anotáciám entít, t.j. 4 časti adresy a každá je reprezentovaná dvoma anotáciami – začiatok (B) a vnútro (I) každej entity a jedna anotácia je pre neprítomnosť akejkoľvek entity (O). Počet parametrov pre každý model a jeho zložky sú zhrnuté v tabuľke 2.

Tabul’ka 2: Počet parametrov v použitých NER modeloch a ich prı́slušné počty parametrov pre základný model a klasifikačnú vrstvu.

Trénovanie modelov sa ukázalo byt’ značne náchylné na preučenie. Na riešenie tohto problému a dalšie zlepšenie procesu trénovania bolo použíté lineárne zmenšovanie parametru rýchlosti učenia, regularizačná stratégiu ”weight decay” a niektoré d’alšie stratégie ladenia hyperparametrov.

Na trénovanie modelov boli využité výpočtové prostriedky HPC systému Devana, ktorý prevádzkuje Výpočtové stredisko Centra spoločných činností SAV, konkrétne s využitím akcelerovaného uzla s 1 grafickou kartou (GPU) NVidia A100. Na pohodlnejšiu analýzu a ladenie bolo využívané interaktívne prostredie OpenOnDemand, ktoré umožňuje používatel’om vzdialený webový prístup k superpočítaču.

Proces trénovania vyžadoval iba 10 − 20 epoch na natrénovanie pre oba modely. Pri použití spomenutých HPC prostriedkov bol čas trénovania jednej epochy v priemere 20 sekúnd pre 9492 vzoriek v trénovanom súbore dát pre SlovakBERT a 12 sekúnd pre DistilSlovakBERT. Inferencia na 69 vzorkách trvá 0, 64 sekundy pre SlovakBERT a 0, 37 sekundy pre DistilSlovakBERT, čo dokazuje dostatočnú efektivitu pre použitie týchto modelov v NLP aplikáciách v reálnom čase.

ITERATÍVNE VYLEPŠENIA

Hoci sme mali k dispozícii len 69 reálnych pozorovaní, ich komplexnost’ bola pomerne náročná na simulovanie v generovaných dátach. Generovaný súbor dát bol vytvorený pomocou viacerých promptov, výsledkom čoho bolo 11,306 viet, ktoré pripomínali človekom generovaný text. Získanie finalného riešenia pozostávalo z niekol’kých iterácií, pričom každú iteráciu možno rozdeliť na viaceré kroky: generovanie dát, trénovanie modelu, vizualizácia chýb predikcie na reálnych a umelých testovacích dátach a ich analýza. Týmto spôsobom boli identifikované vzory, ktoré model nedokázal rozpoznat’. Na základe týchto poznatkov boli vygenerované nové dáta, ktoré sa riadili týmito novoidentifikovanými vzormi. Dáta dopĺňané v iteráciách boli generované pomocou promptov uvedených v tabul’ke 3. Pomocou každého novorozšíreného súboru dát boli natrénované oba modely, pričom presnost’ modelu Slovak-BERT vždy prevyšovala presnost’ modelu DistilSlovakBERT. Preto bol d’alej využívaný ako základný model už iba SlovakBERT.

Výsledky

Matica zámen (z angl. ”Confusion Matrix”) zodpovedajúca výsledkom modelu natrénovaného v Iterácii 1 (pozri Tabul’ka 3)—je zobrazená v Tabul’ke 4. Tento model dokázal správne rozpoznat’ iba 67, 51% entít v testovacom súbore údajov. Podrobné preskúmanie chýb predikcie ukázalo, že súbor trénovacích dát nereprezentuje dostatočne dobre reálne pozorovania a je potrebné generovat’ viac reprezentatívnejších údajov. V tabul’ke 4 je zrejmé, že najčastejšou chybou bola identifikácia obce ako ulice a dochádzalo k tomu v prípadoch, ked’ sa názov obce objavil pred názvom ulice v adrese. Výsledkom bolo generovanie dát pomocou iterácie 2 a iterácie 3.

Tabul’ka 3: Iteratı́vny proces vytvárania dátového súboru. Každý prompt bol použitý dvakrát: najprv so šumom a potom bez šumu, t.j. s prirodzenými váhaniami l’udskej reči. Niekedy, ak je v tabul’ke uvedené, prompt umožňoval zamiešat’ alebo vynechat’ niektoré časti adresy (entity).

Ciel’om bolo dosiahnut’ viac ako 90% presnost’ na reálnych testovacích dátach. Presnost’ predikcie modelu sa so systematickým generovaním údajov neustále zvyšovala. Finálne bol celý súbor údajov zduplikovaný tak, že duplicity reflektovali text s použitím len malých písmen, nakol’ko využitý predtrénovaný model je citlivý na malé a vel’ké písmená a niektoré testovacie pozorovania obsahovali názvy ulíc a obcí s malými písmenami. Vd’aka tomu sa model stal robustnejším voči forme, v ktorej dostáva vstup, a dosiahol konečnú presnost’ 93,06%. Matica zámen najlepšieho (finálneho) modelu je zobrazená v Tabul’ke 5.

Tabul’ka 4: Matica zámen modelu natrénovaného na súbore dát z prvej iterácie, ktorá dosiahla predikčnú presnost’ modelu 67, 51 %.
Tabul’ka 5: Matica zámen konečného modelu s presnost’ou 93,06%. Porovnanı́m výsledkov s výsledkami v Tabul’ke 4 vidı́me, že presnost’ sa zvýšila o 25,55%.

V predikciách sa stále vyskytujú niektoré chyby; najmä tokeny, ktoré majú byt’ identifikované ako O, sú občas nesprávne klasifikované ako Obec. Týmto problémom sme sa d’alej nezaoberali, pretože sa vyskytuje pri slovách, ktoré sa môžu podobat’ na časti názvov entít, ale v skutočnosti nepredstavujú samotné entity. Príklad je zobrazený v Tabul’ke 6.

Tabul’ka 6: Prı́klady predikciı́ konečného modelu pre dve testovacie vety. Prvá veta obsahuje jeden nesprávne klasifikovaný token: tretı́ token ,,Kal” s anotáciou O bol klasifikovaný ako B-Obec. K ne- správnej klasifikácii “Kal” ako obce došlo v dôsledku jeho podobnosti s podslovami nachádzajúcimi sa v slove “Kalša”. Druhá veta má všetky svoje tokeny klasifikované správne.

ZÁVER

V tejto štúdii bol natrénovaný NER model postavený na predtrénovanom LLM modeli SlovakBERT. Model bol natrénovaný výlučne na umelo vygenerovanom súbore dát. Finálne syntentické trénovacie dáta boli reprezentatívne a kvalitné, vd’aka ich iteratívnemu rozširovaniu. Spolu s dolad’ovaním hyperparametrov tento iteratívny prístup umožnuje dosiahnut’ predikčnú presnost’ na reálnom dátovom súbore, presahujúcu 90%. Prezentovaný prístup naznačuje vysoký potenciál používania výlučne synteticky generovaných dát a to najmä v prípadoch, ked’ množstvo reálnych údajov nie je dostatočné na trénovanie.

Získaný model je možné využit’ v reálnych aplikáciách slúžiacich na extrakciu a overenie správnosti adries, získaných mechanizmami prevodu reči na text. V prípade, že je k dispozícii väčší súbor reálnych dát, odporúčame model pretrénovat’ a prípadne aj rozšírit’ syntetický súbor dát o d’alšie generované údaje, pretože existujúci súbor nemusí reprezentovat’ potenciálne nové vzory v týchto nových, reálnych dátach.
Model je dostupný na https://huggingface.co/nettle-ai/slovakbert-address-ner

POĎAKOVANIE

Výskum bol realizovaný s podporou Národného kompetenčného centra pre HPC, projektu EuroCC 2 a Národného Superpočítačového Centra na základe dohody o grante 101101903-EuroCC 2-DIGITAL-EUROHPC-JU-2022-NCC-01. Výskum (alebo jeho čast’) bol realizovaný s využitím výpočtovej infraštruktúry obstaranej v projekte Národné kompetenčné centrum pre vysokovýkonné počítanie (kód projektu: 311070AKF2) financovaného z Európskeho fondu regionálneho rozvoja, Štrukturálnych fondov EÚ Informatizácia spoločnosti, operačného programu Integrovaná infraštruktúra 2014-2020.

AUTORI

Bibiána Lajčinová – Národné superpočítačové centrum

Patrik Valábek – Národné superpočítačové centrum, Ústav informatizácie, automatizácie a matematiky, Slovenská technická univerzita v Bratislave

Michal Spišiak – nettle, s. r. o.

Plná verzia článku SK
Plná verzia článku EN

Zdroje:

[1] Matús Pikuliak, Stefan Grivalsky, Martin Konopka, Miroslav Blsták, Martin Tamajka, Viktor Bachratý, Marián Simko, Pavol Balázik, Michal Trnka, and Filip Uhlárik. Slovakbert: Slovak masked language model. CoRR, abs/2109.15254, 2021.

[2] Lance Ramshaw and Mitch Marcus. Text chunking using transformation-based learning. In Third Workshop on Very Large Corpora, 1995.

[3] Ministerstvo vnútra Slovenskej republiky. Register adries. https://data.gov.sk/dataset/register-adries-register-ulic. Accessed: August 21, 2023.

[4] Ivan Agarský. Hugging face model hub. https://huggingface.co/crabz/distil-slovakbert, 2022. Accessed: September 15, 2023.


Klasifikácia intentov pre bankové chatboty pomocou veľkých jazykových modelov 12 sep - Tento článok hodnotí použitie veľkých jazykových modelov na klasifikáciu intentov v chatbote s preddefinovanými odpoveďami, určenom pre webové stránky bankového sektora. Zameriavame sa na efektivitu modelu SlovakBERT a porovnávame ho s použitím multilingválnych generatívnych modelov, ako sú Llama 8b instruct a Gemma 7b instruct, v ich predtrénovaných aj fine-tunovaných verziách. Výsledky naznačujú, že SlovakBERT dosahuje lepšie výsledky než ostatné modely, a to v presnosti klasifikácie ako aj v miere falošne pozitívnych predikcií.
Využitie veľkých jazykových modelov na efektívnu analýzu náboženských textov 5 aug - Analýza a štúdium textov s náboženskými témami boli historicky doménou filozofov, teológov a ďalších špecialistov v sociálnych vedách. S príchodom umelej inteligencie, konkrétne veľkých jazykových modelov, naberá výskum v tejto oblasti nové dimenzie. Tieto moderné technológie môžu byť využité na odhaľovanie skrytých nuáns v náboženských textoch, čím umožňujú hlbšie pochopenie rôznych symbolizmov a odhalenie významov, ktoré sú pre tieto texty charakteristické a môžu byť nejasné. Takéto zrýchlenie analytického procesu umožňuje výskumníkom sústrediť sa len na špecifické aspekty textu relevantné pre ich výskum.
Mapovanie polohy a výšky stromov v PointCloud dátach získaných pomocou LiDAR technológie 25 júl - Cieľom spolupráce medzi Národným superpočítačovým centrom (NSCC) a firmou SKYMOVE, v rámci projektu Národného kompetenčného centra pre HPC, bol návrh a implementácia pilotného softvérového riešenia pre spracovanie dát získaných technológiou LiDAR (Light Detection and Ranging) umiestnených na dronoch.
Kategórie
Všeobecné

Nová výzva pre slovenskú vedeckú komunitu: prístup k superpočítaču Leonardo

Nová výzva pre slovenskú vedeckú komunitu: prístup k superpočítaču Leonardo

Konzorcium Leonardo, ktoré tvorí šesť európskych krajín na čele s Talianskom, obstaralo a v novembri 2022 uviedlo do prevádzkymomentálne šiesty najvýkonnejší superpočítač na svete. Slovensko, ako jeden z členov konzorcia, poskytuje prostredníctvom Výpočtového strediska Slovenskej Akadémie Vied projektu svoje odborné znalosti v oblasti HPC a komunitám používateľov technickú a inžiniersku podporu na vysokej úrovni. Slovenskí používatelia majú vďaka tomu jedinečnú možnosť zapojiť sa do národnej výzvy a získať prístup na systém Leonardo.

Superpočítač Leonardo má výkon približne 250 PFlop/s, pričom celková alokácia dostupná pre slovenské projekty je 56 000 GPU nód-hodín a 25 000 CPU nód-hodín ročne.  Výpočtové stredisko SAV preto v spolupráci s Národným superpočítačovým centrom otvára prvú výzvu na podávanie žiadostí o prístup k výpočtovým kapacitám Leonardo. Vzhľadom na veľkosť alokácie bude podporený menší počet projektov a to predovšetkým takých, ktoré vyžadujú simultánne využitie veľkého počtu výpočtových uzlov.

Prístup je otvorený pre všetky oblasti vedy a výskumu, oprávnenými sú žiadatelia zo slovenských verejných vysokých škôl alebo ústavov SAV. Podporené projekty by mali umožniť pokrok a inovácie v zvolenej oblasti s pridanou hodnotou pre riešenia spoločenských a/alebo technologických výziev na Slovensku.

Aplikácie používané v projektoch by mali byť otestované, s preukázanou vysokou efektivitou a škálovateľnosťou na HPC systémoch alebo potrebou rozsiahleho súboru simulácií, ktoré vyžadujú veľké množstvo CPU/GPU času. Malo by ísť o vysoko paralelizované aplikácie schopné efektívne využiť dostupné zdroje, ktorých alokácia by bola problematická na súčasnej národnej HPC infraštruktúre (HPC systém Devana). Potreba výpočtového výkonu a využitie zdrojov musia byť v návrhu jasne a podrobne opísané. Špecifikáciu jednotlivých Leonardo modulov nájdete TU.

Výzva je otvorená do 31.1. 2024. Vyhodnotenie a vybrané projekty budú zverejnené dva týždne po uzávierke, úspešní riešitelia budú o ďalšom postupe informovaní mailom. Jednotlivé projekty budú hodnotené odborným personálom VS SAV a NSCC s ohľadom na vedecký prínos a čo najefektívnejšie využitie výpočtových kapacít. Projekty s maximálnou dĺžkou trvania 12 mesiacov je možné podať prostredníctvom používateľského portálu register.nscc.sk. Po registrácii je potrebné vyplniť formulár v sekcii Projekt/ Leonardo projekt.

Pred podaním žiadosti prosíme záujemcov o dôkladné oboznámenie sa s podmienkami tejto výzvy.

V prípade otázok alebo nejasností nás prosím kontaktujte na eurocc@nscc.sk.


Odborná konferencia Superpočítač a Slovensko v Bratislave 15 nov - Dňa 14. novembra 2024 sa v hoteli Devín v Bratislave uskutočnila odborná konferencia s názvom Superpočítač a Slovensko, ktorú zorganizovalo Ministerstvo investícií, regionálneho rozvoja a informatizácie SR. Konferencia sa zameriavala na aktuálne trendy a vývoj v oblasti vysokorýchlostného počítania na Slovensku. Súčasťou podujatia bola prezentácia L. Demovičovej z Národného kompetenčného centra pre HPC.
Konferencia vysokovýkonného počítania v Portugalsku 12 nov - V poradí 4. Stretnutie vysokovýkonného počítania 2024, ktoré sa konalo 5. a 6. novembra na Univerzite Beira Interior v Covilhã, sa etablovalo ako kľúčové stretnutie používateľov, technikov a partnerov ekosystému vysokovýkonného počítania v Portugalsku.
REGISTRÁCIA OTVORENÁ: Nová séria populárno-náučných prednášok o zaujímavých HPC aplikáciách 6 okt - Otvorili sme registráciu na sériu prednášok v zimnom semestri 2024, kde sa budeme venovať fascinujúcim témam, v ktorých vysokovýkonné počítanie zohráva kľúčovú úlohu. Tento semester sa zameriame na oblasti ako meteorológia, klimatológia, chémia, veľké jazykové modely a mnoho ďalších.
Kategórie
Calls-Finished

Superpočítač Leonardo pre slovenskú vedeckú komunitu

Superpočítač Leonardo pre slovenskú vedeckú komunitu

Konzorcium Leonardo, ktoré tvorí šesť európskych krajín na čele s Talianskom, obstaralo a v novembri 2022 uviedlo do prevádzkymomentálne šiesty najvýkonnejší superpočítač na svete. Slovensko, ako jeden z členov konzorcia, poskytuje prostredníctvom Výpočtového strediska Slovenskej akadémie vied projektu svoje odborné znalosti v oblasti HPC a komunitám používateľov technickú a inžiniersku podporu na vysokej úrovni. Slovenskí používatelia majú vďaka tomu jedinečnú možnosť zapojiť sa do národnej výzvy a získať prístup na systém Leonardo.

Superpočítač Leonardo má výkon približne 250 PFlop/s, pričom celková alokácia dostupná pre slovenské projekty je 56 000 GPU nód-hodín a 25 000 CPU nód-hodín ročne.  Výpočtové stredisko SAV preto v spolupráci s Národným superpočítačovým centrom otvára prvú výzvu na podávanie žiadostí o prístup k výpočtovým kapacitám Leonardo. Vzhľadom na veľkosť alokácie bude podporený menší počet projektov a to predovšetkým takých, ktoré vyžadujú simultánne využitie veľkého počtu výpočtových uzlov.

Prístup je otvorený pre všetky oblasti vedy a výskumu, oprávnenými sú žiadatelia zo slovenských verejných vysokých škôl alebo ústavov SAV. Podporené projekty by mali umožniť pokrok a inovácie v zvolenej oblasti s pridanou hodnotou pre riešenia spoločenských a/alebo technologických výziev na Slovensku.

Aplikácie používané v projektoch by mali byť otestované, s preukázanou vysokou efektivitou a škálovateľnosťou na HPC systémoch alebo potrebou rozsiahleho súboru simulácií, ktoré vyžadujú veľké množstvo CPU/GPU času. Malo by ísť o vysoko paralelizované aplikácie schopné efektívne využiť dostupné zdroje, ktorých alokácia by bola problematická na súčasnej národnej HPC infraštruktúre (HPC systém Devana). Potreba výpočtového výkonu a využitie zdrojov musia byť v návrhu jasne a podrobne opísané. Špecifikáciu jednotlivých Leonardo modulov nájdete TU.

Výzva je otvorená do 31.1. 2024. Vyhodnotenie a vybrané projekty budú zverejnené dva týždne po uzávierke, úspešní riešitelia budú o ďalšom postupe informovaní mailom. Jednotlivé projekty budú hodnotené odborným personálom VS SAV a NSCC s ohľadom na vedecký prínos a čo najefektívnejšie využitie výpočtových kapacít. Projekty s maximálnou dĺžkou trvania 12 mesiacov je možné podať prostredníctvom používateľského portálu register.nscc.sk. Po registrácii je potrebné vyplniť formulár v sekcii Projekty / Leonardo projekt.

Pred podaním žiadosti prosíme záujemcov o dôkladné oboznámenie sa s podmienkami tejto výzvy.

V prípade otázok alebo nejasností nás prosím kontaktujte na eurocc@nscc.sk.