Devana: Výzva na podávanie projektov pre štandardný prístup k HPC 1/24
Výpočtové stredisko SAV a Národné superpočítačové centrum otvárujú prvú tohtoročnú Výzvu na podávanie projektov pre štandardný prístup k HPC 1/24. Projekty je možné podávať kontinuálne, pričom počas roka sú štandardne 3 termíny uzávierky, po ktorej sa uskutoční hodnotenie dovtedy podaných žiadostí. O prístup je možné požiadať výhradne prostredníctvom používateľského portálu register.nscc.sk.
Štandardný prístup k vysokovýkonným výpočtovým prostriedkom je otvorený pre všetky oblasti vedy a výskumu a to predovšetkým pre projekty väčšieho rozsahu. Tieto projekty by mali preukázať excelentnosť v danej oblasti a jasný potenciál priniesť inovatívne riešenia súčasných spoločenských a technologických výziev. V žiadosti je potrebné demonštrovať efektívnosť a škálovateľnosť navrhovaných výpočtových postupov a metód v HPC prostredí. Potrebné dáta o výkone a parametroch zvažovaných algoritmov a aplikácií je možné získať v rámci Prístupu pre testovanie a benchmarking.
Alokácie sa udeľujú na jeden (1) rok s možnosťou požiadať o pokračovanie, ak je to potrebné. Prístup je bezplatný za predpokladu splnenia všetkých náležitostí definovaných v Podmienkach výzvy. Podané projekty vyhodnocuje po technickej stránke interný tím VS SAV a NSCC a kvalitu vedecko-výskumnej časti hodnotia vždy dvaja nezávislí externí hodnotitelia.
Dátum otvorenia výzvy: 4.1.2024 Uzávierky pre žiadosti: 31.1. 2024, 17:00 CET Termín pre notifikácie o vyhodnotení projektu: Do 2 týždňov od uzávierky. Termín začiatku čerpania pridelenej alokácie: najneskôr 15. 2. 2024
Oprávnení žiadatelia: O štandardný prístup k HPC môžu žiadať vedci a výskumníci zo slovenských verejných vysokých škôl a Slovenskej akadémie vied, ako aj z organizácií verejnej a štátnej správy a súkromných podnikov registrovaných v Slovenskej republike. Prístup je poskytovaný výhradne pre civilný a nekomerčný open-science výskum a vývoj. Záujemcovia zo súkromných spoločností musia najskôr kontaktovať Národné kompetenčné centrum pre HPC.
Dostupné systémy:HPC systém Devana, univerzálny CPU modul a akcelerovaný GPU modul
Očakávané výstupy projektov:
záverečná správa do 2 mesiacov od ukončenia projektu (bez predĺženia)
peer-review a iné publikácie v domácich a zahraničných vedeckých periodikách s uvedením poďakovania v predpísanom znení reportované prostredníctvom používateľského portálu
aktívna účasť na slovenskej HPC konferencii organizovanej koordinátorom tejto výzvy (poster, iný príspevok)
v prípade oslovenia koordinátorom tejto výzvy informácia o realizovanom projekte (interview, článok do HPC časopisu a iné)
Ste vedec či vývojár zaoberajúci sa HPC aplikáciami? Máte záujem o vývoj, optimalizáciu či testovanie aplikácii na systémoch EuroHPC Pre-exascale a/alebo Petascale? Využite skvelú možnosť získať prístup k Pre-exascale či Petascale systémom. Žiadosti je možné podať kedykoľvek keďže výzva je otvorená kontinuálne.
Prístup je zabezpečený do dvoch týždňov od termínu na podanie žiadosti (termíny na podávanie žiadostí sú určené spravidla raz mesačne). Hodnotenie podaných projektov sa uskutoční vo fixnom termíne v mesačných intervaloch. Ciele jednotlivých režimov prístupu v rámci tejto výzvy sú:
Výzva pre prístup za účelom testovania je určená primárne na testovanie škálovania programov, pričom výsledok bude následne východiskom v budúcej žiadosti o prístup EuroHPC Extreme Scale a Regular. Používateľom sa pridelí určitý strojový čas s prístupom obmedzeným na 3 mesiace.
Výzva pre prístup za účelom vývoja softvéru je určená najmä pre projekty vývoja programov, algoritmov a ich optimalizáciu. Podané projekty môžu súvisieť s výskumnými projektami z akadémie alebo priemyslu, či byť súčasťou väčších iniciatív ako sú napríklad CoEs alebo Kompetenčné centrá. Používatľovi sa pridelí obmedzený strojový čas s prístupom na jeden rok a s možnosťou predĺženia.
V rôznych termínoch sa prideľuje prístup k rôznym výpočtovým prostriedkom. Rozsah prístupu v jednotlivých obdobiach bude zverejnený vopred. Momentálne je možné získať prístup na nový VEGA systém v Slovinsku.
Detekcia anomálií v časových radoch: prevencia gamblingu pomocou hlbokého učenia
Prevencia gamblingu u hráčov online kasín je výzvou, so zjavne pozitívnym dopadom nielen na bežný život hráčov, ale aj na prevádzkovateľov kasín, ktorých úmyslom je sprostredkovať zodpovedné hranie. Na dosiahnutie týchto cieľov sme použili metódy hlbokého učenia „bez učiteľa“ (z angl. „unsupervised learning“), ktoré dokážu identifikovať hráčov vykazujúcich známky problémového hráčstva, s využitím dostupných dát vo forme časových radov. Prezentujeme porovnanie nami navrhnutej architektúry autoenkódera založenej na transformeroch s rekurentnými a konvolučnými autoenkódermi, s dôrazom na výhody tejto architektúry v detekcii anomálií. Keďže klinická diagnóza hráčov nebola v dostupných dátach k dispozícii, výsledky našej štúdie vyhodnocujeme analyzovaním „skóre anomálie“ získaného z autoenkódera a niekoľkých pomocných ukazovateľov, ktoré sú v literatúre často spomínané ako symptómy problémového hráčstva.
Patologické hranie hier je definované ako problémové správanie, kedy osoba opakovane staví objekt určitej hodnoty (najčastejšie peniaze) za účelom výhry, ale s neurčitým výsledkom [1], [2]. Bolo tiež odhalených mnoho podobností medzi problémovým gamblingom a závislosťami na omamných látkach [3]. S prístupnosťou internetu sa zvýšil aj výskyt patologického hráčstva. Toto správanie má často negatívny dopad nielen na život dotknutých jednotlivcov, ale aj ich rodiny. Práve preto je včasná detekcia známok patologického hráčstva kľúčová nielen pre zachovanie duševného zdravia, ale aj finančnej situácie ovplyvnených osôb. Táto práca vznikla ako spolupráca Národného kompetenčného centra pre vysokovýkonné počítanie, spoločnosti DOXXbet s.r.o. (športové tipovanie a online kasíno) a spoločnosti Codium s.r.o. (vývoj softvérovej platformy športové tipovanie a iGaming-u pre DOXXbet, s.r.o.), s cieľom zlepšenia služieb zákazníkom a prevencie patologického hráčstva. Tento „proof of concept“ projekt je základom pre ďalší vývoj nástrojov, ktoré pomôžu poskytovateľovi zmierniť dopad negatívnych následkov problémového hráčstva na životy hráčov, aj za cenu zníženia príjmov, čo je v súlade s aktuálnymi európskymi trendmi v risk manažmente online hazardných hier.
V našej práci sme použili prístup učenia „bez učiteľa“ s využitím neurónovej AE siete založenej na transformeroch za účelom detekcie anomálií. Predpokladáme, že dáta patologických hráčov, ktorých by (štatisticky) medzi všetkými hráčmi malo byť medzi 0.5 až 5%, vykazujú anomálie, nie nutne naopak. Dátová sada, ktorú používame, neobsahuje klinickú diagnózu hráčov a spomedzi pomocných ukazovateľov spomenutých vyššie sa v dátach nachádzajú len niektoré – žiadosti o zvýšenie limitu vkladov, doháňanie strát intenzívnejším hraním (ďalej budeme tento indikátor označovať „epizódy naháňania straty“), používanie viacerých platobných metód, časté výbery malých finančných obnosov a ďalšie, ktoré budú spomenuté neskôr. Nakoľko nie všetci hráči, ktorí preukážu anomálne správanie musia byť patologickými hráčmi, boli pomocné ukazovatele použité v kombinácii so „skóre anomálie“, získaného ako výstup z AE.
DÁTA
Dáta použité v tejto štúdii sú sekvenciami pozorovaní zbieraných v čase, monitorujúce viaceré aspekty hráčskeho správania ako frekvencia a časy hier, frekvencia a výška peňažných vkladov, platobné metódy použité pri peňažných vkladoch, informácie o výške stávok, výhier, strát, výberoch a taktiež početnosť žiadostí o zmenu limitu pre výšku vkladov. Z týchto dát bolo extrahovaných 19 prvkov deskriptora vo forme časových radov (ČR). Každý prvok deskriptora pozostáva z viacerých hodnôt, ktoré sú chronologicky usporiadané. Tieto príznaky sú pre zrozumiteľnosť klasifikované do troch kategórií – „čas“, „peniaze“ a „zúfalstvo“, inšpirované autormi Seth a kol. [4]. Každý prvok deskriptora je sekvenciou N hodnôt, pričom každá hodnota predstavuje jedno z N po sebe idúcich časových okien. Každá takáto hodnota bola získaná agregáciou denných dát v príslušnom časovom okne, pričom dĺžka časového okna bola v rozmedzí od 15 dní až po 3 mesiace. Časové okno bolo v niektorých prípadoch pohyblivé, v iných nie. Pre každé pozorovanie teda potrebujeme dáta z N časových okien a zvolená hodnota N po sérii experimentov bola 8 . Celý proces extrakcie premenných je zobrazený na Obrázku 1, finálny tvar dát na Obrázku 2.
Architektúra modelu neurónovej siete
Autoenkóder je metóda hlbokého učenia „bez učiteľa“ vhodná na detekciu anomálií v ČR. Myšlienka použitia tohto typu neurónovej siete na detekciu anomálií je založená na rekonštrukčnej schopnosti modelu. AE sa naučí rekonštruovať dáta v trénovacej sade a keďže trénovacia sada by ideálne mala obsahovať len „normálne“ pozorovania, model sa naučí správne rekonštruovať len takéto pozorovania. Preto keď je vstupné pozorovanie anomálne, natrénovaný AE model nedokáže tento vstup zrekonštruovať dostatočne správne, čo má za následok vysokú rekonštrukčnú chybu. Táto rekonštrukčná chyba môže byť použitá ako skóre anomálie daného pozorovania, pričom vyššie skóre znamená väčšiu pravdepodobnosť, že pozorovanie sa vymyká všeobecnému trendu.
V štúdii sme natrénovali AE model na báze transformerov, kde enkóder aj dekóder obsahujú vrstvu nazývanú „Multi Head Attention“ so štyrmi „hlavami“ a 32-dimenzionálnymi vektormi kľúčov a hodnôt. Za touto vrstvou nasleduje klasická neurónová sieť s tzv. „dropout“ vrstvami a reziduálnymi spojeniami. Celý AE model má niečo málo viac než 100k trénovateľných parametrov.
Rekonštrukčná chyba a predikčná schopnosť
Na vyhodnotenie stability modelov sme uskutočnili 3-násobnú krížovú validáciu. Výsledná priemerná strata na trénovacej množine je 0.010, na validačnej 0.012 a na testovacej 0.015. Strata na testovacej množine je vyššia než tá na trénovacej alebo validačnej množine, čo je spôsobené tým, že 211 anomálnych pozorovaní bolo presunutých do testovacej množiny. Bez presunu týchto pozorovaní by bola strata na testovacej množine 0.012. Výkon modelu je prezentovaný na Obrázku 3 vo forme histogramu hodnoty stratovej funkcie. Histogram má „ťažký pravý chvost“, čo je očakávané pre dátové sady obsahujúce anomálie.
Na demonštráciu kvality rekonštrukcie ČR sú na obrázku Obrázku 4 znázornené pôvodné (modrá čiara) a predikované (červená čiara) hodnoty pre náhodne vybrané anomálne pozorovanie jedného hráča. Hodnota skóre anomálie pre príslušné modely je uvedená v nadpise grafov.
Výsledky
Nakoľko nebola klinická diagnóza súčasťou dát, ktorými sme disponovali, môžeme sa pri identifikácii hráčov s potenciálne problémovým hráčstvom spoliehať len na pomocné ukazovatele. K tejto úlohe sme pristúpili tak, že síce detegujeme anomálie v dátach, ale sme si vedomí toho, že nie všetky anomálie musia indikovať problém s gamblingom. Preto budeme korelovať výsledky AE modelu s týmito pomocnými ukazovateľmi:
Priemerný počet prihlásení v časovom okne.
Priemerný počet výberov v časovom okne.
Priemerný počet malých a častých výberov v časovom okne.
Priemerný počet žiadostí o zmenu limitu výšky vkladov v časovom okne.
Celkový počet epizód naháňania straty v období N časových okien.
Na Obrázku 5 je zobrazená korelácia skóre anomálie s horeuvedenými pomocnými ukazovateľmi. Každý z grafov obsahuje desať stĺpcov, pričom každý stĺpec reprezentuje jeden decil pozorovaní (t. j. každý stĺpec zobrazuje 10% pozorovaní zoradených podľa hodnoty skóre anomálie). Farby stĺpcov prestavujú hodnotu, resp. kategóriu príslušného pomocného ukazovateľa.
Na každom grafe je možné pozorovať zreteľné vzorce v správaní hráčov – hráči s vysokou hodnotou skóre anomálie majú tendenciu mať tiež vysoké hodnoty všetkých skúmaných pomocných ukazovateľov. Vysoká frekvencia prihlásení do online kasína je úmerná vysokému skóre anomálie, pričom viac než polovica hráčov v poslednom decile rekonštrukčnej chyby má priemerný počet prihlásení v časovom okne väčší než 50. Niečo podobné pozorujeme aj pre priemerný počet výberov v časovom okne. Hráči s nízkou hodnotou skóre nemajú žiadny, alebo majú veľmi malý priemerný počet výberov a zároveň viac než štvrtina hráčov v poslednom decile skóre má v priemere až dva a viac výberov v časovom okne. Ďalším skúmaným pomocným ukazovateľom je počet malých a častých výberov. Väčšina hráčov, ktorí majú v histórii aspoň jednu takúto udalosť, sú v 10% hráčov s najvyšším MSE. Pri analýze ďalšieho ukazovateľa, konkrétne počtu žiadostí o zmenu limitu vkladu, pozorujeme už menej výrazný trend. Je evidentné, že hráči v prvých piatich deciloch nemajú vo všeobecnosti žiadne zmeny limitu výberov (až na pár výnimiek), čím však skóre anomálie rastie, tým sa frekvencia zmeny limitu výberov u hráčov zvyšuje. Posledným pomocným ukazovateľom zobrazeným na grafoch je počet epizód naháňania straty. Opäť môžeme pozorovať zvyšujúcu sa frekvenciu týchto udalostí úmernú skóre anomálie. Viac než polovica hráčov v poslednom decile má aspoň jednu takúto epizódu v časovom okne.
Ak vykonáme superpozíciu týchto grafov za účelom zistenia, aký podiel hráčov spĺňa viacero pomocných ukazovateľov, dospejeme k nasledovnému pozorovaniu: 98.6% hráčov v posledných piatich percentiloch skóre anomálie spĺňa aspoň jeden pomocný ukazovateľ a 77.3% spĺňa aspoň tri ukazovatele. Analýzou správania hráčov v posledných dvoch percentiloch skóre anomálie zisťujeme, že takmer 90% z nich spĺňa aspoň tri ukazovatele. Hranice, ktoré boli použité na výpočet týchto podielov sú: >=1 epizóda naháňania straty, >=1 žiadosť o zmenu limitu, >=1 malý a častý výber, >=31 prihlásení a >=1.25 výberu v priemere počas jedného časového okna.
Záver
V práci sme úspešne aplikovali model autoenkódera (AE) založený na transformeroch na problém detekcie anomálií v dátovej sade hráčov online kasína. Cieľom bolo detegovať hráčov s patologickým hráčstvom metódami „bez učiteľa“. Zo vstupných dát bolo odvodených 19 prvkov deskriptora vo forme časových radov, ktoré odrážajú správanie hráčov v kontexte „času“, „peňazí“ a „zúfalstva“. Porovnali sme detekčnú schopnosť tejto architektúry s ďalšími troma AE architektúrami založenými na LSTM a konvolučných vrstvách, pričom sme zistili, že architektúra modelu založená na transformeroch dosiahla najlepšie výsledky zo všetkých skúmaných modelov v zmysle najlepšej rekonštrukčnej schopnosti. Výsledky tohto modelu tiež vykazujú vysokú koreláciu s pomocnými ukazovateľmi ako počet prihlásení hráča, počet výberov, počet epizód naháňania straty a ďalšími, ktoré sú často spomínané v literatúre vo vzťahu k patologickému hraniu.Tento súlad ”skóre anomálie”, ktoré odráža pravdepodobnosť, že dané pozorovanie sa vymyká priemeru, s pomocnými ukazovateľmi nám dovoľuje porozumieť modelu a jeho efektívnosti v detekcii hráčov s potenciálnym patologickým hráčstvom. Aj keď tieto pomocné ukazovatele boli použité ako prediktory v modeli, navrhujeme ich používať spolu s rekonštrukčnou chybou pri detekcii potenciálne problémových hráčov, aby sa redukovala falošná pozitivita predikcií, nakoľko nie všetky anomálie musia byť spojené s patologickým hráčstvom.
[1] Alex Blaszczynski and Lia Nower. “A Pathways Model of Problem and Pathological Gambling”. In: Addiction (Abingdon, England) 97 (June 2002), pp. 487–99. doi: 10.1046/j.1360-0443.2002.00015.x.
[2] National Research Council. Pathological Gambling: A Critical Review. Washington, DC: The National Academies Press, 1999. isbn: 978-0-309-06571-9. doi: 10 . 17226 / 6329. url: https ://nap .nationalacademies.org/catalog/6329/pathological – gambling – a – critical -review.
[3] Luke Clark et al. “Pathological Choice: The Neuroscience of Gambling and Gambling Addiction”. In: Journal of Neuroscience 33.45 (2013), pp. 17617–17623. issn: 0270-6474. doi: 0.1523/JNEUROSCI.3231-13.2013.eprint: https : / / www . jneurosci . org /content / 33 / 45 / 17617 . full . pdf. url: https://www.jneurosci.org/content/33/45/17617.
[4] Deepanshi Seth et al. “A Deep Learning Framework for Ensuring Responsible Play in Skill-based Cash Gaming”. In: 2020 19th IEEE International Conference on Machine Learning and Applications (ICMLA) (2020), pp. 454–459.
Klasifikácia intentov pre bankové chatboty pomocou veľkých jazykových modelov12 sep-Tento článok hodnotí použitie veľkých jazykových modelov na klasifikáciu intentov v chatbote s preddefinovanými odpoveďami, určenom pre webové stránky bankového sektora. Zameriavame sa na efektivitu modelu SlovakBERT a porovnávame ho s použitím multilingválnych generatívnych modelov, ako sú Llama 8b instruct a Gemma 7b instruct, v ich predtrénovaných aj fine-tunovaných verziách. Výsledky naznačujú, že SlovakBERT dosahuje lepšie výsledky než ostatné modely, a to v presnosti klasifikácie ako aj v miere falošne pozitívnych predikcií.
Využitie veľkých jazykových modelov na efektívnu analýzu náboženských textov5 aug-Analýza a štúdium textov s náboženskými témami boli historicky doménou filozofov, teológov a ďalších špecialistov v sociálnych vedách. S príchodom umelej inteligencie, konkrétne veľkých jazykových modelov, naberá výskum v tejto oblasti nové dimenzie. Tieto moderné technológie môžu byť využité na odhaľovanie skrytých nuáns v náboženských textoch, čím umožňujú hlbšie pochopenie rôznych symbolizmov a odhalenie významov, ktoré sú pre tieto texty charakteristické a môžu byť nejasné. Takéto zrýchlenie analytického procesu umožňuje výskumníkom sústrediť sa len na špecifické aspekty textu relevantné pre ich výskum.
Mapovanie polohy a výšky stromov v PointCloud dátach získaných pomocou LiDAR technológie25 júl-Cieľom spolupráce medzi Národným superpočítačovým centrom (NSCC) a firmou SKYMOVE, v rámci projektu Národného kompetenčného centra pre HPC, bol návrh a implementácia pilotného softvérového riešenia pre spracovanie dát získaných technológiou LiDAR (Light Detection and Ranging) umiestnených na dronoch.
Pracovná skupina národných kompetenčných centier v strednej Európe
Zástupcovia národných kompetenčných centier pre HPC zo stredoeurópskeho regiónu sa 12. júna stretli na prvom stretnutí stredoeurópskej pracovnej skupiny NCC. Podujatie zorganizovali NCC Slovinsko a NCC Rakúsko v slovinskom Maribore, účasť bola možná aj online.
Na programe dňa boli 3 sekcie, ktoré sa týkali interakcie s priemyslom, vzdelávania a komunikácie. Účastníci pracovali v malých skupinách, diskutovali o konkrétnych bodoch a vymieňali si osvedčené postupy v rámci jednotlivých tém, ako sú stratégie onboardingu MSP, portfólio služieb a ako riešiť špecifické otázky štátnej pomoci, ako aj pravidlá spolupráce so súkromnými spoločnosťami.
Diskutovalo sa o formátoch školiacich podujatí s ohľadom na postpandemické trendy; boli vyzdvihnuté skúsenosti so spoluprácou medzi NCC a centrami excelentnosti a zdieľali sa aj rôzne stratégie prilákania účastníkov MSP na odborné kurzy.
Komunikačná sekcia bola zameraná na propagáciu a komunikačné kanály, budovanie publika pre rôzne témy a organizáciu tematicky zameraných webinárov. V každej sekcii sa diskutovalo aj o príležitostiach a ponukách na spoluprácu.
Podujatie bolo skvelou príležitosťou na zoznámenie sa s kolegami zo susedných NCC, neformálny networking, podporu spolupráce a nájdenie novej inšpirácie. Veľká vďaka organizátorom a tešíme sa na ďalšie stretnutie tohto formátu!
Privítajte Mistral-sk-7b!3 okt-Slovenská AI komunita sa po dlhom čase dočkala nového, tentoraz naozaj veľkého jazykového modelu pre slovenský jazyk.
NCC pre HPC na INOFESTe 2024: Festival inovácií v Žiline24 sep-V dňoch 17. a 18. septembra 2024 sa v Žiline uskutočnil už piaty ročník festivalu inovácií INOFEST 2024, ktorý zorganizovalo združenie INOVATO. Podujatie sa stalo jedinečnou platformou pre stretnutie odborníkov, podnikateľov, akademikov, inovátorov, študentov, zástupcov štátnej správy a verejnosti, čím posilnilo spoluprácu v oblasti regionálnych inovačných ekosystémov na Slovensku.
Klasifikácia intentov pre bankové chatboty pomocou veľkých jazykových modelov12 sep-Tento článok hodnotí použitie veľkých jazykových modelov na klasifikáciu intentov v chatbote s preddefinovanými odpoveďami, určenom pre webové stránky bankového sektora. Zameriavame sa na efektivitu modelu SlovakBERT a porovnávame ho s použitím multilingválnych generatívnych modelov, ako sú Llama 8b instruct a Gemma 7b instruct, v ich predtrénovaných aj fine-tunovaných verziách. Výsledky naznačujú, že SlovakBERT dosahuje lepšie výsledky než ostatné modely, a to v presnosti klasifikácie ako aj v miere falošne pozitívnych predikcií.
TREX CoE & NCCs collab / Code tuning for the exascale
Centrum excelentnosti TREX spolu s 3 národnými kompetenčnými centrami zorganizovalo trojdňový workshop „Ladenie kódu pre exascale“. NCC Slovensko, Rakúsko a Česká republika sa spojili, aby priniesli zaujímavý program vrátane pokročilého paralelného programovania, analýzy energetickej účinnosti a optimalizácie HPC aplikácií. Workshop sa konal v Bratislave v dňoch 5. – 7. júna 2023 a bol organizovaný prezenčnou formou.
Bol to výborný príklad spolupráce a podpory medzi kompetenčnými centrami a centrom excelentnosti. Program workshopu zahŕňal tri navzájom sa doplňujúce témy. Počas prvého dňa tím z rakúskeho NCC prezentoval pokročilé techniky paralelného programovania (MPI, OpenMP), na druhý deň nasledovala prezentácia vysoko aktuálnej témy energetickej efektívnosti v HPC zo strany českého NCC. Tretí deň patril TREX CoE, ktorý predstavil nástroj na analýzu výkonu HPC aplikácií a ich optimalizáciu s názvom MAQAO. Organizáciu, prístup k HPC a technickú podporu HPC zabezpečilo slovenské NKC.
Dúfame, že workshop splnil svoj účel a poskytol účastníkom informácie, nástroje, zručnosti a kompetencie, ktoré im pomôžu vyvíjať a efektívne používať vlastný softvér s využitím moderných HPC infraštruktúr.
Privítajte Mistral-sk-7b!3 okt-Slovenská AI komunita sa po dlhom čase dočkala nového, tentoraz naozaj veľkého jazykového modelu pre slovenský jazyk.
NCC pre HPC na INOFESTe 2024: Festival inovácií v Žiline24 sep-V dňoch 17. a 18. septembra 2024 sa v Žiline uskutočnil už piaty ročník festivalu inovácií INOFEST 2024, ktorý zorganizovalo združenie INOVATO. Podujatie sa stalo jedinečnou platformou pre stretnutie odborníkov, podnikateľov, akademikov, inovátorov, študentov, zástupcov štátnej správy a verejnosti, čím posilnilo spoluprácu v oblasti regionálnych inovačných ekosystémov na Slovensku.
Klasifikácia intentov pre bankové chatboty pomocou veľkých jazykových modelov12 sep-Tento článok hodnotí použitie veľkých jazykových modelov na klasifikáciu intentov v chatbote s preddefinovanými odpoveďami, určenom pre webové stránky bankového sektora. Zameriavame sa na efektivitu modelu SlovakBERT a porovnávame ho s použitím multilingválnych generatívnych modelov, ako sú Llama 8b instruct a Gemma 7b instruct, v ich predtrénovaných aj fine-tunovaných verziách. Výsledky naznačujú, že SlovakBERT dosahuje lepšie výsledky než ostatné modely, a to v presnosti klasifikácie ako aj v miere falošne pozitívnych predikcií.
10. novembra 2021 sa uskutočnila už štvrtá prednáška série Superpočítanie vo vede. Tentokrát sme privítali Dr. Dušana Bernáta z Fakulty matematiky, fyziky a informatiky Univerzity Komenského so zaujímavou prednáškou na tému Operačné systémy v multiprocesorových klastroch.
Účastníci získali prehľad o základných pojmoch a definíciách, ako operačný systém umožňuje a zabezpečuje prístup aplikácií a procesov k prostriedkom a ako tieto prostriedky spravuje. Dozvedeli sme sa viac o stavoch a zmenách stavu jednotlivých procesov. Zaujímavé boli aj informácie o tom, ako vyzerá politika a réžia plánovača (scheduler), ktorý prístup na CPU procesom prideľuje.
Obr. 1: Diagram stavu procesov
Z hľadiska vysokovýkonných výpočtových prostriedkov nás zaujíma, ako funguje OS v prostredí s mnohými procesormi. Zvyšovanie počtu procesorov je prirodzenou odpoveďou na rýchly nárast požiadaviek aplikácií a súčasne limitov zvyšovania výkonu jediného CPU. Operačný systém teda môže úlohy rozdeľovať medzi viaceré fyzické procesory (alebo jadrá), pričom tieto procesy sú nezávislé a môžu bežať súbežne. Programátori môžu využiť výhody viacerých procesorov a svoje úlohy rozdeliť na viacero súbežných podúloh. Tieto už ale nie sú nezávislé a väčšinou je potrebné, aby medzi sebou navzájom komunikovali. Jedna úloha – proces môže mať teda viacero samostatných tokov riadenia, ktoré nazývame vlákna (threads) a ktoré zdieľajú väčšinu prostriedkov tohto procesu, vrátane pamäte. Z pohľadu architektúry to môže vyzerať ako na obrázku ilustrujúcom schému symetrického multiprocesorového systému (Obr. 2), kde je jedna pamäť zdieľaná viacerými rovnocennými procesormi (architektúra UMA – Uniform Memory Access). Tu je potrebné ošetriť synchronizáciu prístupu k tejto spoločnej pamäti, čo je možné urobiť viacerými spôsobmi. Prístup SMP – symetrického multiprocesingu má však nevýhody ako zlá škálovateľnosť, čakanie pri synchronizácii, tzv. cache trashing.
Obr. 2: Symetrický multiprocesorový systém
Ak fyzickú pamäť rozdelíme na viaceré moduly, dosiahneme menšie zaťaženie zbernice, pretože procesory budú najviac využívať vlastnú lokálnu pamäť. Tento prístup poznáme ako NUMA – Non-Uniform Memory Access. Tu je najvýhodnejšie, ak OS alokuje úlohe pamäť pre dáta čo najbližšie k procesoru, na ktorom úloha beží. Na obrázku vidíme príklad prepojenia 4 procesorov:
Obr. 3: Ukážka 4 procesorového point-to-point prepojenia, konfigurácie typickej pre NUMA
Prednáška pokryla aj tému správy pamäte, virtuálnu pamäť a jej alokáciu – vrátane konceptu overcommit a tému súborového systému a jeho hierarchie.
Operačné systémy a ich fungovanie v HPC prostredí by si určite zaslúžili aj viac priestoru, ako náš formát môže poskytnúť. Ak vás téma zaujala, na Fakulte matematiky, fyziky a informatiky UK na túto tému prednáša práve Dr. Dušan Bernát – a ak ste našu prednášku nestihli, môžete si ju pozrieť na Facebookovom profile alebo YouTube Centra spoločných činností SAV.
Privítajte Mistral-sk-7b!3 okt-Slovenská AI komunita sa po dlhom čase dočkala nového, tentoraz naozaj veľkého jazykového modelu pre slovenský jazyk.
NCC pre HPC na INOFESTe 2024: Festival inovácií v Žiline24 sep-V dňoch 17. a 18. septembra 2024 sa v Žiline uskutočnil už piaty ročník festivalu inovácií INOFEST 2024, ktorý zorganizovalo združenie INOVATO. Podujatie sa stalo jedinečnou platformou pre stretnutie odborníkov, podnikateľov, akademikov, inovátorov, študentov, zástupcov štátnej správy a verejnosti, čím posilnilo spoluprácu v oblasti regionálnych inovačných ekosystémov na Slovensku.
Klasifikácia intentov pre bankové chatboty pomocou veľkých jazykových modelov12 sep-Tento článok hodnotí použitie veľkých jazykových modelov na klasifikáciu intentov v chatbote s preddefinovanými odpoveďami, určenom pre webové stránky bankového sektora. Zameriavame sa na efektivitu modelu SlovakBERT a porovnávame ho s použitím multilingválnych generatívnych modelov, ako sú Llama 8b instruct a Gemma 7b instruct, v ich predtrénovaných aj fine-tunovaných verziách. Výsledky naznačujú, že SlovakBERT dosahuje lepšie výsledky než ostatné modely, a to v presnosti klasifikácie ako aj v miere falošne pozitívnych predikcií.
Štrnásta výzva na predkladanie žiadostí v rámci programu SHAPE
Typ: SHAPE prístup pre malé a stredné podniky
Otvorenie výzvy: 01/10/2021
Ukončenie: 15/11/2021 @ 17:00 Brussels Time
PRACE podporuje európsky biznis v adopcii HPC riešení. Špecificky malým a stredným podnikom ponúka výzva SHAPE príležitosť na:
Využitie HPC na inováciu biznisu.
Zvýšenie konkurencieschopnosti.
Využitie expertízy a vedomostí vyvinutých v rámci PRACE výskumnej infraštruktúry
V rámci štrnástejvýzvy programu PRACE SHAPE budú podporené zaujímavé projekty európskych malých a stredných podnikov, ktoré implementujú HPC riešenia s cieľom zvýšenia konkurencieschopnosti. SHAPE pomôže s adopciou HPC nástrojov a technológií do prostredia biznisu, prevádzky alebo produkčného procesu. Vybrané projekty by mali priniesť potenciálnu návratnosť investícií v malých a stredných podnikoch.
Ako prebieha SHAPE projekt?
Malé a stredné podniky môžu poslať vyplnenú žiadosť emailom na shape-application[at]prace-ri.eu. Formulár vo formáte Microsoft word nájdete TU. V prípade potreby vám v Národnom kompetenčnom centre vieme so žiadosťou pomôcť!
Žiadosti sú vyhodotené najmä na základe kvality návrhu a technickej uskutočniteľnosti. Úspešní riešitelia dostanú pridelený strojový čas v rámci PRACE a tiež budú môcť spolupracovať s PRACE expertom na návrhu a implementácii HPC riešenia. Riešitelia okrem svojich personálnych kapacít v projekte pomáhajú propagovať SHAPE program a spoločne s PRACE expertom vypracujú verejne dostupný report o riešenom projekte a jeho záveroch.
Experti z PRACE v programe SHAPE pracujú s vybranými malými a strednými podnikmi na vývoji ich riešení, poskytujú svoje vedomosti a skúsenosti, aby umožnili podnikom robiť informované rozhodnutia ohľadom navrhovaných HPC riešení.
Viac informácií o výzve a podávaní žiadostí nájdete priamo na stránke PRACE SHAPE.
Príďte sa s nami porozprávať o superpočítaní vo vede v neformálnej atmosfére pri kávičke! Pripravili sme si pre vás sériu zaujímavých popularizačno-vzdelávacích prednášok o vysokovýkonnom počítaní. Všetky naše prednášky sú bezplatné, no prosíme vás o registráciu.
Národné kompetenčné centrum pre HPC organizuje sériu populárno-vzdelávacích prednášok o tom, kde všade vedci potrebujú superpočítače a vysokovýkonnú výpočtovú techniku. Ide o spoločnú aktivitu NCC a Múzea počítačov Centra spoločných činností SAV.
Každý používateľ uzná, že využitie HPC v rôznych vedných odboroch je multidisciplinárna problematika. Je potrebné mať znalosti nielen zo špecifickej vedeckej oblasti, ale aj z metód modelovania a simulácií, základov programovania, operačných systémov a architektúry počítačov. Prvé prednášky budú preto venované úvodu do tejto problematiky, čo využijeme v ďalších prezentáciách, v ktorých vám odborníci zo SAV a slovenských univerzít priblížia použitie HPC v rôznych vedeckých odboroch. Našim cieľom je do istej miery pokryť to, čo chýba v kurikulách vysokých škôl a pokúsiť sa podať komplexné informácie a to aj v kontexte svetového vývoja.
Prednášky sú vhodné pre študentov, ale aj pre širšiu verejnosť a všetkých záujemcov, ktorí sa chcú dozvedieť viac o HPC technológiách, ich vývoji a možnostiach ich využitia. Súčasťou prednášok, ktoré sa budú konať v Aule SAV v areáli na Patrónke bude aj otvorená diskusia s prednášajúcim v neformálnej atmosfére. Prednášky bude možné sledovať aj online prostredníctvom YouTube. Účasť na prednáškach je bezplatná, no je počas nich povinné dodržiavať všetky platné hygienické opatrenia v súvislosti s pandémiou Covid-19. Tiež je potrebné sa zaregistrovať na stránke http://itkurzy.sav.sk/prednasky.
Sme veľmi radi, že naše pozvanie prijali zaujímaví hostia a tešíme sa na inšpiratívne prednášky a podnetné diskusie v uvoľnenej atmosfére pri káve a malom občerstvení!
29. septembra o 17:00 –Súčasné trendy a vízia rozvoja HPC na Slovensku Filip Holka (CSČ SAV), Lukáš Demovič (CSČ SAV)
12. októbra o 17:00 – Počítačové simulácie a výpočty ako esenciálny nástroj vedy Pavol Neogrády (Prírodovedecká fakulta UK)
26. októbra o 17:00 – Vývoj technológií a architektúr počítačov – od sériových jednoprocesorových po súčasné superpočítače Martin Šperka (Múzeum počítačov, CSČ SAV)
Ak by ste mali záujem o prednášku na konkrétnu tému, ale nenašli ste ju v našom harmonograme, neváhajte nás kontaktovať!
Nenechajte si ujsť zaujímavé aktivity Národného kompetenčného centra pre HPC (prednášky, bezplatné IT kurzy, hackathony, podujatia), sledujte nás na sociálnych sieťach a prihláste sa na odber nášhonewslettera.
Privítajte Mistral-sk-7b!3 okt-Slovenská AI komunita sa po dlhom čase dočkala nového, tentoraz naozaj veľkého jazykového modelu pre slovenský jazyk.
NCC pre HPC na INOFESTe 2024: Festival inovácií v Žiline24 sep-V dňoch 17. a 18. septembra 2024 sa v Žiline uskutočnil už piaty ročník festivalu inovácií INOFEST 2024, ktorý zorganizovalo združenie INOVATO. Podujatie sa stalo jedinečnou platformou pre stretnutie odborníkov, podnikateľov, akademikov, inovátorov, študentov, zástupcov štátnej správy a verejnosti, čím posilnilo spoluprácu v oblasti regionálnych inovačných ekosystémov na Slovensku.
Klasifikácia intentov pre bankové chatboty pomocou veľkých jazykových modelov12 sep-Tento článok hodnotí použitie veľkých jazykových modelov na klasifikáciu intentov v chatbote s preddefinovanými odpoveďami, určenom pre webové stránky bankového sektora. Zameriavame sa na efektivitu modelu SlovakBERT a porovnávame ho s použitím multilingválnych generatívnych modelov, ako sú Llama 8b instruct a Gemma 7b instruct, v ich predtrénovaných aj fine-tunovaných verziách. Výsledky naznačujú, že SlovakBERT dosahuje lepšie výsledky než ostatné modely, a to v presnosti klasifikácie ako aj v miere falošne pozitívnych predikcií.
PRACE 24. výzva na podávanie projektov na prístup k infraštrukúre / Project Access
Typ: Project Access
Otvorenie výzvy: 09/09/2021
Ukončenie: 02/11/2021 @ 10:00 Brussels Time
Termín na reakciu žiadateľov na hodnotenie: do polovice januára 2022
Vyrozumenie o vyhodnotení žiadostí: Koniec marca 2022
Časový interval prístupu pre schválené žiadosti: 01/04/2022 – 31/03/2023
Typ prístupu (*): Ročný prístup a viacročný prístup
(*) Všetky žiadosti musia obsahovať 2 časti: Online formulár a ‘Rozsah projektu a projektový plán’.
24. Výzva umožňuje vedúcim výskumu zo súkromného sektora požiadať o ročný prístup v rámci špeciálnej línie pre priemysel, pre ktorú je vyhradených 10% všetkých dostupných kapacít.
Výpočtové prostriedky (Tier-0 systems), ktoré budú v rámci tejto výzvy dostupné poskytuje 5 PRACE hostiteľských členov: BSC za Španielsko, CINECA za Taliansko, ETH Zurich/CSCS za Švajčiarsko, GCS za Nemecko a GENCI za Francúzsko.
O prístup môžu žiadať vedci a výskumníci, ako aj subjekty z priemyslu , pokiaľ sa ich hlavné sídlo nachádza v Európe a rovnako tu prebieha väčšina ich výskumných a vývojových aktivít.
Žiadatelia sa môžu uchádzať o ročný prístup / 12 mesiacov alebo viacročný prístup / 24 až 36 mesiacov.
PRACE – ICEI šiesta výzva na predkladanie projektov
Kapacity dostupné v rámci tejto výzvy sú súčasťou Fenix infraštruktúry pre výskum podporovanej Európskym projektom ICEI (https://fenix-ri.eu/).
Výzvy na predkladanie projetov sú určené výskumníkom z akademického prostredia, výskumných inštitúcií, ktorých R&D activity vyžadujú škálovateľné výpočtové prostriedky, interaktívne výpočtové služby, prístup k virtuálnym serverom a úložný priestor.
Termíny
Výzvy sa opakujú štvťročne podľa nasledujúceho (výzvy budú otvorené do naplnenia vyčlenených kapacít):
Call opening
Call closure
Allocation
Call #6
31/05/2021
09/07/2021
From 01/10/2021
Call #7
20/09/2021
29/10/2021
From 01/01/2022
Termíny výziev pre rok 2022 budú publikované koncom roka 2021.
Alokácie sú časovo obmedzené na 12 mesiacov.
PRACE ICEI program je otvorený pre všetkých európskych výskumníkov a výskumné organizácie s potrebou HPC výpočtových kapacít a to nezávisle od ich financovania.
Oprávnení žiadatelia musia preukázať potrebu minimálne jednej z nasledujúcich služieb:
Škálovateľné výpočty
Interaktívne výpočty
Poskytovanie virtuálnach serverov
Repozitár na archiváciu dát
Repozitár pre aktívne dáta
Čo musí obsahovať žiadosť PRACE ICEI
Krátky opis vedeckých cieľov a zámerov vrátane pokroku nad rámec najnovších poznatkov a vedeckého impaktu
Typ požadovaných výpočtových prostriedkov (napr. škálovateľné, interaktívne, virtuálny server a pod.)
Žiadosť o výpočtové prostriedky v zmysle predchádzajúceho bodu
Popis softvéru a služieb potrebných na úspešnú implementáciu projektu
Opis výskumných metód (vrátane projektového plánu), algoritmov a paralelizácie kódu (vrátane požiadaviek na pamäť)
Informácie o spravovaní dát
Opis špeciálnych požiadaviek
Podrobnosti o dostupných výpočtových prostriedkoch a podávaní žiadostí sa dozviete TU.