Anotace prezentací

E-infrastruktura CESNET v celoevropském kontextu

Jan Gruntorád, CESNET

Nejnovější informace o rozvoji e-infrastruktury a jejích služeb, včetně nástinu strategie vývoje e-infrastruktury CESNET do roku 2020 v souvislosti s programem EC Horizont 2020 a připravovaným projektem GN4. Zazní rovněž aktuální informace o činnosti e-Infrastructure Reflection Group (e-IRG) a o sloučení organizací TERENA a DANTE do jedné organizace – GÉANT Association. (CESNET_Evropa kontext)

Způsoby využití datových úložišť CESNET

David Antoš, CESNET

Datová úložiště sdružení CESNET poskytují širokou sadu služeb. Jak si z nich ale vybrat vhodnou pro určitý případ použití není vždy zcela snadná otázka. V přednášce se zaměříme na typické scénáře použití úložišť s důrazem na větší objemy dat a různé modely jejich zpracování a popíšeme vhodné služby pro každý z nich. (CESNET_Datova uloziste)

Velká data a moderní optické sítě

Jan Radil, CESNET

Nové vědecké aplikace dnes mohou využívat všech možností, které jim moderní optické sítě nabízejí. Příkladem mohou být například třídiče genomu, které vytvářejí velké množství dat, které může být problém přenést, další příklad jsou urychlovače částic nebo pole teleskopů. Dosah není omezen jen na ČR, díky sítím jako je GÉANT nebo GLIF lze data přenášet na velké vzdálenosti. Přenosy  s rychlostmi 10Gb/s jsou dnes už poměrně běžné, jako další krok se nabízí 100G Ethernet. 100G nebo vyšší přenosové rychlosti jsou nyní dostupné na páteřních sítích s polygonální topologií. V případě umístění zdrojů velkých dat mimo páteř je třeba připravit odpovídající projekt nasvícení poslední míle včetně zakruhování pro zvýšení spolehlivosti přenosu (například když sledované jevy nelze zopakovat). Na projektech jsme připraveni se zájemci spolupracovat. (CESNET_Optické sítě)

BigData a bezpečnost

Andrea Kropáčová, CESNET

Nestačí pouze BigData mít kam uložit, je také potřeba zajistit  zabezpečení dat. Proto je potřeba bezpečnostní dohled nejen  nad datovým úložištěm, ale také nad infrastrukturou, přes kterou se data přenášejí. Přednáška bude stručně informovat o tom, co v oblasti bezpečnosti děláme, jaké nástroje a technologie máme k dispozici, o novinkách ve vývoji a také o tom, co lze z těchto nástrojů vytěžit ve vztahu k BigData. (CESNET_Bezpecnost)

Zpracování dat na MetaCentru

Miroslav Ruda, CESNET

Prostředí MetaCentra nabízí řadu výpočetních služeb, od prostředí pro klasické hight-troughput výpočty, přes podporu rozsáhlých paralelních úloh až po cloudové prostředí. V přednášce předvedeme typické scénáře použití těchto prostředí orientované na zpracování velkých dat a představíme novou službu pro výpočty typu MapReduce. (CESNET_gridove pocitani)

ELI: Petawatt nebo Petabyte – kdo z koho?

Pavel Bastl a Jaroslav Charfreitag, ELI

Připravované pracoviště ELI (Extreme Light Infrastructure) v Dolních Břežanech směřuje k produkování laserových svazků o vysoké intenzitě a krátkých pulsech v jednotkách, které před několika lety byly nereálné. Zachycení dat, zpracování a jejich ukládání (DAQ – data acquisition) je v paralele s náročným fyzikálním prostředím laserů a v budoucnu bude tato problematika brzdou nebo motorem celé infrastruktury. Příspěvek se snaží shrnout informace o projektu ELI a jeho aktuálním stavu, jak se může vyvíjet a co je nutné při zpracování dat a signálů s ohledem na „Big Data“ řešit již nyní. Vyhrají lasery nebo datová uložiště? Jaká kapacita optických linek je dostačující?, Jak řešit finančně ukládání TB a PB?, Kam vše vlastně dlouhodobě archivovat? a další otázky, které nás nenechávají spát a mohou být vhodným tématem k zamyšlení z pohledu vznikajícího vědecko-výzkumného centra v prostředí spolupráce s organizací CESNET. (ELI)

Aplikace výpočetních řešení z LHC v dalších projektech

Jiří Chudoba, Fyzikální ústav AV ČR a CESNET

Zpracování velkého množství dat, které produkují LHC experimenty, si vyžádalo vytvoření nových řešení. Tato řešení se neustále vyvíjejí, aby se co nejlépe využily všechny dostupné zdroje a nové možnosti hardware. Některé procesy se osvědčily natolik, že je převzaly další projekty. Jedná se většinou o velké mezinárodní projekty s mnoha spolupracovníky, často z geograficky velmi vzdálených zemí. Na příkladech dvou projektů astročásticové fyziky, Pierre Auger Observatory a Cherenkov Telescope Array a jednoho projektu částicové fyziky, Belle II, ukážu současné i plánované postupy pro zpracování jejich dat. (FZU LHC)

LINDAT/CLARIN

Jan Hajič, Univerzita Karlova v Praze

LINDAT/CLARIN je výzkumnou infrastrukturou pro ukládání, distribuci a archivaci velkých jazykových dat pro využití jak v jazykovém výzkumu, tak i pro vývoj jazykových technologií. LINDAT/CLARIN jako uzel celoevropské sítě sdružené v Clarin ERIC zároveň buduje celé spektrum služeb pro analýzu textu (a v budoucnu i audia, videa a obrázků) pro využití jak v základním jazykovědném výzkumu a výzkumu interdsciplinárním zejména v oborech SHV, tak i ve výzkumu technologickém. Tyto služby jsou přitom založeny na využití jazykových dat, která LINDAT/CLARIN spravuje ve svém repositáři: využívá se přitom výpočetně extrémně náročných metod strojového učení. V přednášce bude popsán repozitář LINDAT/CLARIN, který splňuje nejvyšší technickou certifikaci Clarin „B“, a na několika příkladech budou ukázány základní aplikace okolo rozvíjených webových služeb. Část přednášky bude věnována i organizační struktuře evropských výzkumných sítí pro velká data, jako je EUDAT a nově EUDAT 2020, META-NET a síť repozitářů META-SHARE a jejich vztah k zavedeným službám poskytovaným Linguistic Data Consortium z USA a European Language Resource Association. (LINDAT-CLARIN)

E- infrastruktura CESNET jako partner výzkumné infrastruktury pro biologická data ELIXIR CZ

Jiří Vondrášek, ÚOCHAB

V posledních deseti letech dochází k hyper-exponenciálnímu nárůstu biomedicínských dat (genomové sekvence, data systémové biologie, struktury biologicky významných molekul – původců onemocnění, databáze léčiv, profily onemocnění, data spojená s patogeny atd.) a s tím spojenému nárůstu nároků na jejich ukládání, zpracování a distribuci. Současný stav charakterizuje na jedné straně centralizace datových zdrojů, na druhé straně roztříštěnost informací a datových formátů na úrovni jednotlivých pracovišť a laboratoří. Tyto skutečnosti vedou k vytváření nadnárodních projektů, které jsou v Evropě reprezentovány infrastrukturním projektem ELIXIR ( ESFRI) a v české republice projektem VI ELIXIR CZ.CESNET je od samého začátku budováni infrastruktury ELIXIR jejím strategickým partnerem a jeho úloha je v celém projektu naprosto unikátní. Mapování potřeb vědecké komunity z hlediska využívání ELIXIR infrastruktury přineslo řadu požadavků na technické zajištění, které je na úrovni CESNET buď připraveno jako hotové řešení nebo CESNET nabízí spolupráci při zpracování požadavků a plánování takového zajištění. CESNET poskytnul v první fázi budování ELIXIR Infrastruktury výpočetní kapacity pro zřízení centrálního ELIXIR serveru, poskytnul řešení pro komunikační platformu a v neposlední řadě připravil prostředí pro k zálohování biologických dat ve svých úložištích. Kombinace a spolupráce ELIXIR a CESNET mimo jiné přináší zásadní úspory státních prostředků a je svým způsobem vzorem pro využitíinfrastruktury CESNET i dalšími infrastrukturními projekty. (Elixir)

Velká data v knihovnách

Petr Žabička, MZK v Brně

Ačkoli je převážná věšina informací v knihovnách stále přístupná pouze na analogových nosičích, objem digitálních dat a metadat získávaných knihovnami nebo v nich přímo vznikajících neustále roste. Příspěvek seznámí posluchače s tím, jaké kategorie dat v knihovnách vznikají, jak s nimi knihovny nakládají a jaké problémy při tom řeší. Zmíněn bude zejména projekt archivace českého webu WebArchiv, projekty digitalizace tištěných dokumentů a připravovaný Centrální portál knihoven. (MZK)

Práce s větším objemem meteorologických a klimatologických dat v rámci projektů ve vědeckém centru CzechGlobe

Pavel Zahradníček, CzechGlobe

Cílem přednášky bude seznámit posluchače v první řadě s činností Centra výzkumu globální změny AV, v.v.i (CzechGlobe) a konkrétně s prací oddělení Klimatického modelování, které zpracovává větší objemy dat jako jsou klimatické a meteorologické modely. V přednášce se objeví ukázka některých výstupů z těchto klimatických modelů. CzechGlobe se také podílí na významných mezinárodních projektech a jeden z nich je Intersucho, který dal dohromady velkou řadu odborníku i ze zahraničí. Jako jeden z výstupů tohoto projektu je i monitoring sucha provozovaný na stránkách www.intersucho.cz a  v rámci něj jsou zpracovávány větší objemy vstupních, tak i výstupních dat. Zajímavou součástí meteorologie je relativně nový obor energetické meteorologie, kdy na základě numerických předpovědních modelů jsou predikovány v hodinovém kroku výkony solárních a větrných elektráren, což je důležité pro stabilizaci sítě v ČR. (CzechGlobe)

Poslední změna: 28.11.2014