9 Multimediální přenosy a kolaborativní prostředí
Aktivita Multimediální přenosy a kolaborativní prostředí se zabývá vývojem a diseminací znalostí o kolaborativních prostředích, pro jejichž implementaci lze efektivně využít vysokorychlostní síťovou infrastrukturu, jak je realizována například sítí CESNET2. V roce 2007 došlo ke změně struktury aktivit a ke sloučení původních aktivit Virtuální prostředí pro spolupráci a IP telefonie. Jednoznačně pozitivním důsledkem tohoto sloučení bylo výrazné zlepšení komunikace mezi členy původně separátních aktivit a synergie jak při samotném výzkumu, tak při formulování výzkumných cílů do budoucna. Aktivita nyní zahrnuje velmi širokou paletu činností od produkčních služeb nad sítí CESNET2, jako jsou například provoz IP telefonie či audio a video streamovací služby, přes aktivity hraniční, kam lze zařadit například indexaci a vyhledávání v multimediálních datech a kolaborativní platformu založenou na nekomprimovaném HD videu, až po čistě výzkumné úkoly, mezi něž patří například virtualizovaná synchronní komunikační infrastruktura, analytický model rozptylu zpoždění pro obsluhu RTP toků či psychologická studie, která připravuje půdu pro vývoj nové generace vícebodových kolaborativních prostředí. Aktivita se podílela na řadě demonstrací, jejichž cílem bylo podchycení zajímavých uživatelských skupin (např. medicína) a také se velmi aktivně zapojila do přípravy a realizace demonstrací na workshopu GLIF 2007, které spolupořádaly sdružení GLIF a CESNET v září 2007 v Praze.
9.1 Virtualizovaná synchronní komunikační infrastruktura
Význam virtualizace jakožto metody abstrakce systémových zdrojů počítače spočívá zejména v možnosti paralelního běhu na sobě zcela nezávislých virtuálních strojů, které tak například mohou být celé přiděleny různým uživatelům. Ti získávají iluzi práce se systémem, který je plně pod jejich kontrolou, aniž by měli představu o fyzickém hardware, na kterém systém běží.
Se stále rostoucím uplatněním virtualizovaných systémů nejen ve světě osobních počítačů, ale i ve světě síťových prvků se zrodil přirozený požadavek proměřit ve virtuálním prostředí chování reflektoru - prvku vyvinutého sdružením CESNET, který na unicastových sítích s chybějící podporou multicastu umožňuje distribuci dat podobnou multicastu. Reflektor jsme v uplynulém roce sestavili a testovali ve virtuálních prostředích poskytujících virtualizaci na různých úrovních:
- Xen [BDF03] - tzv. virtual machine monitor sloužící pro spuštění více operačních systémů na jednom fyzickém hardware. Operačním systémům vytváří iluzi zcela samostatného (z jejich pohledu fyzického) hardware. Podporuje tzv. paravirtualizaci (částečnou abstrakci fyzických zdrojů počítače), díky které dosahuje mnohem vyšších výkonů než srovnatelné virtualizační mechanismy.
- VServer [SPF06] - virtualizace počítače na úrovni jádra linuxového operačního systému. VServer nepodporuje virtualizaci celého fyzického počítače a všech jeho zdrojů, ale pouze "multiplikaci" již existujícího operačního systému a vzájemnou izolaci spuštěných procesů mezi každou z jeho instancí.
- JVM (Java Virtual Machine) [LiY99] - abstraktní stroj (virtuální stroj) spuštěný v operačním systému hostujícího počítače, jehož úkolem je programům napsaným v jazyce Java zajistit nezávislost jak na platformě, tak na operačním systému. Pro JVM byl reflektor reimplementován v jazyce Java. Ačkoli se nejedná o plnou virtualizaci fyzických zdrojů či operačního systému počítače, do testů jsme jej zahrnuli pro zjištění chování reflektoru v rámci dalšího možného přístupu k virtualizaci.
Testy jsme prokázali, že výkonnost reflektoru spuštěného ve virtuálním prostředí je silně ovlivněna použitým virtualizačním mechanismem. Zatímco výkon reflektoru spuštěného v prostředí VServeru či JVM je v zásadě srovnatelný s výkonností reflektoru spuštěného v nativním OS, výkonnost reflektoru spuštěného v prostředí Xenu je zejména při vyšším počtu přenášených větších paketů poměrně citelně degradován.
Mimo testy reflektoru jsme se v průběhu roku 2007 zaměřili i na testy aktivního směrovače rovněž běžícího ve virtualizovaném prostředí Xenu. Předmětem provedených měření bylo zjistit vliv plánovacích algoritmů pro přidělování procesorového času, kterými může být vyvíjený aktivní směrovač vybaven, na kvalitativní parametry procházejících síťových toků (propustnost, latence, zatížení CPU). Vzhledem k tomu, že aktuální prototypová implementace směrovače je založena na virtualizovaném prostředí Xenu, testovali jsme pouze plánovače v něm dostupné - Simple Earliest Deadline First (SEDF) a Credit Scheduler.
9.1.1 DiProNN (Distributed Programmable Network Node)
V průběhu roku 2007 byla sdružením CESNET vybudována distribuovaná infrastruktura pro distribuci a synchronní zpracování multimediálních dat založená na programovatelných síťových prvcích nazývaných Distributed Programmable Network Node (DiProNN). Tyto uzly jsme umístili v Praze, Brně, Plzni a Liberci, a vzájemně propojili. Vybudovaná infrastruktura může být využita jak pro jednoduchou distribuci multimediálních dat, tak i pro distribuci dat spojenou s jejich libovolným zpracováním na DiProNN uzlech.
Architektura uzlů DiProNN [Reb08] [Reb07a] [Reb07b] [Reb07c] [Reb07d] je zobrazena na obrázku. Jak lze z obrázku vypozorovat, uzel DiProNN sestává ze dvou komunikačních kanálů (datový kanál a nízkolatenční řídicí kanál) a ze čtyř typů vzájemně propojených a komunikujících jednotek - distribuční jednotky (určené pro distribuci příchozích dat na výpočetní jednotky), řídicí jednotky (určené pro správu celého DiProNN uzlu), agregační jednotky (určené pro agregaci proudů dat přicházejících z výpočetních jednotek, které jsou následně přeposílány dalšímu DiProNN prvku, nebo koncovému uživateli) a pro běh DiProNNu nejdůležitější jednotky (respektive obecně sady jednotek) - výpočetní jednotky.
Návrh výpočetní jednotky uzlu DiProNN (viz obrázek) jsme založili na virtualizovaném prostředí, které DiProNNu umožňuje přijímat od svých uživatelů nejen samostatné uživatelské programy, ale i celé virtuální stroje s vlastním operačním systémem a sadou uživatelských programů v něm běžících; tyto uživatelské programy pak zpracovávají data DiProNNem protékající. Virtualizované prostředí mimo jiné umožňuje i striktní oddělení zdrojů pro jednotlivé virtuální stroje v něm použité; v příštím roce se plánujeme detailně zabývat mechanismy garance kvality služeb nejen z pohledu síťových parametrů, ale také z pohledu dostupnosti výpočetních zdrojů DiProNNu (procesor, paměť, disk, atp.).
Abychom co nejvíce usnadnili (a zpříjemnili) programování DiProNNu, navrhli jsme pro něj nový programovací model [Reb07c] založený na principech workflow. Navržený programovací model s využitím virtualizovaného prostředí umožňuje seskládat komplexní funkce požadované uživatelem DiProNNu z jednoduchých, jednoúčelových programů, jejichž vzájemná komunikace probíhá pomocí standardních síťových služeb.
Ve druhé polovině uplynulého roku jsme pro uzel DiProNN vytvořili prototypovou implementaci využívající virtualizované prostředí Xen Virtual Machine Monitoru [BDF03]. Tuto implementaci jsme využili pro vybudování již zmíněné distribuované infrastruktury pro zpracování a distribuci multimediálních dat, ve které byl uzel DiProNN nasazen ve své minimální konfiguraci (právě jedna výpočetní jednotka současně zastávající funkci všech jednotek obecného DiProNN uzlu). Vybudovanou architekturu jsme podrobili řadě rozsáhlých výkonnostních testů, přičemž jsme její použití také demonstrovali příkladovou studií přenosu a zpracování HDV prezentace [ReH07].
9.2 Rozvoj interaktivních HD aplikací
V roce 2007 jsme se věnovali také rozvoji kolaborativní platformy UltraGrid založené na nekomprimovaném high-definition (HD) videu s datovým tokem 1,5 Gb/s, jejíž vývoj CESNET započal v roce 2005. Díky optimalizaci software a integraci nových karet Centaurus II nyní dosahujeme end-to-end zpoždění při krátkém síťovém propojení 90 ms, což je plně vyhovující pro interaktivní aplikace. Portovali jsme systém na platformu MacOS X, což kromě rozšíření komunity uživatelů umožňuje zejména použití výrazně levnějších karet pro zachytávání videa, které nejsou podporovány v OS Linux - zejména kvalitních a dostupných karet BlackMagic Design DeckLink HD a DeckLink HD Pro. Do zobrazovací části UltraGridu byla implementována také podpora zobrazování v OpenGL tak, že transformace obrazu se provádějí přímo na grafických procesorech (GPU NVIDIA).
Dále jsme rozšířili UltraGrid o režim DXT komprese založené na indexování barev, kdy dojde ke snížení datového toku na 250 Mb/s. Komprese do systému nezanáší zpoždění, které by bylo větší než chyba měření v režimu end-to-end - zůstává tedy na úrovni 90 ms. Dekomprese je opět realizována plně s využitím GPU, kdy zátěž přijímacího počítače je zanedbatelná a daná pouze příjmem dat rychlostí 250 Mb/s a jejich přesunem na GPU. Komprimovaný režim umožňuje provoz kolaborativní HD platformy v prostředích, kde není dostupná 10GE síť, a také rozsáhlejší distribuci velkému množství klientů pomocí synchronních distribučních infrastruktur nad aktivními elementy.
V průběhu jara 2007 CESNET poskytoval podporu pro implementaci distribuovaného interaktivního výukového kurzu Introduction to High-Performance Computing organizovaného Louisianskou státní univerzitou, kterého se účastnili v rámci oficiálního výukového programu také studenti Fakulty informatiky Masarykovy univerzity [HPS07], [MHH07]. Interaktivní výuková část kursu byla realizována pomocí nekomprimované HD kolaborativní platformy, kterou CESNET vyvíjí. Pro účely připojení MU CESNET poskytl kapacitu svého propojení do StarLightu, kde se linka napojovala na lambda služby, po nichž byl kurs šířen v rámci USA. Kromě FI MU se kursu účastnily ještě čtyři další vzdělávací instituce z USA a studenti z ČR tak měli unikátní příležitost se plnohodnotně účastnit americké výuky.
Obrázek 9.3: Distribuovaný výukový kurs Introduction to High-Performance Computing. Na fotografii jsou studenti účastnící se kursu na FI MU v Brně.
9.3 Psychologická studie interakcí lidí ve skupinových kolaborativních prostředích
V předchozím roce jsme započali vývoj videokonferenčních prostředí specializovaných na vzájemnou komunikaci dvou a více malých skupin (tedy 3-8 lidí v každé lokaci, kteří prostředí částečně sdílejí). Současná videokonferenční prostředí jsou zaměřena na komunikaci jednotlivců a při jejich použití pro skupiny dochází ke ztrátám verbálních i neverbálních signálů. V konečném důsledku je tak komunikace pro uživatele obtížně sledovatelná a únavná. Specializované videokonferenční prostředí by mělo tyto problémy zmírnit či úplně odstranit.
V průběhu první poloviny roku 2007 proběhla kvalitativní, explorativně zaměřená studie, jejímž výsledkem byla dvě navržená videokonferenční prostředí. Jedno z nich již bylo implementováno a částečně vyhodnoceno v průběhu studie. Druhé je právě implementováno a mělo by být přepraveno k testování v průběhu ledna 2008. Detailní popis studie a jejích výstupů je možno nalézt v [SHT07]. V současnosti probíhá navazující studie, jejímž výstupem bude popis všeobecných charakteristik videokonferenčního prostředí, které uživatelé považují za nejdůležitější. Výsledky budou k dispozici v průběhu ledna.
9.4 Analytický model rozptylu zpoždění pro obsluhu RTP toků
Aktivita se intenzivně věnuje různým metodám určení kvality hovoru a jevům, které ji ovlivňují. Pro posuzování kvality hovoru byla vyvinuta řada metod, z nichž nejznámější jsou metoda subjektivního hodnocení ITU-T P.800 z roku 1996 (nahrazující předešlé doporučení P.80), dále objektivní intrusivní metoda PESQ (Perceptual evaluation of speech quality) popsaná v ITU-T P.862 (aktuální verze z roku 2002) a třetí nejznámější je E-model dle ITU-T G.107 (aktuální verze z roku 2005). Poslední jmenovaná je speciálně navržena pro posuzování hovorů v IP síti. Ačkoliv je E-model určen pro výpočet kvality v IP síti, nekalkuluje s proměnným zpožděním jako s parametrem, což nás přivedlo k myšlence pokusit se o jeho analytické vyjádření.
Námi vyvinutý model rozptylu zpoždění je navržen pro obsluhu s prioritní frontou, čili směrovač s aplikací PQ pro RTP. Vznik volání je Poissonův proces (viz obrázek), kde přechod mezi stavy v čase je vyjádřen pomocí intenzity přechodu. Je možné setrvat ve výchozím stavu a s časem exponenciálně roste pravděpodobnost přechodu čili vzniku volání.
Model je založen na aplikaci Markovovských procesů. Dle Kendallovy klasifikace se jedná o model typu M/D/1/k. Ten jsme následně zjednodušili řadou podmínek, které ale odpovídají reálnému použití a jsou tedy akceptovatelné. Pomocí matematických vztahů jsme vyjádřili pravděpodobnost frontování vstupujícího požadavku do systému hromadné obsluhy a čas, který ve frontě stráví. Jejich odvození jsme publikovali v několika článcích. Vyjádřili jsme rovněž celkové end-to-end zpoždění VoIP spojení a popsali veškeré významné komponenty, které ovlivňují zpoždění, což jsme rovněž publikovali. Na obrázku je vztah mezi pravděpodobností čekání požadavku ve frontě, počtem hovorů a zpožděním ve frontě.
Verifikaci modelu jsme provedli pomocí zařízení firmy Ixia, kterým jsme simulovali spojení a měřili výsledné zpoždění s reálnými prvky (použili jsme směrovače Cisco s nastavením PQ, viz technická zpráva). Každé měření jsme pětkrát opakovali pro eliminaci chyb. Zpracovávali jsme cca pět tisíc výsledků. Model vykazuje chybu 1,5 % do zatížení 40 % a do zatížení 80 % se od skutečných hodnot liší do 6 %. Nad 80 % byly problémy s opakováním měření a výsledky nejsou reprodukovatelné, proto nebyly zpracovány.
Při vývoji jsme spolupracovali s doktorem M. Halásem z katedry telekomunikací STU Bratislava, na verifikaci modelu participoval E. Rocha z University de Aveiro (Ph.D. student). Oběma jsme poděkovali v technické zprávě [Voz07]. Máme v plánu pokračovat v dalším vývoji, protože se jedná o oblast s velkým potenciálem a předpokladem vzniku nových tezí.
9.5 Signalizační infrastruktura
Základnou pro náš výzkum, ale i služby poskytované výzkumné a vzdělávací komunitě v oblasti IP telefonie a videokonferencí, je signalizační infrastruktura. Nemalá část našeho úsilí je věnována zkvalitňování této infrastruktury a rozvoji služeb, které jejím prostřednictvím můžeme poskytovat.
9.5.1 Prvky a služby
Důležitými prvky H.323 infrastruktury jsou dva gatekeepery GnuGK. Jeden slouží jako hraniční prvek naší sítě a pro přístup do GDS, druhý je primárně určen videokonferenčním zařízením. Zde jsou registrovány VC jednotky CESNETu, některých univerzit a dalších institucí (např. NIDV), kterým tímto způsobem poskytujeme vzájemné propojení, dosažitelnost z IP telefonní sítě, GDS, PSTN a podporu. Samonosnou jednotku tvoří soustava bran připojujících univerzitní ústředny se dvěma řídícími gatekeepery, která poskytuje hlasové volání mezi institucemi.
Centrálním prvkem SIP infrastruktury je multidoménový SIP server, který obsluhuje domény cesnet.cz, fel.cvut.cz, fjfi.cvut.cz, tul.cz, uvtuk.cuni.cz, ics.muni.cz, czu.cz. Kromě toho také směruje hovory do vnitřních uzlů sítě (brány u ústředen) a vnějších uzlů (jakékoliv SIP sítě) a funguje tedy jako hraniční prvek SIP infrastruktury pro příchozí hovory. Předpokládáme postupnou decentralizaci řešení, a proto jsme se věnovali návrhu modelového nasazení SIPu pro instituci (viz níže). Ukončení autentizace eduroam-simple si vynutilo nasazení federovaného přístupu (Shibboleth), který zatím funguje pro domény, které mají IdP.
Vzhledem k dualitě sítě potřebujeme také překladač mezi protokoly SIP a H.323. Jako doplněk k IP2IP bráně využívající směrovač Cisco jsme nasadili open source řešení založené na programu Asterisk. V současnosti přes něj proudí hovory například do JČU a poskytuje testovací číslo (echo) pro oba protokoly. Oblast překladu SIP-H.323 je velmi důležitá vzhledem k plánovanému přechodu na SIP a nadále se jí budeme věnovat.
Pro pohodlnější využití vícebodových videokonferencí poskytovaných s pomocí našeho MCU jsme nasadili rezervační portál (SWITCH eConfportal), který jsme upravili pro fungování v české testovací AAI federaci czTestFed. Nadále testujeme funkčnost po povýšení Polycom MCU na verzi 9, který jsme provedli koncem listopadu. Portál podporuje i Codian HD MCU zakoupené letos.
9.5.2 Nasazení na školách
S plánovanou decentralizací řešení sítě souvisí potřeba podpořit nasazení na školách. Stejně jako je běžné, že instituce má svůj poštovní server, bude v blízké době běžné, že bude mít i SIP server. Implementace přímo na instituci přinese výrazně lepší možnosti integrace služby do místního prostředí (autentizace, autorizace, adresářové služby) a umožní tyto pokročilé způsoby komunikace lépe zařadit do komunikační toků v instituci.
Obrázek 9.6: Modelové nasazení na OSU (větší obrázek)
Navrhovaným modelovým řešením je SIP proxy (například SER nebo OpenSER) v kombinaci s bránou pro připojení ústředny (např. Cisco nebo Asterisk) a aplikačním serverem (Asterisk). Pokud instituce disponuje ústřednou, kterou je možné přímo připojit do IP sítě standardizovaným protokolem, pak je to obvykle výhodou. Doporučujeme použití jmenných identifikátorů (SIP.edu) které odpovídají emailovým adresám a využití ENUMu. A to jak registrací vlastních čísel, tak dotazováním do stromu e164.arpa a nrenum.net.
Pro reálné předvedení modelu posloužily implementace na ZČU a OSU, kterým byla věnována značná pozornost během našeho semináře. Pro řešení na OSU bylo vyvinuto i PHP rozhraní pro OpenSER, které lze jednoduše integrovat do stránek univerzity. Dalším, kdo použil představeného modelu, je JČU.
8. listopadu 2007 jsme uspořádali seminář zaměřený na IP telefonii a videokonference, který navštívilo téměř 80 účastníků a jeho stěžejním tématem bylo právě modelové nasazení v instituci.
9.5.3 Bezpečnost
Komunikace mezi institucemi nejen v rámci sítě CESNET2 ale i celého Internetu s sebou nese potřebu ochrany spojení. Proto se věnujeme způsobům bezpečné a důvěryhodné mezidoménové komunikace v prostředí SIP. Jako nejvhodnější řešení se zatím jeví kombinace TLS a SIP-identity (RFC 4474). Testovali jsme implementaci SIP-identity v SIP serveru SER a zaznamenali jsme problémy při současném použití TLS a SIP-identity, které by však v současné době mohly již být odstraněny. V rámci TERENA TF-ECS (kde je úkol také řešen) proběhl workshop při konferenci TNC2007. Problematika je i předmětem spolupráce TF-ECS a TF-EMC2 (AAI). Společná jednání nás vedou směrem k integraci SAML do tohoto řešení, jak ostatně předpokládá IETF draft [THP07].
9.5.4 ENUM
Veřejný uživatelský ENUM (e164.arpa) je v ČR v provozním režimu. Převod domén registrovaných v testovacím provozu CESNETem na oprávněné držitele (instituce) je téměř hotov. Zbývá jen několik posledních domén, které sice jsou převedeny ale nejsou validovány. Vzhledem k tomu, že jde o zcela nový systém (i pro registrátory), považujeme akci za úspěšnou.
Z hlediska směrování podporujeme na SIP prvcích dotazy do domén e164.arpa a nrenum.net (akademický strom). Funkčnost pro H.323 prvky není zatím ustálena, ale pokračujeme v jejím ověřování, protože může napomoci směrování dvouprotokolového systému. Aktivně jsme se zúčastnili ENUM dne pořádaného sdružením CZ.NIC, se kterým dlouhodobě spolupracujeme. ENUMu se věnujeme i v mezinárodním měřítku, například v rámci TERENA TF-ECS. Skupina rozvíjí ideu možné náhrady stávající GDS hierarchie právě ENUMem.
9.6 SS7
Po loňském úspěšném propojení Asterisku s chan_SS7 s veřejnou telefonní ústřednou Ericsson AXE na RDC Vodafone na ČVUT jsme se zaměřili na druhé řešení - libss7. Podařilo se nám provést testovací volání mezi Asteriskem a Ericsson AXE. Pokračovali jsme ve funkčních testech obou řešení ve spolupráci s dalšími firmami. Nejprve proběhly testy shody (conformance tests) ve spolupráci se společností Sitronics TS (bývalý STROM telecom). Bohužel protokolový tester Tektronix K1297 vyžadoval inicializaci hovorových kanálů provedenou protistranou (Asterisk PBX). Avšak ani jedno z uvedených řešení tuto funkci nepodporuje, a tak nebylo možné tyto testy zcela provést. Následně jsme ve spolupráci se společností Sunrise Telecom a HKE provedli zátěžové testy obou řešení. S využitím testeru STT-MSA jsme simulovali tisíce započatých hovorů v průběhu desítek minut a zkoumali chování testovaných serverů. Výsledky výkonnostních testů implementací SS7 pro Asterisk jsme prezentovali na konferenci a detailněji v technické zprávě [Rud07].
9.7 Audiostreaming
V projektu audiostreamingu jsme provedli změny v procesu pořizování zdrojových signálů stanic ČRo, jejich kódování do OGG streamů i transportu na streamovací servery. Těmito úpravami jsme dosáhli dalšího zvýšení robustnosti celého streamingového systému.
Pro odstranění závislosti na DVB-S tuneru (interní karta PCI, kterou nelze vložit do moderních 1U serverů, na něž chceme přejít) jsme v enkódovacím tuneru tun2.cesnet.cz začali zpracovávat vstupní DVB-S signál externím tunerem Pinnacle PCTV Sat Pro VDE 450E v provedení USB. Také tento tuner nám dovoluje zpracovávat všechny programy vybraného multiplexu najednou.
Věnovali jsme se přípravám produkčního vysílání stanic ČRo v bezeztrátovém kompresním formátu FLAC. Zdrojový signál budeme získávat přímo z odbavovacího pracoviště ČRo v originální podobě, kdy ještě není zatížen žádnou ztrátovou kompresí. Navrženým řešením budeme schopni uživatelům zpřístupnit vysílání v nejvyšší kvalitě.
9.8 Zajímavé akce
Kromě běžně poskytovaných IP telefonních a videokonferenčních služeb se ve spolupráci s aktivitou Podpora aplikací věnujeme přenosu obrazu a zvuku v medicínském prostředí. Nejzajímavější letošní společné projekty jsou popsány v kapitole aktivity Podpora aplikací.
Pro kliniku dětské a dospělé ortopedie a traumatologie 2. LK UK ve FN Motol jsme realizovali ukázku HD videokonferenční technologie v rámci přenosu operace nového typu náhrady kyčelního kloubu s využitím vlastního modelového řešení mobilní platformy Ergotron-LifeSize.
Obrázek 9.7: Mobilní videokonferenční platforma
Kromě medicínské oblasti jsme se například podíleli na přenosu pražské přednášky Vinta Cerfa.
Obrázek 9.8: Přednáška Vinta Cerfa
9.9 Indexování a vyhledávání multimediálních dat
Nadále jsme rozšiřovali multimediální vyhledávač. Naše vlastní aktivity jsou orientovány na oblast síťování nebo na využití metod síťování pro zlepšení efektivity vyhledávání. Náš výzkumný partner, společnost Jyxo, se soustředí na vyhledávací algoritmy a jazykovou podporu.
V roce 2007 jsme vyhledávač rozšířili kvantitativně i kvalitativně. Kvantitativní posun směřoval k rozšíření vyhledávání o další země, byl však limitován prostorovými podmínkami ve výpočetním sále sdružení. Vyhledávač jsme rozšířili o dva další státy (Norsko a Rumunsko) a doménu .tv. Do databází přibývají další adresy ze všech domén, které jsou procházeny. Na konci roku 2007 obsahuje databáze multimediálních souborů více než 11 miliónů adres (to je nárůst o cca 36 %), z nichž je přes 6 miliónů validních a dostupných.
V současnosti prohledáváme domény: at (Rakousko), be (Belgie), ca (Kanada), com, cz (Česko), de (Německo), dk (Dánsko), edu, es (Španělsko), fi (Finsko), fr (Francie), gr (Řecko), hu (Maďarsko), ch (Švýcarsko), ie (Irsko), it (Itálie), nl (Nizozemsko), no (Norsko), org, pl (Polsko), pt (Portugalsko), ro (Rumunsko), se (Švédsko), sk (Slovensko), tv, ua (Ukrajina), uk (Spojené Království).
Kvalitativní posun je reprezentován možností vkládat externě produkovaná metadata. Původní architektura vyhledávače pracovala pouze s metadaty, která jsou součástí multimediálních souborů. Jde jednak o metadata, jež do multimediálních souborů vkládá sám autor (například údaje o copyrightu) a jednak o technické údaje (například použitý formát, kodek nebo rozlišení videa). Tato metadata jsou sice relevantní, nicméně jejich objem je omezen a například uživatelé nemají možnost je dále rozšiřovat.
Externě produkovaná metadata může ke konkrétnímu multimediálnímu souboru připojit kdokoliv, kdo je schopen následně tato metadata prezentovat a předávat. Provozovatel systému (například videoarchivu) je může nechat přidávat i uživatele. Výsledná metadata nejsou natolik relevantní jako údaje přidávané autorem, nicméně jejich množství je větší. Upravený vyhledávač může pracovat s oběma typy dat. Způsoby integrace externě produkovaných metadat jsou popsány v technické zprávě [Krs07].
Pokračovala také provozní spolupráce mezi sdružením a společností Jyxo. V její rámci společnost Jyxo provozuje kopii vyhledávače na vlastním hardware a ve vlastní síti a se sdružením sdílí výnosy ze služby.
V rámci rozvoje streamovací platformy jsme povýšili konfiguraci serverů pro Windows Media a Real Video tak, aby bez problémů zvládaly větší datové toky potřebné pro streamování obsahu v HD rozlišení. Vyřadili jsme z provozu server Kasenna MediaBase (formát MPEG-2) vzhledem k minimálnímu zájmu uživatelů a omezené podpoře HD rozlišení. Rozšířili jsme diskové pole v on-line střižně abychom disponovali vyšší kapacitou pro HD rozlišení. Implementovali jsme systém pro automatické off-line transkódování, který zefektivňuje práci při produkci multimediálních dat (například pro účely distančního vzdělávání) akademickou a výzkumnou komunitou.
Po zjištění, že televizní stanice mají jen velmi omezený zájem na dlouhodobé spolupráci ve výzkumné oblasti (jejich zájem je soustředěn na řešení okamžitých provozních problémů), jsme se soustředili na další komunity, které pracují s multimediálním obsahem. Úspěšní jsme byli ve filmové a postprodukční komunitě. V průběhu druhé poloviny roku 2007 jsme se stali členy organizace CineGRID, uskutečnili jsme v rámci GLIF workshopu v Praze dvě úspěšné demonstrace zaměřené na 4K přenosy.
9.10 Demonstrace na workshopu GLIF 2007
V září 2007 se naše aktivita podílela na šesti náročných demonstracích v rámci workshopu GLIF 2007 pořádaného sdruženími GLIF a CESNET v Praze:
- Pure optical (photonic) multicast - organizováno sdružením CESNET,
- 4K streaming from multiple locations - organizováno sdružením CineGrid,
- 4K workflow for dailies - organizováno sdružením CineGrid,
- Self-organizing collaborative environments - organizováno Masarykovou univerzitou,
- 4K video streaming to SAGE tiled displays - organizováno Electronic Visualization Lab (EVL),
- International High Performance Digital Media with Optical Multicast - organizováno Northwestern University.
Demonstracím předcházela nekolikaměsíční příprava, v jejímž rámci jsme vyvinuli některé nové technologie. Příkladem může být demonstrace fotonického multicastu, kde byly pomocí dělení datových toků v čistě optické vrstvě realizovány vícebodové přenosy nekomprimovaného HD videa mezi Prahou, Brnem a Plzní. V rámci přípravy demonstrace jsme ve spolupráci s aktivitou Optické sítě vyvinuli CzechLight Multicasting Switch, podrobněji popsaný v rámci aktivity Optické sítě).
První ze dvou demonstrací organizovaných sdružením CineGRID, 4K streaming from multiple locations, realizovala přenos 4K materiálu komprimovaného profilem Digital Cinema (profil pro 4K, komprese JPEG 2000, datový tok 300-700 Mb/s). Materiál byl po jednotlivých klipech uložen na několika serverech (Chicago, Amsterdam, Tokio, San Deigo, Seattle) a z těchto serverů byl streamován do místa konání konference GLIF (Modrá posluchárna Univerzity Karlovy). Signál byl dekódován prototypem dekodéru vyvinutým NTT Labs a Keio University a promítán 4K projektorem. Takto rozsáhlá infrastruktura byla pro účely audio nebo video přenosu použita poprvé.
Druhá demonstrace, 4K workflow for dailies, ukazovala možnost využití rozsáhlých počítačových sítí při filmové produkci a postprodukci. V současné době se filmové projekty realizují v několika lokacích, které mohou být geograficky velmi vzdálené (například Česká republika a Nový Zéland). Řízení takových projektů je obtížné a předávání materiálů mezi týmy se děje prostřednictvím leteckého posílání pevných disků (hodina materiálu má přes 2,5 TB, datový tok v rozlišení 4K je nejméně 6 Gb/s). Využitím nových vysokorychlostní sítí je možné změnit charakter práce a výrazně ho zefektivnit.
V rámci této demonstrace jsme první den snímali materiál 4K kamerou Dalsa Origin. Materiál jsme z diskového pole připojeného ke kameře odeslali k debayerizaci (proces, ve kterém se z RAW záznamu stávají RGB snímky) klastru v San Diegu v Kalifornii, kde běží příslušný software. Po několikahodinovém zpracování jsme nahráli snímky do pražského systému pro barevné korekce BaseLight, který ovládal operátor z Toronta v Kanadě. Aplikaci barevných filtrů ovlivňovali uživatelé z Prahy, kteří zároveň sledovali živý výstup systému. Aplikace barevných korekcí byla vybrána jako vhodný zdroj ověření, zda počítačové sítě mohou být využívány pro postprodukci. Operátor ovládá systém několika analogovými rozhraními (trackbally), přičemž výstup má v reálném čase a je nutné udržet vazbu oko-ruka. Druhá demonstrace byla první na světě a byly do ní zapojeny organizace z Japonska, USA a Kanady.
Demonstrace Samoorganizující se kolaborativní prostředí ukázala prototyp CoUniverse, vyvinutý na Masarykově univerzitě, který umožňuje samoorganizující se chování kolaborativních systémů v rozsáhlých distribuovaných prostředích, a to i s ohledem na datové toky srovnatelné s kapacitou spojů v síti. CoUniverse v sobě mimo jiné integroval nekomprimované HD po IP. Demonstrace se zúčastnili partneři z USA a z Taiwanu.
Streamování komprimovaného 4K obsahu z laboratoře EVL na řadu míst po celém světě se účastnila také Laboratoř pokročilých síťových technologií na Masarykově univerzitě, která je podporována sdružením CESNET. V rámci demonstrace International High Performance Digital Media with Optical Multicast se pak využívaly SONET/SDH okruhy pro vícebodovou distribuci dat - zde se výzkumníci sdružení CESNET podíleli jako konzultanti.
|
|
obsah |
následující
|
![[Obrázek]](DiProNN.png)