Použití digitální nelineární střižny pro tvorbu multimediálních výukových lekcí
Technická zpráva CESNETu
číslo 11/2003
k dispozici též ve formátech
PDF,
PostScript a
XML.
Technická zpráva CESNETu číslo 11/2003
Pavel Michalík, Ivo Šmejkal, Bohumila
Veselá
10. 11. 2003
1 Úvod
Při tvorbě multimediálních aplikací jsme často postaveni před úkol kvalitně a bez jakýchkoliv rušivých momentů snímat dynamicky měnící se dění na obrazovce počítače. Pokusy realizovat to přímo prostřednictvím kamery ani při nejlepší vůli nevedou k plně uspokojivým výsledkům. Jediná spolehlivá metoda je převzít elektronickou cestou odpovídající vizuální informaci přímo z počítače, který prezentaci provádí. Pomineme-li způsob převzetí videosignálu z grafické karty počítače (zpravidla prostřednictvím rozhraní S-video), je další cestou speciální program pro dynamické "zachytávání" stavu obrazovky tzv. screen capture software. Tento typ programového vybavení najde uplatnění například:
- při tvorbě výukových lekcí včetně lekcí určených k distančnímu vzdělávání,
- při "helpdesk" činostech, hlášení a dokumentaci chybových stavů programů,
- pro potřeby dálkového monitorování vybraných aktivit,
- při záznamu a archivaci prezentací konferenčních aktivit,
- pro CAD aplikace aj.
Pro nejčastěji užívané prostředí operačních systémů MS Windows firmy Microsoft můžeme nalézt více komerčních i volně šiřitelných programových prostředků, které víceméně plní požadované funkce. Z klasických komerčních produktů je nutné se zmínit o nejznámějším a v různých testech nejlépe hodnoceném programu SnagIt 6.2, dále pak například HyperCam 1.7, HyperSnap-DX 5.0, legendárním Lotus ScreenCam a dalších. V následujícím textu se dále zaměříme na dva velmi kvalitní produkty, které patří do kategorie bezplatně šiřitelného programového vybavení a to
- CamStudio 2.1
- Windows media encoder 9.0.
2 CamStudio
Obrázek 1: CamStudio
Program CamStudio 2.1 umožňuje zachycovat dění na celé obrazovce (Full Screen), v pevně definované oblasti (Fixed Region) nebo v uživatelem definované oblasti (Region). Pro tvorbu výukových lekcí bývá vhodné, aby současně s děním na obrazovce byl zaznamenáván i zvuk (zpravidla komentář demonstrátora snímaný mikrofonem), který pak bude tvořit základní synchronizační osu celé lekce. Program CamStudio je v práci se zvukem velmi flexibilní, nabízí řadu voleb formátu záznamu (Recording Format) i způsobů komprese zvuku (Compresed Format). Důležitou volbou pro zajištění odpovídající synchronizace videa a audia je aktivace synchronizace v relativně krátkých časových cyklech či dostatečně malém počtu snímků.
Program aktivujeme volbou start, záznam můžeme přerušit volbou pause, resp. ukončit volbou stop. Program CamStudio nabízí ještě celou řadu dalších užitečných funkcí, jejichž použití plynule vyplyne z praktického prožívání programu. CamStudio je volně šiřitelný produkt, který je možné prostřednictvím elektronické pošty registrovat.
3 Windows Media Encoder
Obrázek 2: Windows Media Encoder
Druhým volně dostupným programem, který má analogické funkce, je Windows Media Encoder 9.0 firmy Microsoft. Tento produkt je mnohem robustnější a komplexnější, obdobou funkcí jako program CamStudio plní funkce Capture Screen.
Obrázek 3: Volba Specific Windows
Užitečným rozšířením oproti CamStudiu je volba Specific Windows, která umožňuje zadat zachytávanou oblast formou pojmenovaného okna. Kromě této užitečné funkce jsou konfigurační volby tohoto prostředku chudší.
Z hlediska nároků na systémové zdroje jsou oba tyto produkty v podstatě srovnatelné.
4 Praktické experimenty
Obrázek 4: Movie Maker
Pro následné zpracování výukové lekce je důležitým nástrojem vhodná nelineární střižna (NLE). Produktů vhodných pro tento relativně jednoduchý způsob zpracování obrazu i zvuku je celá řada. Praktické experimenty jsme prováděli v bezplatně šiřitelném Movie Maker 2.0 a komerčních Adobe Premiere 6.5 a Pinnacle DV Studio 8.
Primárním vstupním zdrojem se stal AVI soubor vygenerovaný prostřednictvím programu CamStudio, který obsahuje dynamické snímky obrazovek a zvukový komentář. Druhým vstupním zdrojem bylo digitální video, které zachycovalo demonstrátora (použita kamera Sony DSR-PD150P). Synchronizační osou se stala zvuková stopa, podle níž byly dle kontextu uloženy snímky obrazovek a video záznam demonstrátora. Většina experimentů probíhala na pracovní stanici Siemens Fujitsu, s pocesorem Athlon 2600+, 512 MB paměti a operačním systémem Windows XP.
Při příprave klipu jsme v prvé řadě narazili na problém synchronizace obrazu a zvuku, který se podařilo odstranit experimentálním nastavením parametru Interleave na hodnotu 10 ms a aktivací odpovídající volby v menu Audio and Video Synchronization programu CamStudio.
Problém může rovněž nastat i s kvalitou zvuku v závislosti na hardwarovém vybavení počítače. Na zvukovém čipu Realtec AC97, integrovaném na základní desce experimenálního počítače, byla za určitých okolností vynechávána slova, na Sound Blaster Live 5.1 bylo ve slovech slyšitelné "prskání". Při použití referenčního programu Soundforge byl za stejných podmínek zvuk "čistý".
Pro kodování obrazu byl použit avi kodek Microsoftu, který sice nebývá odborníky hodnocen nejlépe, ale je součástí distribuce operačního systému. Alternativně lze samozřejmě použít i jiný kodek, který máme na počítači k dispozici.
Pro vlastní střih jsme se zaměřili na volně dostupný Movie Maker; výše zmíněné komerční produkty Premiere a DV Studio mají svému statutu odpovídající vyšší komfort a možnosti.
Digitální záznam lze importovat do programu Movie Maker buď jako WMW soubor, lze zvolit režim variabilního bitového toku (VBR), kde však nelze dále ovlivnit rozlišení (320x240 30 fps nebo plný PAL při 25 fps) nebo vybrat z různé škály konstantního bitového toku (CBR) v hodnotách od 34 kb/s až do 2.1 Mb/s.
V námi zpracovávané ukázce bylo použito nastavení "Nejvyšší kvalita přehrávání v tomto počítači", což bylo VBR, 320x240 pri 30 fps. Pojmenování tohoto nastavení je poněkud zavádějící, neboť daleko vyšší kvalitu lze nalézt v položce další nastavení. Zvuk zkomprimovaný v rámci tohoto nastavení měl daleko vyšší hladinu klidového šumu než zvuk přenesený do počítače jako avi soubor přes střihovou kartu Matrox RT 2500.
Při práci s Movie Makerem nelze při vlastním střihu separátně pohybovat obrazovou a zvukovou stopou a nelze nastavit úroveň hlasitosti v části klipu, ale jen v klipu jako celku (nejde tedy jednoduše realizovat "zvukovou stmívačku a roztmívačku"). Obrazová stopa je k dispozici pouze jediná.
Při náhledu střihu v časové ose je posun (scrubbing) velice hrubý, místo střihu lze určit v podstatě jen odhadem a pokusy. Při krácení klipu v časové ose je k dispozici jen "ripple edit", tzn. že všechny následné klipy jsou posouvány s právě upravovaným. Nelze tedy vytvořit mezeru (gap), do které by byl vložen jiný klip. Zároveň nelze klip přesunout za poslední klip v časové ose s mezerou, ale klip je automaticky "přichycen" na konci klipu posledního.
Dalším nedostatkem Movie Makeru je absence podpory pro tří a čtyřbodový střih. V praxi to tedy znamená pomerně složité stříhání v klipu, neboť se posouvá obraz i zvuk a zároveň v časové ose neexistuje žádná možnost nastavení značek, kterými by se dalo vymezit, o kolik se klip posunul. Za další nedostatek lze považovat i to, že do časové osy nelze vložit jen video stopu bez audia. V praxi to tedy znamená, že pokud chceme stříhat na jednu zvukovou stopu, je nutné tuto vložit do stopy zvuk a hudba a zvuk vložený přímo s klipem ztlumit. Za zdařilou lze považovat titulkovací část programu.
Obrázek 5: Časová osa
Při exportu z programu Movie Maker nelze zadat režim VBR, ale lze volit pouze z množiny předdefinovaných hodnot CBR, přičemž nelze odděleně zvolit datový tok pro zvukovou a obrazovou část. Při exportu pro 340 kb/s bylo již ve zvuku slyšitelné "kovové echo" typické pro nižší datové toky, což je způsobeno tím, že i relativně velkému obrazovému toku je automaticky přiřazen zvukový kodek s nízkou hodnotou bitrate, zde konkrétně 32kb/s.
Při exportu jsou používány jak pro audio tak video kodeky windows media 9, což determinuje, že pro přehrávání musíme používat poslední verzi Media Playeru 9 nebo přehrávače s touto verzí kompatibilním. Na závěr byl hotový záznam umístěn na experimentální videoserver.
5 Závěr
Cílem textu bylo dokumentovat technologický proces resp. některé jeho časti, který je možné použít pro tvorbu a realizaci multimediálních výukových lekcí. Jak již bylo v úvodu řečeno, cest vedoucích k cíli je více a tudíž záleží na každém autorovi, kterou si zvolí. Zároveň jsme se pokusili upozornit na některá možná úskalí, se kterými se může tvůrce setkat a způsoby, jak některé problémy řešit.
Použitá literatura
| [l1] | Firemní dokumentace firem Microsoft, Adobe a Pinnacle |
| [l2] | Nápověda k programu CamStudio |
| [l3] | S. Thornhill, M. Asensio, C.Young: Video Streaming and guide for educational development |