<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE zprava SYSTEM "techrep.dtd">

<zprava cislo="2/2006">

<nazev>Provoz systému PERT</nazev>

<autor>Vladimir Smotlacha</autor>

<datum>31. 12. 2005</datum>


<h1>Úvod</h1>

<p>
Tato technická zpráva poskytuje základní informace o systému PERT. Jejím účelem je 
poskytnout orientaci a  proto je záměrně napsána česky. Pro detailnější popis doporučuji 
dokumenty vytvořené příslušnou pracovní skupinou projektu GEANT2 
(viz <adresa>http://pace.geant2.net</adresa>).</p>



<h1>Základní definice</h1>

<p>
PERT (Performance and Response Team) je provozní služba určená pro řešení problémů 
s kvalitativními parametry sítě mezi dvěma koncovými uživateli v síti GEANT2. V jistém 
smyslu můžeme PERT chápat jako obdobu známého CERTu, který se zabývá bezpečnostními 
incidenty.</p>


<h2>Skupiny účastníků PERTu a jejich role</h2>

<dl>
<dt>Koncoví uživatelé (End User)</dt>
<dd>Z hlediska PERTu je jím každý, kdo má nějaký problém s výkonností sítě
(např.  propustnost, zpoždění), který spadá do předmětu činnosti PERTu, a
požaduje pomoc s jeho řešením.</dd>

<dt>Správa sítě (NOC)</dt>
<dd>Pracovníci NOC hrají klíčovou roli, přestože se na  Ze všech problémů,
které jim hlásí koncoví uživatelé, musejí vybrat ty, které patří do předmětu
činnosti PERTu. Tím je zajištěn kvalifikovaný filtr mezi koncovými uživateli
a PERTem.</dd>

<dt>Case Manager (CM)</dt>
<dd>Zaměstnanec pověřený operativním provozem PERTu.  Má službu v určené
době (většinou jeden týden) a přebírá od NOC hlášení o problémech (tzv. Duty
Case Manager - DCM). Pokud zjistí, že se jedná o záležitost patřící do
PERTu, založí Případ (Case) a snaží se ho vyřešit. Každý CM má k dispozici
znalostní databázi a může si vyžádat pomoc od SME. CM zodpovídá za postup v
řešení všech dosud otevřených Případů.  Pro řešení složitějších Případů je
určen CM, který bude mít Případ trvale na starosti nezávisle na aktuální
službě DCM (tzv. Special Case Manager - SCM).</dd>

<dt>Subject Matter Expert (SME)</dt>
<dd>Odborník na určitou třídu problémů (např. operační systém, hardware),
který je schopen řešit komplikované problémy. Nepodílí se na rutinním
provozu PERTu, jeho účast je pouze občasná a na základě kvalifikované
žádosti CM. Tito experti jsou delegováni k účasti v PERTu svým
zaměstnavatelem.</dd>

<dt>PERT Manager (PM)</dt>
<dd>Správci systému PERT.</dd>
</dl>

<h2>Trouble ticket systém</h2>

<p>Je systém pro evidenci a komunikaci při řešení jednotlivých Případů
(case). Přístup do Trouble ticket system je autentizován pomocí osobních
certifikátů (viz <adresa>https://www.pert.geant2.net:8443/pert</adresa>)</p>

<h2>Znalostní databáze (knowledge base)</h2>

<p>Databáze obsahující doporučení pro CM jak postupovat při konkrétním
Případu se specifickými příznaky, aby se dospělo k nejpravděpodobnější
příčině problému. Databáze je organizována tak, aby se v ní dalo hledat
pomocí klíčových slov.</p>

<h2>Provozní denník (PERT diary)</h2>
	
<p>V denníku jsou uvedeny denní záznamy o událostech -- nové případy, postup
při řešení. Denník je určen jako evidence činnosti systému PERT a slouží
především jako administrativní dodklad pro PM. Neuvádí se tam proto žádné
detailní odborné informace. </p>
	


<h2>Komunikační prostředky</h2>

<p>Pro komunikaci v rámci PERTu se slouží dva listy:</p>

<ul>
<li><adresa>pert-report@geant2.net</adresa>  je určen pro hlášení problémů.
Členy listu jsou NOCs, CM and PM. V tomto listu se řeší i administrativní
záležitosti PERTu.</li>

<li><adresa>pert-discuss@geant2.net</adresa>  je určen pro řešení problémů.
Členy jsou CM a SME. Pomocí tohoto listu CM žádá o spolupráci SME.</li>
</ul>


<h1>Práce s ticket systémem</h1>

<h2>Stavy ticketu</h2>

<dl>
<dt>OPEN</dt> <dd>počáteční stav ticketu po otevření.</dd>

<dt>ACKNOWLEDGED</dt> <dd>stav ticketu po začátku řešení</dd>

<dt>UPDATED</dt> 
<dd>ticket se dostane do tohoto stavu (a zůstává v něm) po doplnění nějakých 
nových informací</dd>

<dt>RESOLVED</dt> 
<dd>ticket se dostane do tohoto stavu, když PERT se domnívá, že je problém 
vyřešen</dd>

<dt>CLOSED</dt> 
<dd>koncový stav ticketu. Uživatel potvrdil, že bylo nalezeno řešení</dd>

<dt>CANCEL</dt> 
<dd>alternativní koncový stav v případě chybně zadaného ticketu nebo pokud
se řešení nepodařilo nalézt.</dd>
</dl>


<p>Následující diagram znázorňuje vazbu mezi stavy ticketu:</p>
 
<obr src='pert_tt'> Stavy ticketu</obr>

<h2>Struktura ticketu</h2>

<p>Ticket je formalizovaný záznam o Případu. Obsahuje tři části: hlavičku (header), seznam 
provedených akcí (actions) a výsledek (resolution). V hlavičce jsou uvedeny veškeré vstupní 
informace o Případu. Při každé práci s Případem, která přináší nové poznatky (provedené 
testování, doplňující informace, úvaha o možných příčinnách,...) se zakládá nový záznam 
(action). V části výsledek je uvedeno řešení problému a údaje o celkové době řešení a o 
úspěšnosti.</p>

<h2>Práce s ticketem</h2>

<p>Veškerá manipulace se provádí přes intuitivní webové rozhranní. Po otevření stránky se 
objeví seznam vlastních ticketů a stručné menu.</p>

<dl>
<dt>Založení nového ticketu</dt>

<dd>Po výběru položky menu "Add ticket" se zobrazí formulář s atributy nového ticketu. Povinné 
položky jsou Date, Privacy, Urgency, Keyword, Contact information, Subject and 
Description, dále jsou ve formuláři nepovinné položky, které blíže specifikují koncový 
systém, projev chyby.
Po vyplnění formuláře se na následující stránce musí ticket potvrdit tlačítkem Acknowledge, 
případně zrušit tlačítkem Cancel.</dd>

<dt>Úprava ticketu</dt>

<dd>Ticket je možné vybrat ze seznamu kliknutím na číslo ticketu nebo políčko Subject. 
V následujícím formuláři je možné přidávat k ticketu nové popis vykonaných činností 
(Actions).

<p>Tlačítka Resolve a Cancel  v horní části stránky mění stav ticketu, což je trochu matoucí -- 
Cancel tedy neznamená zrušení posledních změn. Při změně na RESOLVED je možné doplnit 
upřesňující informace a stanovit v procentech odhad úspěšnosti řešení.</p>

<p>Ticket ve stavu RESOLVED je možné uzavřít (CLOSED) nebo převést zpět do stavu 
UPDATED.</p></dd>
</dl>


<h1>Činnost Case Managera</h1>

<h2>Denní povinnosti</h2>

<p>CM musí být pro činností pro PERT k dispozici v pracovních dnech v době 9:00 -- 18:00 
CET. Práce může být vykonána kdykoliv v uvedené době, ale je nutno zkontrolovat alespoň 
jedenkrát dopoledne a jedenkrát odpoledne, zda nejsou hlášeny nové Případy.</p>

<p>CM také musí na závěr své denní služby zapsat do denníku stručné shrnutí událostí v PERTu 
v daném dni. </p>

<p>Organizace DANTE, jako provozovatel sítě GEANT2,  připravuje s přiměřeným předstihem 
rozpis služeb CM podle členských organizací. Každá organizace pak sama určuje, kdo z jejích 
pracovníků bude mít službu CM. Případné přesuny mezi organizacemi musí být vzájemně 
dohodnuté a nahlášené PM.</p>


<h2>Založení nového Případu</h2>

<p>Informaci o novém problému dostane CM většinou v listu pert-report. Před založením 
nového ticketu  musí zkontrolovat úplnost informací s ohledem na druh hlášeného problému. 
Pokud nějaké údaje nemá, musí si je sám zjistit např. dotazem u NOC nebo koncového 
uživatele. Je nutné znát:</p>
<ul>
<li>kontakt na uživatele, který hlásil problém</li>
<li>popis jak se problém projevuje a co uživatel požaduje</li>
<li>hardware a software koncové stanice (koncových stanic)</li>
<li>způsob připojení do sítě, příp. kontakt na místního správce sítě</li>
<li>výpis cesty mezi oběma koncovými body a její vlastnosti (např. s
použitím programů ping a traceroute)</li>
</ul>

<p>Teprve po shromáždění nezbytných informací CM založí nový ticket a začne
případ řešit.</p>

<h2>Postup při řešení Případu</h2>

<p>CM se snaží nalézt podobné rysy s některým dříve řešeným případem. V tom mu pomůže 
znalostní databáze. Pokud CM nalezne řešení, sdělí ho uživateli a požádá o vyjádření. Další 
možnosti jak postupovat:</p>
<ul>
<li>navržení testů nebo měření pro získaní nových dat nebo ověření nějaké
hypotéz</li>
<li>zaslání Případu do listu pert-discuss</li>
<li>žádost CME o pomoc s řešením</li>
</ul>
<p>O každé akci se uvádí záznam do ticketu. Pokud se při řešení Případu nic zjevného neděje, je 
na CM aby byl aktivní a dotázal se, zda je nějaký pokrok a případně sám navrhl nové testy. 
Cílem je dospět u každého případu k řešení, resp. zjistit, že řešení neumíme
nalézt.</p>

<h2>Uzavření Případu</h2>

<p>Když se CM domnívá, že Případ je vyřešen, doplní informaci o řešení do ticketu a změní jeho 
stav na RESOLVED. Poté požádá koncového uživatele a vyjádření.
V případě souhlasu  s řešením je stav ticketu změněn na CLOSED, v opačném případě se vrátí 
do stavu UPDATED. </p>


<h1>Závěr</h1>

<p>Systém PERT se neustále vyvíjí a doplňuje. Není proto vhodné chápat tuto  zprávu jako 
dokumentaci systému, ale jen jako úvodní text.</p>


</zprava>

