Linux Days 2024
We would like to invite you to the next edition of the biggest Czech Linux conference Linux Days 2024. For this year we have prepared a very interesting stand together with our colleagues from the e-INFRA CZ consortium. At the same time, several of our colleagues contributed with their presentations.
The program is in Czech language.
About the event
We would like to invite you to the next edition of the largest Czech Linux conference Linux Days 2024. For this year we have prepared, together with our colleagues from the e-INFRA CZ consortium, an interesting stand where you can meet us and discuss professional topics or get the opportunity to work on your bachelor/diploma thesis.
Our experts also contributed to the program with their lectures. Below you will find an overview of what you can look forward to and where you can listen to them outside our stand.
Program
XDP (eXpress Data Path) je technologie založená na eBPF (extended Berkeley Packet Filter), která je součástí Linuxového jádra. XDP si klade za cíl zvýšit propustnost síťového stacku. Hlavní myšlenkou je nahrát přímo do kernelu malý program, který je spuštěn pro každý přijatý paket.
XDP umožňuje číst a měnit data paketu a rozhodnout o jeho osudu ještě před tím, než dojde k náročnému zpracování vyššími síťovými vrstvami, zatímco technologie eBPF garantuje bezpečné spouštnění programu v privilegovaném režimu.
Pro výkonostně náročné použití nabízí XDP možnost obejít síťový stack a posílat pakety přímo do specializované uživatelské aplikace. Tento režim se nazývá AF_XDP nebo XDP zero copy a v rámci samotného kernelu nabízí alternativu ke specializovaným frameworkům pro obcházení síťového stacku, jako je např. DPDK (Data Plane Development Kit).
Národní infrastruktura e-INFRA CZ v rámci centra CERIT-SC již více než půl roku provozuje vlastní instance velkých jazykových modelů určené pro vědecký výzkum. V této prezentaci představíme důvody, proč se rozhodujeme pro vlastní provoz místo využití komerčních řešení, a zároveň se zaměříme na teoretické aspekty, jako je vztah mezi počtem parametrů modelu a jeho výkonem, princip kvantizace modelů, význam KV cache a možnosti lokálního provozu modelů. Hlavní část prezentace bude věnována našim praktickým zkušenostem, tzv. lessons learned, včetně paměťových nároků jednotlivých modelů, vlivu KV cache a velikosti GPU paměti na počet obsloužených klientů a dalších provozních souvislostí. Součástí budou také optimalizace, které se osvědčily pro efektivní běh modelů, a přehled nečekaných problémů, například chybné alokace paměti v některých verzích Linuxových jader nebo obtížím s paralelním během více modelů na stejných GPU. Prezentace ukáže, že i na přiměřeně výkonném hardware lze úspěšně provozovat velké paměťové modely s vysokých výkonem.
CESNET, CERIT-SC