|
Mire jó a netdiagnosztika?
Ha Ön cégtulajdonos vagy cégvezető...
- képet kaphat webes és egyéb internetes szolgáltatásaik
minősé- géről, honlapjuk elérhetőségéről, az esetlegesen
szükséges fej- lesztésekről,
- azonnal értesülhet, ha az online szolgáltatásaik nem működnek, így cégük nem veszíthet sem potenciális ügyfeleket, sem presztizst,
- nem érheti meglepetés céges levelezőszervere leállása
esetén sem, nem marad le szerverhiba miatt fontos üzenetekről, hiszen netdiagnosztikai szolgáltatásuk 0-24
órában,
a hét minden napján üzemel.
Ha Ön rendszergazda...
- megtudhatja, hogy a szerverei adott időszakban mennyit
álltak, milyen minőségű volt a szolgáltatás, mekkorák voltak a válaszidők, mennyire bírták a terhelést,
- szerződéskötés után azonnal értesülhet e-mail-ben vagy
SMS-ben szerverei leállásáról, a hálózat kieséséről, a
weboldalak esetleges illegális megváltoztatásáról.
Ha Ön a sajtó munkatársa...
- érdekes mérési adatokat találhat a közigazgatás online
szolgálta- tásainak minőségéről épp úgy, mint a versenyszféra egyes szekto- rainak és ágazatainak a portáljairól.
Ha Ön biztonsági szakember...
- azonnal riasztást kaphat, ha egy webkamera vagy egy
internetes távfelügyeleti rendszer üzemképtelenné válik.
De ha Ön a fentiek közül egyik sem, akkor is hasznos lehet
demonstrációs oldalaink tanulmányozása, hiszen...
- láthatja, hogy melyik bank, biztosító, online bolt
elérhetősége jobb vagy gyengébb, hol több az
üzemszünet,
- megtudhatja (akár hónapokra visszamenőleg), hogy
adott időben adott közhivatalnál az elektronikus
ügyintézés üzemelt-e,
- mielőtt ingyenes postafiókot gyártana valamelyik
szolgáltatónál, meggyőződhet arról, hogy később milyen
sebességgel tudja majd leveleit elérni,
- sőt bizonyára további olyan információk is
kinyerhetők rendsze- rünkből, amire most még mi sem
gondoltunk.
A netDiag diagramok értelmezése
Napi idődiagram (http)
A legfontosabb és leginformatívabb diagram.
|
|
X tengelyén (1) az adott napon belüli órák
vannak feltüntetve (a skála 5 perc per pixel
felbontású), Y tengelyén (2)
pedig az átlagos válaszidők, logaritmikus skálán, 10 msec
és 10 sec között. Tíz másodpercre lett beállítva a
lekérdezések timeoutja, ezért ez a
skála felső határértéke. Válaszidő alatt a teljes html
oldalletöltés (képek, különálló
css-ek és scriptek stb.
nélküli) letöltési idejét értjük. A gyors hálózati kapcsolat
(100 Mbps) miatt ez az érték nem sokkal több, mint a szerver
valós válaszideje. A mérési
eredmények (3) öt perces
átlagai további csúszóablakos átlagolással lettek simítva a
paraméterek olyan beállítása mellett, hogy a tendenciák
világosan látszód- janak, az egymásutáni mérések apró eltéréseiből adódó zaj
azonban ne legyen zavaró. Az adott időszakra
jellemző maximális válaszidőket (4)
külön feltünteti a diagram, egy
kis vízszintes vonal 1/60-ad
nap (azaz egy 24 perces intervallum) csúcsértékét mutatja.
|
Az idődiagram nemcsak a válaszidőket,
de az időtúllépésből adódó (vagy egyéb, mint pl. Internal server error)
hibákat is feltünteti.
Az egyszer (vagy többször, de
szórványosan) előforduló hibákat kis vörös vonal
(2)
jelöli az X tengely fölött. Egy-egy vonal jelenléte azt
jelzi, hogy az öt perces időin- tervallumban legalább egy hiba volt.
Ha legalább három (vagy beállítástól
függően több, pl. öt) egymásutáni lekér- dezésnél hibaüzenet jön (azaz legalább
három percen keresztül elérhetetlen a weboldal), azt egy hosszú vörös
függőleges vonal (3)
jelöli. Példánkban kb. egy órányi üzemkiesést reprezentál a vörössel
jelölt terület.
Érdekes azt is megfigyelni, hogy a
válaszidő (és a max.válaszidő) értékek színe is változik
(1), a rövidebb időket zöld,
a közepeseket sárga, a hosszabbakat narancs, az időtúllépéseket vörös szín
jelöli, ill. ezek finom átmenetei.
|
|
|
|
|
A következő ábrát amiatt mutatjuk be,
hogy a szemléltethessük a túlterhelt rendszert.
Az alapjában is elég nagy (1 sec.
fölötti) alap válaszidő napközben tovább nő (3 sec. körüli
értékre) (1), emellett
jól megfigyelhetőek 8 és 16 h között a timeout-idő közelébe
érő, megnövekedett csúcsértékek (4),
a gyakran előforduló hibák (2)
és két rövid üzem- kiesés
(3) is.
Mindezek alapján annyi távolról is
megállapítható, hogy a szerver napközben jelentősen
túlterhelődik, így mielőbbi cserére vagy bővítésre (esetleg
clusterezésre vagy egyéb terheléscsökkentő megoldásra)
szorul, de érdemes lenne azt is megvizsgálni, hogy mi okozza
az 1 sec. körüli alap válaszidőket.
|
Ehhez az ábrához hasonlóval akkor
találkozhat, ha az aznapi aktuális monitorozást
nézegeti. A szürke terület (3)
10h után azt a részt jelöli, amiről még nem készültek
mérések. Az aktulis mérési értékek óránként egyszer
kerülnek fel a diagramra, tehát a 10 és 11h közötti
értékeket 11h után pár perccel láthatja leghamarabb.
Hasonlóan szürke terület jelzi azokat
az időszakokat, amikor valamilyen probléma folytán egyik
szereren sem történik mérés (reményeink szerint ilyen
igen ritkán fog előfordulni).
A mellékelt ábra érdekessége még,
hogy az 1 és 7h közötti időszakban ugrás- szerűen és
jelentős mértékben megnőttek a válaszidők
(1) az alapértékhez
(2) ké- pest. Mivel
nem valószínű, hogy éppen éjszaka ugrott meg a szerver
látogatottsága, valószínűleg inkább arról lehet szó,
hogy az eredetileg monitorozott webszerver szerepét az
éjszakai karbantartás idejére egy másik vette át, ill. a
másik lehetőség, hogy a hálózati kapcsolat módja
változott meg (valamilyen tartalék vonal lépett műkö-
désbe).
|
|
|
Napi idődiagram (ping)
|
|
A ping válaszidőket ábrázoló diagram csak
annyiban tér el az előzőleg bemutatott http
válaszidő-diagramtól, hogy a rövidebb válaszidőkből
(response time) adódóan más a (szintén logaritmikus) Y skála
(1) beosztása: a legrövidebb válaszidő 1ms (az ennél esetleg
kissebb értékek 1 mec-re lettek kerekítve), a legnagyobb
pedig 1 sec (ez egyben a ping timeout értéke is).
Az ábrázolás többirésze az
előzőleg bemutatottal megegyező: a válaszidők nagyságától
függően változik a megjenenített vonalszakasz színe
(2),
ábrázolásra kerülnek a csúcs- értékek
(3) és a timeout hibák
(4) is. Az egyszeri hiba ugyanúgy rövid vörös vonal, a
hosszabb üzemkiesés (ha legalább három percig nem jön
válasz) hosszú vörös vonal. |
Válaszidő tortadiagram
A válaszidők százalékos arányát
tünteti fel az egyes (szubjektíven meghatározott)
minőségi sávokban (2),
a kiváló (100msec alatti) válaszidőtől kezdve az elégsé-
gesig (3 sec fölött). Megmutatja az időtúllépések
(timeouts) és az egyéb hibák arányát, valamint az
esetlegesen hiányzó adatokét is.
A szemléltetés ún. tortadiagrammal
történik (1) a
mellékelt jelmagyarázat (2)
szerinti színekkel. |
|
|
Részletes listák, részletes hibastatisztika
|
|
A részletes, percenként monitorozott
adatok a 0-24 órás időskála (1)
adott órájára kat- tintva érhetőek el. A részletes lista új
ablakban nyílik meg (gondoljon erre, ha popup-stoppert
használ).
A hibastatisztika órás felbontásban mutatja az
időtúllépési (timeout) és egyéb hibák darabszámát
(3) ill. a darabszámnak megfelelő
színkódot
(2) a mélyzöldtől (nem
volt hiba) a vörösig (csak hiba az egész órában).
Terminológiánk szerint üzemszünetnek vagy leállásnak azt a
szituációt nevezzük, amikor megadott számú (általában három
vagy öt) hiba egymás után következik be (tehát pl. három
vagy öt percig nem jön válasz). A leállások számát az adott
órában külön sor
(4) mutatja. (Figyelem!
Ha pl. a leállás az előző órában következett be, az adott
órában pedig végig hibák jönnek csak, attól függetlenül az
adott órában a leállások száma nulla!)
Végezetül megtekinthető a leállások összesítése
(5) is, ahol táblázat
formájában látha- tó a leállás kezdete és vége, a leállás
időtartama percben, valamint a százalékos aránya is a teljes
naphoz képest. (A leállások a következő napra ill. napról
nem nyúlnak át: mivel a statisztika az adott napra szól,
éjfélkor véget érnek.) |
|