Za izradu statistike pristupa web-stranicama koristimo program Webalizer koji se nalazi u izborniku "Statistics".
Sama statistička obrada vrši se jednom dnevno i to u ranim jutarnjim satima.
Slijede osnovni pojmovi za lakše razumijevanje funkcija Webalizera.
- Hits predstavlja ukupan broj zahtjeva serveru za zadano razdoblje (mjesec, dan, sat i sl.).
- Files su oni hitovi za koje web-server nije generirao obavijesti, kao npr. “404-Not Found requests” i “requests for pages that are already in the browsers cache”.
- Tip kod promatranja razlike između “hitsa” i “filesa” možete dobiti grube predodžbe o broju ponovljenih zahtjeva posjetitelja. Što je veća razlika između tih dviju veličina, više je korisnika zahtijevalo stranice koje su već keširali.
- Sites je broj jedinstvenih IP adresa (hostnamea) koje šalju zahtjeve serveru. Trebalo bi pripaziti da se ti podaci ne zlorabe. Mnogi korisnici mogu pristupiti s neke stranice, također s raznih IP adresa, pa bi se broj korisnika vašeg servera trebao jednostavno kontrolirati.
- Visits se javlja kada neki udaljeni korisnik (site) šalje zahtjev za stranicom na vašem serveru prvi put. Sve dok se s iste stranice primaju zahtjevi, bez prijeđenog timeout perioda, bit će smatrani istim posjetom (visitom). Ako korisnik (site) šalje zahtjev vašem serveru i vrijeme od prošlog zahtjeva je veće od zadanog timeouta (po defaultu 30 min), posjet se ponovno evidentira (broji).
- Kilobyte (KB) je 1024 bajta. Koristi se da prikaže količinu podataka koja je bila prenesena između poslužitelja (servera) i udaljenog računala na temelju podataka nađenih u logovima servera.
- Site je udaljeno računalo s kojeg dolaze zahtjevi vašem serveru, i baziran je na IP adresi/hostnameu udaljenog računala.
- URL – Uniform Resource Locator (jedinstveni način lociranja). Svi zahtjevi prema web-serveru moraju sadržavati URL. URL predstavlja objekt negdje na serveru koji je dostupan udaljenom korisniku ili se javlja error (ie: 404 – Not found). URL-ovi mogu biti bilo kojeg formata (HTML, audio, grafike…).
- Referrers su oni URL-ovi koji vode korisnika do vaše stranice ili uzrokuju da pretraživač (browser) zahtijeva nešto s vašeg servera. Veliku većinu zahtjeva postavljaju vaši vlastiti URL-ovi, pošto HTML stranice sadrže linkove prema drugim objektima, kao npr. grafičkim datotekama. Ako jedna od vaših HTML stranica sadrži linkove prema 10 grafičkih datoteka (slika), tada će svaki zahtjev za HTML stranicom proizvesti 10 novih zahtjeva (hitsa) s referrerom označenim kao URL vaše vlastite HTML stranice.
- Search strings su dobiveni pregledavanjem referrera i traženjem poznatih uzoraka kod raznih pretraživača. Pretraživači i uzorci za pretraživanje (stringovi) mogu biti specificirani od strane korisnika bez konfiguracijske datoteke.
- User agents je uobičajeni naziv za pretraživače (browsere). Internet Explorer, Mozilla Firefox, Opera, Google Chrome… su pretraživači (user agents), i svaki se na neki način predstavlja vašem serveru. Imajte svejedno na umu da mnogi pretraživači dozvoljavaju korisniku da promijeni ime servera s kojeg pristupa vašoj stranici (reported name), pa možete vidjeti falsificirano ime korisnika.
- Entry/exit stranice su stranice koje se prve zahtijevaju kod pristupa (entry) i posljednje šalju zahtjev za raskidanje veze (exit). Te stranice (podaci) su proračunavane korištenjem “vizit” logike. Kada je posjet pokrenut, zahtjevana stranica se broji kao entry stranica, i svejedno koji je posljednji zahtijevani URL, broji se i kao exit stranica.
- Countries je statistički prikaz koji se bazira na vršnoj domeni (com, hr, net…) zahtjevajuće stranice. Pošto danas nije uvjet da vršna domena označava neku zemlju (npr. com – SAD), taj dijagram nije u potpunosti dosljedan. Npr. .IL domene mogu biti aktivne u Izraelu, ali mogu biti locirane u SAD-u ili drugdje. Najčešće vršne domene su .COM (SAD komercijalne), .NET (mreža), .ORG (neprofitne organizacije) i .EDU (obrazovne). Velik postotak zahtjeva također bi se mogao pokazati kao nerazriješen/nepoznat, s obzirom da se za prilično velik postotak DSL i drugih korisničkih ulaza ne može razriješiti ime, tako da im ostaje samo IP adresa.
- Response codes su definirani kao dio HTTP/1.1 protokola (RFC 2068). Te kodove generira webserver i induciraju dovršenje statusa svakog zahtjeva prema serveru.