Alig található szabványos weboldal az interneten
A böngészőiről ismert norvég Opera Software nyilvánosságra hozta egy folyamatban lévő kutatásának részeredményeit, betekintést engedve a jelenleg működő weboldalak szerkezetébe.
MAMA megmondja
A cég a kutatáshoz létrehozott egy eszközt (MAMA - Metadata Analysis and Mining Application), mely átrágta magát 3,5 millió weboldalon, indexelve azok felépítését, programozási megoldásait és egyéb statisztikai adatait. Az összegyűjtött adatok elemzésével az Opera mérnökei a webfejlesztésben felmerülő trendekkel kapcsolatban jutottak meglepő eredményekre, emellett megvizsgálhatták azt is, hogyan használják a szabványos technológiákat szerte a világhálón.
Az előzetesen publikált adatok alapján jónéhány érdekesség derült ki a HTML-elemek használatával kapcsolatban. Az még nem meglepő, hogy a MAMA által elemzett oldalak legnépszerűbb HTML-címkéi a head, title, html, body, a, meta, img és a table voltak, míg a legritkábban használtak a var, del és a bdo, hiszen ezt kutatás nélkül is megmondta volna bárki. Az sem borzolja fel a kedélyeket, hogy CSS-t főként színezésre és betűformázásra használnak a weboldalkészítők.
Könnyű hibázni
Az viszont már figyelemfelkeltőbb, hogy az összes weboldal 35 százaléka használ Adobe Flash-t, sőt, Kínában az oldalak kétharmadán találhatóak ilyen tartalmak. Az AJAX technológiákat viszont csak az oldalak 3,2 százalékán találtak a robotok, ebben éppen az Opera hazája, Norvégia volt kiugró a maga egytizedes arányával. Abszolút elterjedtnek számít viszont a CSS, ami a vizsgált oldalak 80 százalékában volt fellelhető, JavaScript-kódokat pedig a lapok háromnegyede futtat.
Szabványok? Dehogy!
Az Opera az alaptechnológiák mellett a MAMA-t egy W3C-jóváhagyó eszközzel is felvértezte, hogy ne csak az derüljön ki, hogy mit használnak a készítők, hanem az is, hogy mennyire sikerül betartaniuk a szabványokat. Az eredmények igazán kínosak, a meglátogatott weblapoknak csak 4,13 százaléka volt a szabványoknak megfelelő. Ennél csak az elképesztőbb, hogy az oldalak több mint fele viselt valamilyen tanúsítványt arról, hogy teljesen megfelel az előírásoknak és szabványoknak. A kutatók nem feltételezik a rosszindulatot, inkább arról lehet szó, hogy az eredeti tartalom valóban szabványos volt, de a később végrehajtott változtatások, hozzáadott részek már nem.
Kíváncsiságból az Opera elemezte azt is, hogy ezek az oldalak mely webszerkesztővel készültek, és van-e összefüggés a hibák előfordulása és a használt szoftverek között. Meglepetésre az Apple iWeb hozta a legmagasabb arányban az érvényes oldalakat 81 százalékkal, míg a népszerű Adobe Dreameweaver mindössze 3,4 százalékot produkált. A kutatás következő lépéseként egy keresőmotort építenek az indexelt adatbázisra, így a web- és böngészőfejlesztők, illetve a szabványokkal foglalkozó szakemberek könnyen juthatnának valós adatokhoz az élő weboldalakkal kapcsolatban.
A MAMA-projekt során többek közt a webszerverek megoszlásáról, a dokumentumok átlagos méretéről, felépítéséről is gyűjtöttej adatokat. Aki kíváncsi a részletes számokra, az böngészheti az eredményeket az Opera fejlesztői oldalán.