:

Szerző: Dojcsák Dániel

2008. október 16. 17:44

Alig található szabványos weboldal az interneten

A böngészőiről ismert norvég Opera Software nyilvánosságra hozta egy folyamatban lévő kutatásának részeredményeit, betekintést engedve a jelenleg működő weboldalak szerkezetébe.

[HWSW] A böngészőiről ismert norvég Opera Software nyilvánosságra hozta egy folyamatban lévő kutatásának részeredményeit, betekintést engedve a jelenleg működő weboldalak szerkezetébe.

MAMA megmondja

A cég a kutatáshoz létrehozott egy eszközt (MAMA - Metadata Analysis and Mining Application), mely átrágta magát 3,5 millió weboldalon, indexelve azok felépítését, programozási megoldásait és egyéb statisztikai adatait. Az összegyűjtött adatok elemzésével az Opera mérnökei a webfejlesztésben felmerülő trendekkel kapcsolatban jutottak meglepő eredményekre, emellett megvizsgálhatták azt is, hogyan használják a szabványos technológiákat szerte a világhálón.

Az előzetesen publikált adatok alapján jónéhány érdekesség derült ki a HTML-elemek használatával kapcsolatban. Az még nem meglepő, hogy a MAMA által elemzett oldalak legnépszerűbb HTML-címkéi a head, title, html, body, a, meta, img és a table voltak, míg a legritkábban használtak a var, del és a bdo, hiszen ezt kutatás nélkül is megmondta volna bárki. Az sem borzolja fel a kedélyeket, hogy CSS-t főként színezésre és betűformázásra használnak a weboldalkészítők.


Könnyű hibázni

Az viszont már figyelemfelkeltőbb, hogy az összes weboldal 35 százaléka használ Adobe Flash-t, sőt, Kínában az oldalak kétharmadán találhatóak ilyen tartalmak. Az AJAX technológiákat viszont csak az oldalak 3,2 százalékán találtak a robotok, ebben éppen az Opera hazája, Norvégia volt kiugró a maga egytizedes arányával. Abszolút elterjedtnek számít viszont a CSS, ami a vizsgált oldalak 80 százalékában volt fellelhető, JavaScript-kódokat pedig a lapok háromnegyede futtat.

Szabványok? Dehogy!

Az Opera az alaptechnológiák mellett a MAMA-t egy W3C-jóváhagyó eszközzel is felvértezte, hogy ne csak az derüljön ki, hogy mit használnak a készítők, hanem az is, hogy mennyire sikerül betartaniuk a szabványokat. Az eredmények igazán kínosak, a meglátogatott weblapoknak csak 4,13 százaléka volt a szabványoknak megfelelő. Ennél csak az elképesztőbb, hogy az oldalak több mint fele viselt valamilyen tanúsítványt arról, hogy teljesen megfelel az előírásoknak és szabványoknak. A kutatók nem feltételezik a rosszindulatot, inkább arról lehet szó, hogy az eredeti tartalom valóban szabványos volt, de a később végrehajtott változtatások, hozzáadott részek már nem.

Kíváncsiságból az Opera elemezte azt is, hogy ezek az oldalak mely webszerkesztővel készültek, és van-e összefüggés a hibák előfordulása és a használt szoftverek között. Meglepetésre az Apple iWeb hozta a legmagasabb arányban az érvényes oldalakat 81 százalékkal, míg a népszerű Adobe Dreameweaver mindössze 3,4 százalékot produkált. A kutatás következő lépéseként egy keresőmotort építenek az indexelt adatbázisra, így a web- és böngészőfejlesztők, illetve a szabványokkal foglalkozó szakemberek könnyen juthatnának valós adatokhoz az élő weboldalakkal kapcsolatban.

A MAMA-projekt során többek közt a webszerverek megoszlásáról, a dokumentumok átlagos méretéről, felépítéséről is gyűjtöttej adatokat. Aki kíváncsi a részletes számokra, az böngészheti az eredményeket az Opera fejlesztői oldalán.

Eleged van az eltérő környezetekből és az inkonzisztens build eredményekből? Frusztrál, hogy órákat kell töltened új fejlesztői környezetek beállításával? Többek között erről is szó lesz az AWS hazai online meetup-sorozatának ötödik, december 12-i állomásán.

a címlapról