B.V.L.G.

Mijn Initialen - Bedenkingen van en over mezelf, over business, over het webgebeuren, over social media, over alles rondom mij

28 juni 2007

De trukendoos van Alexa

Alexa is een leverancier van informatie over bezoekcijfers aan websites. Af en toe komen de Alexa-cijfers aan bod in berichten op dit blog. Aandachtige gebruikers van Alexa zullen al gemerkt hebben dat Alexa truken hanteert om hun gegevens niet zomaar vrij te geven.

De onderstaande screenshot toont de Alexa traffic rank van dit blog, de rank is 668,713.



Als het resultaat geselecteerd en gekopieerd wordt bekom ik dit resultaat : 641868,713 - wat duidelijk een ander cijfer is.

De reden hiervoor is in de HTML terug te vinden. Om screenscrapers het leven moeilijk te maken bevatten de resultaatpagina's allerlei overbodige toevoegingen die visueel niet zichtbaar zijn, maar die screenscrapers wel het leven moeilijk maken. De HTML code bevat in commentaar zelfs een aansporing om de gegevens op een andere manier te pakken te krijgen - waarvoor wel moet betaald worden.



De styles c*** worden gedefinieerd in een afzonderlijk CSS-bestand, met een toepasselijke naam : http://client.alexa.com/common/css/scramble.css. Door sommige styles als onzichtbaar te definiëren worden de overbodige cijfers niet getoond in een browser en worden enkel de correcte cijfers zichtbaar.



Indien je dus zelf gegevens wel wil vrijgeven maar niet wil dat anderen op een makkelijke manier de gegevens kunnen exploiteren moet je maar een kijkje nemen op de Alexa-pagina's om inspiratie op te doen. Wie weet vinden ze binnenkort nog een ander truukje uit om screenscrapers het leven moeilijk te maken

3 Bedenking(en) :
Anonymous Peter Dedecker had op 29 juni, 2007 09:11, de volgende bedenking ...

Ik vraag mij af hoe ze dergelijke gegevens kunnen berekenen...

De mijne is trouwens 1,745,887

 
Blogger bvlg had op 29 juni, 2007 10:23, de volgende bedenking ...

Alexa zegt dat de traffic statistieken gebaseerd zijn op het surfgedrag van personen die de Alexa toolbar geïnstalleerd hebben in IE (niet beschikbaar voor FF).

Persoonlijk ken ik echter niemand die deze toolbar effectief gebruikt (ikzelf ook niet ...).

 
Blogger Frank had op 20 juli, 2007 11:11, de volgende bedenking ...

Wil je trouwens de Alexa data hebben, hoef je niet te beginnen met screenscrapers. Er is een api die je kan gebruiken en die OK werkt (wel traag). Het dingetje is betalend, maar is spotgoedkoop, tenzij je een paar miljoen sites wil opvragen.

 

Heeft u ook een bedenking ?

<< Home

Related Posts with Thumbnails