B.V.L.G.

Mijn Initialen - Bedenkingen van en over mezelf, over business, over het webgebeuren, over social media, over alles rondom mij

09 augustus 2006

Vrijgeven van search logs door AOL

Naast de weblogs (bijvoorbeeld Smetty, TechCrunch of The Paradigm Shift) hebben de klassieke media (MSM of mainstream media) het verhaal gebracht van de logs van zoekopdrachten die eerdere deze week door AOL vrijgegeven werden en kort nadien weer ingetrokken (De Standaard, De Tijd).

AOL wenste de historiek van de zoektermen van 658.000 anonieme gebruikers over een periode van 3 maanden (maart tot mei) ter beschikking te stellen van onderzoekers. De gegevens zou maar 1.5% van de zoekacties op AOL in mei bevatten. Bovendien beperken de gegevens zich tot opzoekingen gedaan met de AOL client software in de VS. De historiek bevatte op zich geen persoonlijk identificeerbare gegevens. Op basis van de zoektermen zijn er echter wel pogingen om personen te identificeren.

AOL heeft zich enerzijds de woede op de hals gehaald van een heleboel personen die vinden dat het niet kan dat dergelijke gegevens vrijgegeven worden. Anderzijds zullen op basis van deze gegevens SEO-bedrijven gedetailleerd kunnen nagaan welke termen leiden naar welke websites.

Niettegenstaande AOL de historiek van zoektermen ondertussen verwijderd heeft van haar website, hebben verschillende personen het bestand op andere plaatsen beschikbaar gemaakt. Een eigen analyse van de historiek van zoektermen zal u hier niet vinden, daarvoor is het bestand mij toch iets te groot (meer dan 400 MB). Ik wil toch even kort ingaan op een lijst van sites die afgeleid werd uit de historiek van zoektermen. Op dit blog vindt u een lijst van meest bezochte sites. De lijst telt 459 verschillende sites. De top 10 bevat de volgende sites :
google.com
en.wikipedia.org
amazon.com
mapquest.com
imdb.com
myspace.com
yahoo.com
geocities.com
bizrate.com
answers.com
Het lijstje hieronder geeft de opdeling van deze sites per top level domeinnaam.
.com - 394 sites of 86%
.org - 21 sites of 5%
.gov - 20 sites of 4%
.net - 7 sites of 2%
.uk - 5 sites of 1%
overige - 12 sites of 3%
Deze lijst leidt tot de conclusie dat Amerikanen niet op zoek gaan naar informatie die zich op Europese sites bevindt (op enkele beperkte uitzonderingen na). De best scorende site is bbc.co.uk op plaats 73. De relevantie van het vrijgeven van de historiek van zoektermen voor Europese internet-gebruikers is bijgevolg nul komma nul. Het kan best zijn dat dit bestand een goudmijn is voor spammers voor het gebruik van zoektermen. Maar de impact op de Europese internet-gebruikers zal vermoedelijk minimaal zijn.

Het is opmerkelijk dat in de lijst van 459 meest doorverwezen sites een aantal sites helemaal niet voorkomen :
Blogger.com
Blogspot.com
Wordpress.com
Typepad.com
Ik had vroeger toch meermaals gelezen dat blogs de lievelingen waren van de search engines ...

Technorati : - -

1 Bedenking(en) :
Anonymous Anoniem had op 10 augustus, 2006 10:25, de volgende bedenking ...

Ik weet het niet of de data niet relevant is omdat het toevallig door Amerikanen ingegeven werd. Als ik een business had met een website, dan zou ik wel willen weten hoe mensen zoeken.

Je kan trouwens hier zoeken op 3 sleutels: http://www.aolsearchdatabase.com/

 

Heeft u ook een bedenking ?

<< Home

Related Posts with Thumbnails