Tagcloud
Tagcloud is een gratis dienst die toelaat een idee te krijgen van de keywords die in één of meerdere RSS-feeds voorkomen.
Het overzicht van de keywords van deze weblog krijg je op http://www.tagcloud.com/cloud/html/bvlg/default/50.
Het resultaat op het ogenblik van de posting zag er zo uit :
Het is duidelijk dat de technologie voor het herkennen van de keywords in een Nederlandstalige weblog nog niet goed werkt. Hiervoor doet Tagcloud overigens beroep op de Content Analysis web service van Yahoo.
Je kan natuurlijk zelf een stopwoordenlijst definiëren in Tagcloud, zodat woorden als "van" en "dat" niet meer zullen voorkomen.
Ik heb er bewust voor gekozen geen stopwoordenlijst te gebruiken. De problematiek van het opbouwen van een goede stopwoordenlijst, zeker voor webblogs in een andere taal dan het Engels komt overigens op andere sites ook aan bod, bv op http://www.gorissen.info/Pierre/item/2005/7/2/tags-on-a-cloudy-day voor het Nederlands of op http://gotzespace.dk/archives/2005/07/tag-lovers_deli.html voor het Deens.
Waarom zouden Tagcloud of Yahoo automtisch niet de taal van feed niet kunnen herkennen (cfr Google) en het opsporen van de kernwoorden daaraan aanpassen ?
Heeft u ook een bedenking ?
<< Home