Ontologie vs folksonomie

De Wiki ECOPOL

classification, pertinence, folksonomie, tag, métatag



Le Web a été créé pour répondre à un problème de gestion et de diffusion de l'information, dont une partie repose sur une bonne catégorisation. Tim Berners-Lee travaillait au CERN[1], à la frontière entre la Suisse et la France, près de Genève. Le CERN est une entité avec un budget de plusieurs milliards d'euros et des départements de recherche très importants.

Un jour, un des responsables de recherche débarque dans son bureau et lui explique qu'il doit construire une base de données accessible pour tous avec une hiérarchie où le département A est tout en haut de la pyramide de l'information et pour accéder aux départements B, C et D, il faut passer par le département A. Ensuite, le responsable du département B débarque dans son bureau et lui explique, au contraire, que le système doit mettre en valeur le département B, car c'est le plus important et qu'il a le plus gros budget.

Mais voilà que débarque le responsable du département C, qui lui signifie que personne n'utilisera le système aux dépens du département C si la base de données met en évidence le département A ou B.

À chaque fois, Tim Berners-Lee doit repenser un système. À un certain moment, il en a tellement assez qu'il décide d'utiliser une catégorisation de type « bazar » et non plus de type « cathédrale ». C'est-à-dire qu'au lieu d'avoir une clé de voûte dont tout dépend, il choisit le système où toutes les informations sont liées les unes aux autres et on peut avoir plusieurs sommaires, plusieurs catégorisations sans qu'une ne prédomine nécessairement sur l'autre. Ainsi, tout le monde est content ! C'est comme ça que le Web est né.


Encadré : Comment taguer ?

Voici quelques éléments de catégorisation pour choisir les tags de vos publications :

  • géographique : local, régional, national ;
  • temporel : jour/mois/année ;
  • linguistique : FR, EN, DE ou français, anglais, allemand ou French, English, German ;
  • thématique / sectoriel : par domaine d'action ;
  • type d'information : opinion, FAQ, mode d'emploi/recette/howto ;
  • format : article à lire en ligne, article à imprimer (PDF), vidéo, audio, diaporama :
  • public cible / niveau : débutant, expert ;
  • maturité : brouillon, bêta/RFC, mûr, dépassé mais laissé en ligne pour archive.

Fin d'encadré


Ensuite, on s'est mis à mettre des mots-clés de références à l'intérieur des pages Web, qui étaient cachés (on appelle ça des « métatags »), invisibles pour le simple lecteur. Par exemple, un site qui traite de petites annonces de voitures mettra comme mots-clés « petites annonces », « voiture », « auto », « moto », « 4 roues », « seconde main », etc. Mais des petits malins ont eu l'idée de mettre des mots-clés très recherchés, comme « tourisme », « gratuit » ou « météo » pour référencer leurs pages, alors qu'en fait, il s'agissait de sites pornographiques. La page d'accueil donnait l'impression que c'était un site généraliste, avec la météo ou l'actualité, mais si vous cliquiez sur n'importe lequel des liens de la page, vous arriviez sur des images osées. Résultat des courses : Google trouva le premier l'idée de référencer non plus sur la base de ce que les responsables de site donnent comme mots-clé, mais uniquement en fonction des textes qui sont disponibles dans le site, en plus du nombre et du contenu des liens qui pointent sur chaque page du site. C'est le système du « PageRank » qui, dès la fin des années 1990, classe les résultats de recherche selon un algorithme d'évaluation de la pertinence, complexe et secret, ce qui augmente sensiblement la qualité des recherches.

La grande nouveauté était toute simple, il suffisait d'y penser, et les premiers investisseurs de Google ont mis des centaines de millions pour permettre à Google de ramasser le marché de la recherche sur le Web. Les « métatags » dans les sites et la culture même du référencement d'un site à l'autre ont alors radicalement perdu leur intérêt. Par contre, très rapidement, est apparue une nouvelle manière de catégoriser l'information, plus populaire, qui s'appelle tout simplement le tag.

Folksonomie

La musique folk, c'est la musique populaire. Volkswagen, c'est la voiture du peuple. La folksonomie est la catégorisation par le peuple. En clair, un système de catégories où il n'y a aucune autorité supérieure qui décide des bons mots-clés pour catégoriser, mais chacun choisit de faire comme il le veut, souvent pour lui-même avant tout.

Le problème a priori d'un chaos s'avère en réalité en phase avec la culture du Web qui est de type « bazar » et donc chaotique et non pas de type « cathédrale » avec une autorité supérieure qui définit d'avance un système de classification rigide. C'est d'ailleurs en phase avec les propriétés sociotechniques du numérique, c'est-à-dire que n'importe qui peut, par la simple qualité de ses contributions à la catégorisation d'articles, non pas imposer mais inspirer largement les contributions futures à des tags, car une personne qui va employer un tag aura l'habitude de regarder d'abord les tags qui ont déjà été postés sur une même ressource.


Encadré : Tag et tag

Tag dans la rue : petite note de quelqu'un pour mentionner sa présence, manière populaire d'exprimer qu'on existe. Tag sur l'Internet : la même chose. Il y a des tags qui sont des comportements de vandales comme celui qui consiste à aller sur un wiki et à effacer le contenu d'un article utile pour y mettre de la publicité ou de l'autopromotion.Il y a aussi des tags qui sont utiles, comme ceux qui consistent à associer des mots-clés à un article pour que tout le monde puisse faire des recherches dans une base de données d'articles en fonction des mots-clés. Par exemple pour cet article les tags seraient « tags, catégorisation, folksonomie, histoire, Tim Berners-Lee, Web ».

Fin d'encadré


Notes et références

  1. Centre européen de recherches nucléaires.