vendredi 17 juillet 2009

Wikibu

L'une des grandes critiques vis-à-vis des articles de Wikipédia, c'est bien entendu leur degré de fiabilité. Qui a écrit quoi? Et comment être sûr qu'un anonyme rédacteur n'est pas en fait un sinistre inidividu dont la seule raison d'être consiste à propager l'ignorance et le mauvais journalisme?

Arrive alors Wikibu, une création du centre d'éducation informatique de la haute école pédagogique de Berne. Je suis désolé pour les non-germanophones, mais il n'existe à l'heure actuelle pas d'autre version linguistique1.

Lorsque vous demandez un article à Wikibu celui-ci, en gros, va voir dans l'historique quelles sections ont été modifiées, depuis combien de temps (métrique de stabilité) et, il me semble, par qui. Il regarde aussi la présence de pages annexes (controverses de neutralité, nominations AdQ, longueur de la page de discussion, etc.), le nombre de visites et de rédacteurs, la présence de sources, und so weiter.

Il se sert de tout cela pour attribuer une note à l'article, accompagnée de quelques remarques sur, justement, la présence de controverses ou la diversité des auteurs. Une publication dans un journal à comité de lecture est en cours de rédaction pour expliquer tout cela et prévue pour l'automne, j'essaierai de laisser un mot quand elle sortira. Concentrons nous donc pour l'instant sur l'interface et les prestations de la bête.

Ce que je trouve intéressant, c'est que les développeurs de Wikibu ont mis exactement le doigt sur ce qui, sur Wikipédia, assure en grande partie la fiabilité d'un article: sa fréquentation et la variété de ses rédacteurs. C'est ainsi que l'article sur la Constitution finlandaise de 1919 (AdQ, quand même) n'obtient qu'un maigre 5/10 alors que celui sur la World Wrestling Entertainment (spectacles de catch) monte à 7/10 (idem que pour Michael Jackson). Ca ne veut pas dire que c'est bien écrit ou intéressant, mais qu'au moins c'est probablement juste. La meilleure note que j'ai trouvée en quelques essais concerne l'article sur la Suisse (9/10), très visité, bien sourcé et neutre (forcément ^_^):

Illustration de cette force du nombre, un sujet trollogène comme le SVP (Union Démocratique du Centre en français, parti de droite dure à tout le moins et comme son nom ne l'indique pas) réussit, du fait du trafic qu'il attire, à obtenir un honnête 8/10 - à l'opposé de l'opération Plomb durci (attaque israelienne sur Gaza de janvier dernier), article d'actualité qui n'attire probablement plus guère comme lecteurs que les pro- ou anti-de chaque camp (avec les guerres d'édition qui vont avec). Résultat: en dépit de ses 246 "sources", un maigre 4/10.

Nos contacts au sein de Wikimedia CH ont dit penser à intégrer, à terme, l'outil à l'interface de Wikipédia elle-même. Je doute que cela soit techniquement possible (ou souhaitable), mais si une traduction arrive un jour ce sera certainement un lien à garder en tête.




1. C'est pas faute d'avoir demandé, ou même d'avoir proposé de leur trouver un traducteur. Bon, au moins c'est pas écrit en schwytzerdütsch.

8 commentaires:

Anonyme a dit…

J'ai trouvé un 10/10 pour Adolf Hitler

Kimdime

Popo le Chien a dit…

Ah moi j'ai trouvé 10/10 pour l'article sur l'Euro, et celui sur le Deutsche Mark.

Poulpy a dit…

C'est dommage qu'ils n'explicitent pas la méthode de calcul de la note : on aurait pu adapter ça à fr:.

Anonyme a dit…

Il est illusoire de penser qu'un programme informatique peut évaluer de façon fiable un article. C'est une simple pondération à partir de variable prédéterminées, mais un programme informatique est incapable de comprendre ce qui est écrit ou de vérifier si c'est exact. Bref, c'est du pipeau pour relation publique, point barre.

gede a dit…

J'ai un vrai doute sur une variable que tu met en avant : le nombre d'auteurs. La plupart des articles de fond et un peu techniques ne sont écrits que par une poignet d'auteurs, parfois même un seul. C'est inévitable et ce n'est pas un mal : cela permet d'assurer une unité à l'article.

Popo le Chien a dit…

@Gede et Nonyme: il ne faut surtout pas confondre qualité et fiabilité: le nombre d'auteurs et le trafic, finalement, c'est cette vieille antienne wikipédienne qui est que plus un article est lu, plus il a de chance d'être corrigé en cas de vandalisme.

C'est pour ça finalement qu'on a un meilleur score sur le WWE que sur la constitution finlandaise, alors que l'article sur cette dernière est probablement mieux écrit, sans fautes d'orthographes, et certainement plus profond ou synthétique.

Bref, il faudra attendre la sortie de leur article pour en savoir plus.

@Poulpy: je vais demander si une fois le papier publié ils comptent mettre le code source en libre.

nojhan a dit…

@Anonyme (courageux) "un programme informatique est incapable de comprendre ce qui est écrit ou de vérifier si c'est exact"

En fait, un logiciel peut dans une certaine mesure savoir de quoi parle l'article (cf. [[Traitement automatique des langues]]) et utiliser plusieurs métriques de qualité (les mêmes qu'utiliseraient un être humain, par exemple). Si ces métriques sont bien fondées, le logiciel sera plus fiable qu'un béotien.

À l'inverse, aucun être humain ne peut objectivement définir ce qu'est la qualité d'un article ou même l'exactitude d'une retranscription d'un point de vue (par exemple). Ma mère est bien incapable de juger ce que vaut un article de Wikipédia.

Conclusion ? Il vaut mieux éviter les affirmations péremptoires si on ne veut pas dire des conneries... heureusement que l'anonymat existe :-)

nojhan a dit…

Sinon, pour aller plus loin dans le même domaine, on se renseignera avec intérêt sur les projets wikitrust [1] et wikipediaviz [2]

[1] http://trust.cse.ucsc.edu/
[2] http://bitbucket.org/proppy/wikipediaviz/ && http://wikipediaviz.lri.fr/index.php/Accueil