mercredi 26 août 2009

Du pétrole et des idées

Une fois n'est pas coutume, on va balancer un peu sur les collègues wikipédiens: certains d'entre nous parlent trop, et j'ai les noms.

Je suis parti ce matin d'une réflexion très simple: ce sont toujours les mêmes qu'on lit sur les pages méta de Wikipédia. Les pages méta, vous le savez, sont celles qui parlent de tout ce qui est autour du projet mais n'en constitue pas le coeur encyclopédique: elles commencent généralement par l'indicatif Wikipédia. Bistro, Prises de décision, Bulletin des admins et pages de maintenance et d'élections diverses les constituent. S'il y a des espaces de socialisation sur le projet, les voilà - ces sections sont apparues progressivement, elles n'étaient pas livrées clef en main avec le projet, une demonstration que l'homme est un animal social et a besoin de cela pour travailler, peut-être. On y donne en tout cas, c'est important, son opinon sur ce que devrait être Wikipédia. On y donne, c'est important, son opinion.

On y donne son opinion.

Tous ceux qui lisent ne serait-ce qu'occasionnellement et en diagonale les diverses pages dont je parlais ci-dessus ont en tête quelques noms dont ils se souviennent parce qu'ils reviennent plus souvent que les autres. En ce qui me concerne, j'ai pourtant l'impression que les journées n'étant pas extensibles on ne peut sur Wikipédia faire que l'une de ces deux choses:
  1. Améliorer le contenu encyclopédique;
  2. Donner son opinion sur ce que le contenue encyclopédique devrait être.

Bon, ce n'est pas entièrement vrai. On peut argumenter que c'est plus facile de donner son avis en PàS (ou sur le bistro) que d'écrire un paragraphe sur l'influence jésuite dans l'émergence d'un guarani normalisé, certes, mais intuitivement je dirais que la différence n'est pas si énorme: c'est aussi très rapide de surveiller les modifications récentes et de faire la chasse aux vandalismes.

C'est sur ce constat que j'ai décidé de griffoner sur un coin de table ce que j'appellerai très modestement mon petroleum index1. Petroleum comme dans pétrole, parce que c'est bien connu que ceux qui n'ont pas de pétrole ont des idées (et qu'ils les partagent).

Méthode:
Les gens:
le domaine de l'arbitraire. J'ai pris de manière quasi-aléatoire les gens dont le pseudonyme me venait spontanément à l'esprit (et donc essentiellement croisés sur le Bulletin des Admins), plus quelques noms glanés sur le bistro, histoire d'avoir des piliers. Si vous n'êtes pas dans la liste n'y voyez rien de personnel, c'est juste qu'au bout d'un moment j'ai trouvé que j'avais un échantillon assez large. Mes excuses à Moez et Serein, pourtant fidèles lecteurs, ainsi qu'à tous les autres. Afin de lisser les résultats (par exemple en évitant les fautes de débutant qui consistent à ne pas prévisualiser et gonfler inutilement historiques et comptes d'éditions), je n'ai gardé que les contributeurs ayant passé (ou approchant) les 10'000 contributions.

Les chiffres: le domains de l'aléatoire. Me basant sur l'Editcount d'Interiot pour chacun, j'ai relevé le nombre d'éditions sur les espaces méta susnommés (Wikipédia: et Discussion Wikipédia:). J'ai comparé cette valeur avec le nombre d'éditions dans l'espace encyclopédique. ce qui m'a donné un pourcentage. Il est chez moi de 43%. Ce qui veut dire qu'en gros pour chaque notice sur le bulletin des admins ou pages de maintenance je fais 2.5 modifications dans l'espace encyclopédique. Voilà pour le métrique d'opinion sur Wikipédia elle-même.

Je précise d'emblée qu'on a un biais pour les admins, qui par définition doivent intervenir sur les pages métas quand une tâche de maintenance est complétée (dans mon cas par exemple les demandes d'usurpation, dont j'ai fait ma spécialité) - ce n'est pas à proprement parler une expression d'opinion, on dira donc que cette valeur est structurellement surévaluée, nais pas de beaucoup - trancher sur une suppression est parfois l'expression d'une opinion, ainsi que de répondre aux requêtes de suppression et restauration. Néanmoins, je pense que cette valeur est légèrement surévaluée pour les admins.

Un plus gros problème, me suis-je rendu compte, est qu'avec le renommage de certaines pages de maintenance dans l'espace de discussion, on perdait un niveau de granularité: le débat entre suppressionistes et inclusionnistes est avant tout un conflit sur ce que l'encyclopédie doit être (un projet élitiste ou un fourre-tout), et c'est donc l'expression d'une opinion, en tout cas pour ceux qui y viennent régulièrement. J'ai donc créé un deuxième métrique plus large, qui compte le nombre d'éditions dans l'espace encyclopédique par rapport aux nombres d'éditions totales. On obtient là un deuxième pourcentage (43% aussi chez moi), qui traduit l'activité encyclopédique à proprement parler. Là encore les admins sont désavantagés, parce que leur travail de maintenance (suppressions, blocages) n'est partiellement pas compté par cet Editcount. Bref, on a vous l'aurez compris une certaine marge d'erreur derrière nous, mais pas suffisamment pour ne pas se faire une idée de ce qui se passe.

Quoi qu'il en soit, une fois tout cela fait on obtient donc deux valeurs: une mesure de son activité d'opinion (les idées), et une de son activité encyclopédique (le pétrole). Le rapport entre les deux nous donne une troisième valeur, mon petroleum index: plus celui-ci est élevé, moins il semble que vous ayiez de pétrole dans les poches, si j'ose dire.

Dans mon cas on obtient 1, tout rond2. Prosaïquement je traduis cela par le fait que pour chaque ajout dans l'espace encyclopédique je me permets de dire ce que je pense de ce dernier. Donnant-donnant, le blog c'est bonus.

Indice pétrolier de quelques wikipédiens. Cliquez pour agrandir.

Premier constat: on a dans notre échantillons deux champions de l'opinion, Teofilo (11.88) et O.Hammam (11.16), qui paient tous deux un comportement en partie passé, et un champion du boulot encyclopédique - Monsieur Rogel (0.07). Giovanni-P (ex-SalomonCeb dont je n'ai pas compté les contributions du précédent compte) le suit de loin à 0.223, talonné par Guil2027 (0.24) et Cosmos (0.28).

Deuxième constat: la plupart des gens semblent décidés à contribuer plus qu'ils ne s'expriment, et la zone 0.2 à 1 est dense, avec 18 personnes réparties sur 0.8 points. On peut aussi en profiter pour s'émerveiller de la valeur symbolique du 1, puisqu'une fois celle-ci passée l'étalement devient particulièrement substantiel.

Les conclusions sont multiples, et je vous laisse les tirer chez vous ou dans les commentaires (je suis notamment preneur d'une manière permettant de raffiner tout cela et éviter certains biais). Une qui me vient à l'esprit est que ça me conforte dans ce que j'ai toujours vu comme une évidence: donner son avis à tout bout de champ n'est pas une recette gagnante pour influer sur la vie Wikipédienne. A l'inverse, ce n'est pas parce que vous distillez votre sagesse avec parcimonie qu'on vous prendra forcément plus au sérieux (mais disons qu'au moins on respectera votre travail) - qualité et quantité ne sont, dans un cas comme dans l'autre, pas liées.

Vous apprécierez qu'il ait fallu un si long post pour démontrer cette évidence.



1: les noms anglais ça fait tout de suite plus sérieux.
2: je me suis toujours pris pour un gars équilibré, et là les chiffres ne mentent pas.

3: Si vous êtes connaisseurs du microcosme wikipédien (et des derniers psychodrames), vous apprécierez sans aucun doute l'ironie de tout cela.

18 commentaires:

Grimlock a dit…

Marrant ça, je me serais vu plus décalé vers le 1 et plus. Je pense que les RC sont surévaluées pour expliquer ce décalage vers le kérosène :).

DC a dit…

Je n'ai pas tout compris à ta méthode (en particulier comment tu as pris en compte les actions administratives) mais je suis tout de même surpris de ne pas avoir plus d'"idées". Fichtre.

Popo le Chien a dit…

C'est marrant, moi aussi je me pensais surévalué, mais il est possible que les premiers mois (ou année(s)) d'activité, où l'on n'est pas admin, donnent une certaine avance en "pétrole" qui fait que même si sur le tard on intervient plus souvent dans les débats méta, la moyenne évolue plus lentement (parce qu'on contribue quand même encore dans l'espace encyclopédique).

Le problème des actions administratives, c'est qu'elles ne sont pas comptabilisées dans les divers totaux, cela induit donc un biais parce que, pour l'essentiel, elles ont lieu dans main.

Popo le Chien a dit…

En fait on a un bon exemple de résultat atypique avec DarkoNeko, qui a plein de suppressions à son actif (non comptabilisées) et une grosse période d'intervention sur des pages de discussion utilisateur au printemps-été 2007 (je suppose pour des pose de bandeau de signalement de proxy?). Mais son cas doit être assez rare - je sais que j'avais éliminé Gribeco pour des raisons similaires.

DC a dit…

Donc si tu prenais en compte les actions administratives, j'aurais encore plus de pétrole ?

Popo le Chien a dit…

A priori ça me semble probable.

DC a dit…

Je vais demander le renommage de mon compte : Le Texan.

gede a dit…

Je suis heureux d'être une fourmi encyclopédique, et non un penseur en chambre : si tu n'as pas pensé à moi, cela ne peut être que la seule raison...

Pour Olivier Hammam, il y a un biais : l'Oracle. Olivier Hammam est un pilier de la chose : à vue de nez, 30 à 40% de ses contributions en relèvent. On peut y discuter sans fin, sans discuter de Wikipédia, ni améliorer le contenu encyclopédique.

Ce qui me conduit à l'idée qu'un indice plus large opposant les "discuteurs" (ceux qui s'expriment sur toutes les pages où on n'écrit pas directement un article) aux "producteurs de contenu" serait sans doute intéressant...

Popo le Chien a dit…

@Cosmos: méfie-toi je peux le faire;

@Gede: en fait j'ai surtout pris les 10 ou 20 noms qui sortaient plus d'une fois sur le BA de la semaine précédente, peut-être que tu n'es pas intervenu (d'un autre côté tu n'es pas familier des remarques incroyablement inepte qu'on croise parfois, ça aide à rester sous les radars)?

Sinon effectivement l'indice est encore grossier, il doit y avoir moyen d'affiner pour cerner les discussionneurs (sauf que comment on distingue les avertissements après vandalisme des discussions tout court?).

DC a dit…

Argh !

Korrigan a dit…

Il faudrait ajouter les notes de blog là-dedans :-)

Popo le Chien a dit…

Ah ben non, j'ai dit le blog c'est bonus.

A vrai dire j'encourage vivement tous ceux qui ont plein d'idées à ouvrir un blog, ça désengorgera les pages méta.

gribeco a dit…

Pour le rapport palabres/contributions, "discussion:Wikipédia"/main doit donner une meilleure idée, non ? (Et ça élimine d'office le BA, le Bistro. et l'Oracle.)

Popo le Chien a dit…

Parce que le Bistro et l'oracle (voir le BA), c'est des discussions sérieuses? Je ne suis pas sur de te suivre, sur ce coup.

Anonyme a dit…

Ce n'est pas très probant. Lorsqu'on met le bandeau de suppression, c'est comptabilisé dans Main.
Si Patrick Rogel met une centaine de fois le bandeau de suppression, ce ne sont pas des contributions purement encyclopédiques pour autant.

Popo le Chien a dit…

@nonyme: non, ça se verrait parce que chaque création de PàS se fait dans l'espace discussion (et il a plus de 10000 editions, et certainement pas 5000 propositions à son actif).

Litlok a dit…

Heureusement que tu ne m'as pas compté, il y a un gros biais en raison des corrections de liens vers les pages d'homonymie que j'effectue. Cela "plombe" passablement mes contribs sur Main... alors que je ne considère pas cela comme une activité d'ajout de contenu encyclopédique.

Du coup, j'obtiens un petroleum index de l'ordre de 0,05 :-)

(NB: le compteur d'Interiot ne donne pas des résultats corrects pour moi, car il y a eu un bogue lors du renommage de mon compte, mais l'ordre de grandeur reste le même...)

darkoneko a dit…

Arf tiens, j'avais raté ce billet. Une chance que tu l'ai lié dans celui d'aujourd'hui :)


En fait on a un bon exemple de résultat atypique avec DarkoNeko, qui [...] une grosse période d'intervention sur des pages de discussion utilisateur au printemps-été 2007

Nope, c'est la période ou je bienvenutais massivement à la main, dans les mois qui ont précédé l'automatisation du procédé par mon bot Loveless (tu notera la barre bleue qu'il a a partir de septembre).

mais n'empeche, mon indice est assez déprimant :) je me demande ce qu'il donnerait mois par mois au lieu d'un simple indice global (car ça peut indiquer une evolution du type de contributions avec le temps)