lundi 27 septembre 2010

Suivisme

Je ne me lasse décidément pas des statistiques qui n'en sont pas. Je jouais l'autre jour avec cet outil qui permet de savoir combien de personnes ont inclu une page lambda de l'espace wikipédien dans leur liste de suivi. Le jeu est simple, puisqu'il consiste à taper le nom d'une page au hasard et de voir au final si les Beatles sont finalement plus populaires que Jésus-Christ (ils ne le sont pas, mais de peu), si Genève est plus suivie que Zurich (elle l'est), si la bière est plus suivie que le vin (oui).

Outre le fait qu'on puisse comparer presque n'importe qui à presque n'importe quoi, je me dis qu'incorporer un article à sa liste de suivi est un geste qui n'est jamais totalement anodin (sauf peut-être pour les articles qu'on a créés soi-même et pour lesquels c'est automatique). Est-ce un reflet de sa proximité par rapport au sujet ou bien, en tant que Wikipédien, un réflexe vis-à-vis d'un article qu'on sens plus chahuté que la moyenne et sur lequel il est bon de garder un oeil?

C'est peut-être un mélange des deux mais, l'un dans l'autre, nous sommes rarement seuls dans nos choix.

jeudi 23 septembre 2010

Sans opinion

Contrairement à d'autres blogs de qualité, l'auteur de ces lignes n'aura rien à dire sur le millionième article wikipédien.

Il n'a de toute façon pas fini de lire la majeure partie des autres.

mercredi 22 septembre 2010

Plus forts que CNN

Vous n'êtes pas sans l'ignorer, depuis ce matin le Conseil fédéral suisse est constitué d'une majorité de Conseillères (une version inédite de la formule magique dont personne ne connaît de toute façon la recette). La socialiste Simonetta Sommaruga a été élue ce matin au 4e tour pour succéder à Moritz Leuenberger. Félicitations à elle.

Ce qui est rigolo (et plus intéressant pour ce qui concerne Wikipédia), c'est que l'info aura été publiée à 10h19 (Heure de Berne) sur le projet
...et à 10h20 sur le site du quotidien de référence romand Le Temps

...voire 10h21 sur celui de l'Agence télégraphique suisse (ATS)


Pendant ce temps, sur Wikinews, vers 11h15:

(à leur décharge, CNN n'a toujours rien dit non plus)

Update: on dirait en fait que la nouvelle était sur Wikinews 1h avant que l'élection n'ait lieu (ça indique 9h CET chez moi). Ce n'est plus de la réactivité, mais de la prémonition!

dimanche 19 septembre 2010

The expendables

Hop c'est parti, les élections pour le douzième Comité d'arbitrage wikipédien (nouvelle formule™) sont lancées à partir de ce lundi. La plupart d'entre nous n'aurons jamais vraiment affaire au CAr lors de leur passage sur le projet (c'est normal et c'est tant mieux!) mais il n'empêche, qu'on l'aime ou pas c'est un élément important de la vie wikipédienne. J'en veux pour preuve qu'une douzaine de demandes impliquant environ 25 individus ont encore été déposées ces 6 derniers mois, et que si un arbitrage ne concerne a priori que deux arbitrés (ou trois, rarement plus) et cinq arbitres, on a en moyenne 40 à 50 personnes pour suivre ce qui s'y dit en mettant la page en suivi (plutôt que d'attendre benoîtement l'annonce de la décision).

Bref, dix places pour dix candidats, tous avec une certaine expérience du bouzin: sachant qu'il nous faut cinq (5) arbitres en théorie pour faire tourner la machine on aura, même avec sept ou huit élus seulement, de la marge pour fonctionner et essayer de changer ce qui ne marche pas1.

Je passe rapidement sur les profils: 5 admins et 5 pas admins, tous avec au moins un an d'activité. Si l'on regarde le rythme de contributions sur les douze derniers mois -en tout cas pour ceux dont l'editcount est accessible-, on a cela:


Ce qu'il faut regarder n'est pas tant au niveau du nombre absolu de contributions (tout le monde peut jouer avec LiveRC ou les catégorisations à la chaîne si ça lui chante), mais bien la stabilité du rythme. Premier constat, donc: on a ici une belle brochette de drogués qui viennent pour leur dose régulière.

L'important aussi dans ces histogrammes n'est pas tant ce qu'ils nous disent du passé de ces contributeurs que ce qu'on pourra en retenir pour l'avenir. L'avenir c'est dans six mois, et si tout va bien une moitié de tous ces gens ne se représentera pas. A vrai dire si tout va mal une moitié ne se représentera pas non plus: j'ai été accroché par Chaps the idol sur le fait que j'avais contribué à son éviction du CAr pour cause d'inactivité, lui-même étant assez dépité du manque de réactivité de ses collègues dans l'arbitrage sur lequel il était impliqué. Et il a bien raison: si l'on regarde son taux de contributions avant l'élection de mars on a ça:

qui ressemble plus ou moins à ce qu'on a au-dessus, mais quand on va voir ce qu'il se passe après l'élection, on tombe sur cela:

Effectivement, grosse fatigue.

Le challenge qui attend les élus est donc de trouver en interne une méthode pour éviter que ce genre de situation de découragement ne se reproduise trop souvent.



1. J'en suis désormais convaincu: le problème ce ne sont pas les arbitres, mais ce qu'on s'est mis à attendre d'eux.

jeudi 16 septembre 2010

Les vieux anars font la loi

Une source pas du tout anonyme1 est venue me trouver avec une remarque intéressante concernant la prise de décision sur l'interdiction / la limitation / l'imposition du terme états-unien, et j'en ai profité pour rédiger un petit billet à diffusion différée avant mon départ pour quelque aventure africaine (je vais photographier l'aéroport de Ouaga, s'il existe). Je suis sensible à l'argument qu'on ne vote pas sur des questions éditoriales, mais ayant comme seul exemple d'états-unien les diatribes d'Ignacio Ramonet j'ai voté pour la proposition, me berçant d'illusions quant au fait que la formulation "lorsqu'il est possible d'utiliser le terme « américain » à leur place" empêchera quiconque d'aller désormais essayer d'imposer ce dernier de manière systématique.

Bref, la proposition est passée et il se trouve, pour changer, que je suis dans la majorité mais que, pour changer, je me demande si ce n'est pas une erreur.

Beaucoup plus intéressant que mes errements existentiels, c'est le petit tableau ci-dessous qui regroupe les votes par année de création des comptes s'étant exprimés:



Résultats
AnnéePour/ContreParticipants
Tous55.83%219
201080%5
200968.75%18
200861.54%28
200747.37%41
200657.45%48
200556.25%53
200450%20
200333.33%3
200233.33%3

Première remarque: on s'aperçoit que plus on remonte dans les années d'ancienneté, moins on est succeptible d'avoir envie de réglementer le contenu. C'est probablement contre-intuitif pour certains, mais cela ne me surprend pas: avec le temps, on s'aperçoit que les règles sur Wikipédia ne fonctionnent que pour ceux qui les édictent - le système semble la plupart du temps suivre son propre cours, parfois en dépit de tout bon sens (au moins en apparence).

L'autre remarque qu'on pourra faire, et qui me surprend à peine plus, c'est que cette décision aura été en fin de compte prise par des personnes ayant créé leur compte il y a entre trois et cinq ans (2005 à 2007, 140 votants sur 220), ce qui est somme toute assez ancien. Une explication que j'aurais (outre l'inéluctable disparition des nouveaux contributeurs), c'est que ceux qui sont plus vieux sont partis (et étaient moins nombreux à la base), et que les plus jeunes ne sont pas encore intéressés à la politique interne wikipédienne, qui n'a que peu ou pas d'influence sur le contenu.


1. Que nous protégerons quand même par le pseudonyme Buisson_xy, merci à lui.

Supprimer des références, c'est le Mal

Je crois que je garde cet article dans ma liste de suivi juste pour pouvoir jeter l'anathème de temps à autre.

mardi 14 septembre 2010

Retour à la case départ

Suite du billet précédent.

On a donc un problème de représentativité sur notre dernier graphe quand des contributeurs tels que Coeur ou Kelson se réveillent au bout de plusieurs années et décident qu'en fait, un balai, ça leur faciliterait bien la vie. Forcément, la moyenne pour leur génération augmente: avec des comptes créés en 2003, ils ont traîné plus de temps sans le balai que certains administrateurs n'en ont tout simplement passé sur Wikipédia. Et puis il y a les bots, sysopés sur la foi de leurs dresseurs, eux-mêmes déjà admins.

On peut corriger cela en virant lesdits bots et en limitant le calcul de la moyenne à ceux s'étant lancés les premiers: on comparera donc pour chaque année les jeunes loups entre eux, ceux qui les premiers se lancent dans la course au balai et, surtout, sont élus. Cela nous donne le graphique suivant:

Attente moyenne pour les cinq premiers admins élus, par année de création de compte et en jours.
C'est quand même très différent: un an d'attente pour les comptes créés en 2003, puis 5 mois entre 2004 et 2006, puis une croissance pour revenir à au moins un an désormais. Mais comment l'interpréter?

Il me semble qu'en ce qui concerne la génération 2003, c'est simplement parce que Wikipédia, à l'époque, est encore un grand espace vide où on peut créer des articles comme Nicolas Sarkozy ou JFK. Personne ne connaît Wikipédia à part les trois pingouins qui sont dessus. Pas ou peu de vandales, de besoin de fusion ou de suppression. Et donc pas vraiment besoin d'admins pour aider ceux qui sont là depuis 2001 ou 20021 et qui n'ont quasiment rien à faire de technique.

Cela change progressivement, et le nombre d'admins croit avec le besoin et la popularité de l'encyclopédie. On reste en petit comité, et on est dans cet âge d'or où le monde est régit par des geeks qui n'ont pas encore appris les joies de la politique interne (ou qui ne sont pas bons à cela). On a bien déjà un ou deux trolls, mais personne ne sait trop quoi en faire et ils sont donc plus ou moins tolérés.

Et puis vient le moment où les admins commencent à documenter leurs erreurs et désaccords sur le BA, et l'on devient plus exigeant sur les candidats. A partir de 2007, on demande un niveau de bouteille qui va croissant. Tant et si bien qu'aujourd'hui, en 2010, on est quasiment revenus aux délais des premiers jours, à celà près que le niveau des élus est incomparablement plus élevé. Pour un Markadet arrivé en janvier 2005 et élu en août de la même année avec 100% d'approbation des 50 votants, on a Ascaron (vraiment actif depuis 2008) qui obtient en août 2010 un taux légèrement inférieur sur 91 avis. Autre temps, autres moeurs.

Je me garderai bien de dire si les derniers admins sont meilleurs que les vieux - ils ont avant tout eu moins de temps pour commettre des bêtises. Mais la tendance est intéressante. Ce qui serait tout aussi intéressant, et probablement similaire, serait de mesurer maintenant l'évolution du nombre d'éditions pour les élus2.



1. Données inexploitables sur le toolserver.
2. J'avais abordé la question mais cela semble plus compliqué (ou moins facile) que prévu: maintenant qu'on a les dates de sysopage pour 200 et quelques personnes, il faudrait en fait compter toutes les contribs (idéalement par domaine) jusqu'à cette date: un genre d'editcount limité, donc. Si vous avez des idées, j'ai le fichier.

lundi 13 septembre 2010

Moins vite, moins haut, plus forts

C'est officiel: c'était plus facile de devenir admin avant. J'en ai déjà parlé, Théoliane en parle, mais cette fois j'ai mieux: des chiffres. J'en profite d'emblée pour remercier Stanlekub et son accès au toolserver sans qui tout ce qui va suivre n'aurait pas été possible1.

Aujourd'hui, donc, nous allons parler des administrateurs et surtout du temps que les 233 élus auront mis à l'être. Pour ce faire, autant vous bazarder les graphiques et commenter au fur et à mesure.

Premier ensemble de données, le nombre d'admins par année de création de compte:


A noter que ce graphique inclut aussi les administrateurs ayant depuis démissionné ou été démis.

Ici à première vue pas de surprise, cela suit la courbe de progression de l'encyclopédie, avec un pic en 2005. Sauf qu'après, alors que la courbe des éditions se stabilise, celle des admins chute: un seul compte créé en 2010 est à ce jour administrateur, et en plus c'est un bot. C'est à rapprocher de ce billet de janvier dernier, où je montrais que le nombre de candidats baissait, et m'aventurait à quelques explications (en gros les mêmes que Théoliane: des attentes de plus en plus fantasmatiques):

Nombre d'élections par an (histogrammes), et taux de succès (orange/noir)
J'indiquais donc que Wikipédia en français passait doucement de 90% à près de 55% de succès pour les candidatures au balai. On semble voir une amélioration en 2010 (près de 70% de réussite à ce jour), mais cela reste à confirmer.

Et voici maintenant un troisième graphique, qui nous montre l'attente moyenne avant de lancer sa candidature et être élu (par opposition à lancer sa candidature et ne pas être élu, qui n'est pas discuté ici):
Durée moyenne entre la création de compte et l'acquisition du statut d'administrateur, par année de création (x) et en jours (y)
Bonne nouvelle! Ca baisse. Sauf que oui, mais non. Ce graphique est doublement faux parce que d'une part le seul compte admin créé en 2010 est celui d'un bot, qui n'a pas vraiment eu besoin de faire ses preuves socialement et a donc acquis le statut en 40 jours et, surtout, on a sur WP de vieux dinosaures de 2003, 2005 ou 2007 qui un jour se réveillent et décident de devenir admins quand tous ceux de leur génération ont déjà quitté le projet. Forcément, cela influe sur la moyenne.

La correction, parce que ce billet est déjà long, sera discutée demain.


1. Ainsi que GL et Manoillon, dont je ne désespère pas de faire un jour bon usage des données fournies.

mercredi 8 septembre 2010

Touchons du « bois »

J'ai une vision très précise de ce moment. Au bureau, alors que l'activité était calme, cela faisait plusieurs jours que je fouinais sur les différentes pages d'aide de Wikipédia. Je suis en revanche incapable de dire comment j'en suis venu à me pencher sur ce site et combien de temps (un jour, trois jours ?) ai-je passé à lire et relire les conseils. Attention, je n'ai pas lu pendant trois jours mais sur cette période, je pense y être passé et repassé. J'en profite pour me montrer en contre-exemple des gens qui pensent que « Pour les nouveaux, les pages d’aide sont trop longues et mal foutues, personne ne les lit. ». Moi avant d'aller quelque part, je regarde où je mets les pieds. Et les pages longues me sont utiles, pas forcément pour les lire de fond en comble mais pour me dire « Je peux revenir là si j'ai des questions ». Un peu comme un dictionnaire ou un annuaire qu'on consulte mais qu'on ne lit pas in extenso.

Je me tâte1 pour m'inscrire, je tergiverse avant de sauter le pas et de faire le premier (pas) vers une « communauté »2 avec tout ce que ça peut comporter comme intégration3. Un des éléments qui m'a décidé, c'est que quitte à être inscrit autant l'être le plus tôt possible, cela me donnera de la bouteille4. Je ne pense pas avoir testé la modification de page sous IP, peut-être juste un clic pour voir le code avant d'annuler et de revenir à la page précédente.

Alors, je trouve un pseudo inédit et à peu près prononçable, je me crée un mail lié à ce pseudo et puis je clique sur « Créer un compte ou se connecter ». Et voilà comment je me suis devenu contributeur sur les projets Wikimedia. C'était il y a cinq ans, jour pour jour.

1. Comme Prost
2. Ajoutez des tas de guillemets
3. Imaginez que vous avez déménagé et devez aller à l'école alors que vous ne connaissez personne et que tout le monde se connaît. L'avantage c'est que sur Wikipédia, y a plein de monde qui emménage tout le temps (ou qui se barre d'ailleurs).
4. Il y avait environ 180 000 articles à mon inscription.

mardi 7 septembre 2010

Chacun sa croix

A nos lecteurs français qui aujourd'hui luttent pour leurs droits ou leur accès au bureau, la Cabale romande vous offre un peu de lecture-détente wikipédienne:
Le premier article explique pourquoi on fait finalement assez peu la grève par ici, et le deuxième concerne le rejet par le peuple (et les cantons) de l'abaissement de la retraite... à 62 ans!

Sur ce, je profite d'un court passage au QG pour soigner gastro et gueule de bois: le climat européen ne réussit pas à mon petit corps africain, on dirait :-(

jeudi 2 septembre 2010

Mon agenda

On m'attribue parfois des intentions (ou des performances) qui ne sont pourtant pas les miennes, et la dénégation de ma part est souvent perçue comme un aveu circonstancié. Outre le fait que je ne nie désormais plus grand-chose (c'est une perte de temps), il faut dès lors bien, de temps à autre, lâcher un peu de lest sur un sujet annexe et admettre que oui, c'est vrai, il m'arrive d'avoir une idée derrière la tête quand je traîne sur Wikipédia. Mais je le jure, je fais tout ça pour le bien commun.

J'ai donc décidé de vous parler aujourd'hui de mon agenda. Le vrai, le dur.

Nous1 avons récemment décidé que ce serait une bonne idée que d'offrir, à Noël prochain, un joli agenda à chacun de nos contacts dans la région. Joli dans la mesure où il ne serait pas cher, vu qu'on passe notre temps à racler les tiroirs et réduire les budgets pour nourrir ce monstre qu'est le QG2, et joli dans la mesure où on aurait quelques pages pour parler de chacun des pays de la région (genre belles images et données utiles). C'est là que Popo intervient, et ce pour deux bonnes raisons:
  1. La collègue qui devait s'en occuper a décrété qu'enceinte de trois mois, il fallait qu'elle évite de travailler trop dur;
  2. J'ai rien à faire (c'est Ramadan, c'est fin août, c'est calme) et je suis dans le bureau d'à côté.
Du coup on commence à éplucher les articles des pays de la région pour copier les infoboxes, et les portails pour voir ce qu'ils ont comme "le saviez-vous" sympas et images de qualité, bien évidemment, pour illustrer le bouzin. Le résultat fut inégal: infoboxes ok (et assez à jour, étonnamment), quelques infos sympas3, mais côté images c'était plutôt le désert complet.

Ce qui est assez surprenant, me dis-je, vu qu'on se félcitait encore récemment que Commons héberge désormais 4 ou 5 millions d'images.

En fait, vous l'aurez deviné, c'est encore la faute aux catégories: celles-ci sont suffisamment mal faites pour que si on cherche une image de qualité spécifiquement prise en Afrique (ou ailleurs en fait), on ne puisse pas trouver. Je ne cherche pas spécialement un paysage, même si on en trouve de très beaux. La photo ci-dessous nous vient par exemple du Niger, et est signée Jacques Tarberlet.

Région des montagnes bleues.

Le problème c'est que j'ignore qui est ce monsieur, que je m'en cogne assez royalement, et que la seule autre catégorie disponible indique que ce cliché fut pris dans les montagnes de l'Aïr (dont j'ignorais l'existence jusqu'à la semaine dernière, et pourtant j'ai toujours été bon en géographie). Pas de catégorisation "featured picture" d'aucune sorte. Idem pour cette image:

Gonzalo!
Fort habilement classée dans la seule catégorie Agama agama.

On a certes une page d'autocongratulation, mais pour ce qui est du côté pratique rien, nada, qui permette trouver rapidement en vue de les réutiliser utilement et effectivement les clichés que des milliards de vacanciers ont décidé de déposer sur les serveurs de la Fondation, le plus souvent en triple exemplaire.  Ce ne serait pourtant pas difficile (j'imagine) de créer une catégorie "Image de qualité qui servira à autre chose qu'à son auteur de gonfler son nombre de contributions sur Commons", mais je suppose que si on ne l'a pas fait, c'est qu'une quelconque politique interne l'en a empêché4.

Je n'ai pas l'impression que ce réservoir de document aie une procédure pour éjecter les clichés moches ou en double. Du coup, et contrairement aux articles wikipédiens que l'on peut retrouver, améliorer ou explorer assez facilement, la quantité sur Commons a franchement tué tout espoir de profiter de la qualité.

Et en ce qui concerne la réalisation de mon agenda, ce n'est donc pas gagné5.


1. C'est à dire la main qui me nourrit et moi-même, le Nous de majesté étant je le répète réservé à mes activités de bureaucrate.
2. Et sa salle de gym avec sauna/hammam.
3. J'en profite pour dire qu'un "Le saviez-vous: Justin Ahomadegbé est resté aux arrêts de 1972 à 1981 après son renversement dans un coup d'état" est certes informatif, mais pas super positif (c'était chez les anglophones). Je veux pas faire dans le politiquement correct, mais si on s'adresse aux Béninois, autant éviter de leur rappeler que chez eux c'était la zone (leur démocratie marche désormais, mais ça tout le monde s'en fout). Je n'ai pas vérifié, mais je doute que le portail France indique "Le saviez-vous: le soir de son élection à la présidence de la République, Nicolas Sarkozy est allé faire la bamboula au Fouquets' puis est parti en vacances sur le yacht d'un copain millardaire".
4. J'ai souvent remarqué que le client, dans le monde du libre, n'est pas toujours roi.
5. Et tant pis pour ceux qui pensaient lire autre chose - mais ce n'est pas comme si ce post n'était pas déjà pétri d'un peu de mauvaise foi ^^