dimanche 6 décembre 2009

Wikigeographie

Décidément, l'exploitation des données wikipédiennes semble à la mode puisque Mark Graham, sur son blog Zero Geography, partage les premiers résultats de son dernier projet consistant à lier les articles géomarqués du projet anglophone à une vraie carte. Autant dire que le résultat, à défaut d'être suprenant, est vraiment intéressant.

La carte ci-dessous est de loin la plus intéressante, et nous montre la densité de geotags par surface. L'Europe et Israël sont bien évidemment bien mieux couvertes que les États-Unis et le Canada qui, par exemple, ne documente clairement pas assez les attraits de Kuujjuaq et ses environs (-19,3°C de température moyenne ces jours-ci, apprends-je).


Ce qui me surprend un peu plus, c'est de voir la relative pauvreté du geotagging des articles liés à l'Irlande, et la relative densité de ceux liés au Népal, à l'Arménie et au Togo. Une première hypothèse qui me vient à l'esprit tient à la structure rurale de l'Irlande qui fait que (j'espère que personne ne me lit par là-bas) il y a probablement assez peu, toutes proportions gardées, d'articles à documenter hors des grands centres urbains (c'est aussi par exemple pourquoi le Canada, la Russie et le US resteront dans les clairs).

Pour le Népal et l'Arménie, je dirais qu'on a là un effet certain du tourisme dans le premier cas et de la diaspora dans le deuxième. Mais pour le Togo? Sans être allé regarder les articles, mystère et spéculation: peut-être un justicier solitaire et togolais a-t-il entrepris de geomarquer tous les articles liés à son pays de prédilection (il y a après tout sur :fr un mouvement de contributions significatif spécifique à la Côte-d'Ivoire).

Un pas supplémentaire désormais, et qui aurait un intérêt certain pour un projet comme :fr, serait d'affiner la granularité pour avoir le même type de carte au niveau des subdivisions nationales, genre les cantons suisses ou départements français, quitte à trouver les mêmes différences en termes de densité rurale vs. urbaine. Et, bien sûr, voir si les geotags sont également répartis d'un projet linguistique à l'autre (et si non, envoyer les bots à l'assaut).

Pour les autres cartes (nombre absolu de geotags, nombre pour 100'000 habitants), je vous invite à les consulter directement chez Mark.

5 commentaires:

Anonyme a dit…

Article très intéressant, comme quoi fr a encore du travail à faire pour le géotaggage. Maintenant c'est toutes langues confondues c'est ça ?

P. Lechien a dit…

Il me semble qu'il n'a pris que les geotags anglophones, mais je suis allé demander confirmation.

Anonyme a dit…

la légende de ton image dit "in all languages", donc je suppose qu'ils a pris tous les wikipédias (ou au moins ceux de plus de qques milliers d'articles)

P. Lechien a dit…

Ah ouais, si je ne lis pas la légende des trucs que je commente, ça ne va pas le faire.

J'ai été trompé par le fait que dans son post, il lie le mot geotag avec le modèle sur :en (plutôt que, comme ici, avec un lien chez Poulpy).

Anonyme a dit…

Wow! ca c'est du boulot intéressant!
Je note un petit souci sur la carte, la mer caspienne disparait et on a à la place un étrange Azerbaïdjan bourdouflé.

Kimdime