samedi 23 avril 2011

Géolocalisation (bis !)

Un vendredi en fin de soirée... le choix entre avancer un peu le projet Valdensia, finir d'écrire le(s) billet(s) promis ou prévus pour ce blog, penser à la déclaration d'impôts qui aurait du être renvoyée il y a déjà trois semaines, voire même aller se coucher pour rattraper des heures de sommeil en retard ? Quelle drôle d'idée... pourquoi ne pas se lancer dans quelque chose qui n'a rien à voir avec tout ça ?

Or, pas plus tard qu'il n'y a pas longtemps, un commentaire de Manoillon posait la question: "comment identifier, dans Wikipedia, les articles géolocalisables mais pas encore géolocalisés ?", suivi de bonnes idées mentionnées par Erdrokan.

Deux heures, ça risque d'être court pour résoudre le problème, mais on peut déjà commencer. Prenons par exemple tous les articles de la catégorie Monument suisse par canton (y compris les sous-catégories, soit 494 articles au total) et vérifions s'ils sont géolocalisés. 20 minutes de programmation en Perl, 20 minutes de test (entre autres pour enlever les faux-positifs genre les listes), et on obtient d'un coup une liste de 81 articles potentiellement géolocalisables, mais qui ne le sont pas. Il y a sûrement encore des faux-positifs là-dedans (il y a beaucoup de modèles différents pour faire de la géolocalisation et j'en ai probablement oublié quelques uns) mais c'est déjà un bon début pour ce qui concerne la Suisse (j'ai volontairement laissé les bâteaux dans la liste, certains étant amarrés à demeure).

Encore 20 minutes pour écrire ce billet, il me reste donc une heure pour continuer à chercher ces articles à géolocaliser. Une autre idée ? En attendant, j'ai découvert qu'il y a un monument d'importance nationale à moins de 500 mètres de chez moi, et même pas de photo sur commons... du boulot pour le week-end !

2 commentaires:

Erdrokan a dit…

Merci, grâce à ça, j'ai géolocalisé le Monument Brunswick (déjà illustré avec une photo sur commons, géolocalisée).

Mettre cela à plus grande échelle (en pouvant coupler "pas de géolocalisation alors que ça devrait en avoir une" et "aucune illustration alors que ça devrait en avoir une") me paraît être un projet titanesque (avec plein de faux positifs) mais ouvrant plein de vocations :)

Manoillon a dit…

Entièrement, totalement et définitivement d'accord avec la remarque d'Erdokan ci-dessus.

Une première piste : http://www.wikilovesmonuments.ch ce n'est qu'un début, mais ça a l'avantage d'être structuré et d'utiliser une liste connue et fermée.

@Schutz : attend quelques mois avant de charger ta photo, tu pourrais gagner le concours (et tu peux déjà réserver le monument en question sur le site du concours) !