Interview : le webmaster de politologue.com

Une fois n’est pas coutume, voici un format écrit, en marge des épisodes du podcast. J’ai eu la chance de pouvoir m’entretenir avec le webmaster qui est derrière le site politologue.com. Il s’agit d’une démarche qui vise à exploiter différentes données afin d’en tirer des clés de lecture sur des sujets de vie en société. Les détails dans l’interview…

Guillaume : Peux-tu nous en dire plus sur qui tu es, qui est derrière ce site ? Sans dévoiler ton identité bien entendu, nous parler un peu de ton parcours. Notamment de tes formations liées à « la tech » ?

politologue.com : Je suis un genre de Monsieur tout le monde, très geek sur les bords, touche à tout et avec les compétences suffisantes pour faire tout ce que je fais sur le site et autour.
Je suis autodidacte et je développe tout moi même. Un genre d’artisan 2.0…

Guillaume : Sur quelles sources de données te bases-tu pour donner des synthèses ? Sur de l’open data mais également, a priori, sur de la donnée issue des réseaux sociaux, certes ; mais y a-t-il d’autres sources ?

politologue.com : Le sujet principal du site est de « surveiller » et classer les pages Facebook des politicien(ne)s et des partis politiques. J’ai eu cette idée lors des régionales de 2015. Comme à chaque élection, on nous assommait de sondages, et je n’en pouvais plus, j’avais besoin d’y voir clair par moi-même. J’ai donc développé un outil rien que pour moi qui m’affichait un tableau de bord avec les graphiques d’évolution des pages en quasi temps réel (toutes les 15 min). Avec ce système, j’avais une vision d’ensemble et je pouvais détecter immédiatement un buzz (c’est même toujours le cas) et aller voir de quoi il en retourne. À force de montrer mon tableau de bord à des amis, l’un d’eux m’a convaincu d’en faire un site pour tout le monde. J’ai une vie déjà bien remplie alors j’ai un peu traîné les pieds et puis finalement ça m’a chatouillé les neurones, j’ai passé du temps dessus et le 6 juin 2016 le site voyait le jour (tout un symbole cette date, je l’ai même lancé en écrivant « En ce 6 juin, Politologue.com débarque sur Internet » ).

dans les plus de 50 ans, la courbe part sur la lune et personne ne parle de ce vrai drame

Donc pour répondre à la question, pour la partie classements, j’utilise l’API Open Graph de Facebook. J’ai peaufiné le site et mes robots pendant quelques temps et comme j’aime y voir clair et que j’adore triturer des données pour en faire des graphiques et quelque chose de lisible, j’ai commencé à mettre le nez dans l’open data en commençant par les chiffres du chômage. Là aussi, tous les mois nous avons droit à l’explication des chiffres du ministre et toute la presse reprend en cœur ce qui a été dit. Je me suis rendu compte que quand on regarde plus en détail, la catégorie A que l’on nous abreuve tous les mois n’est pas l’information la plus importante, c’est surtout le détail de tout le reste. J’ai donc fait des graphiques de tous les détails que je récupère (je mets à jour tous les mois à la publication des chiffres), des cartes de France etc… 20 ans d’historique de chiffre du chômage. Quand on regarde la courbe de catégorie A, effectivement « ça va pas trop mal », en revanche, quand on regarde ABCDE, ça va moins bien… Mais là où on découvre qu’il y a un vrai problème, ce n’est pas chez les jeunes de moins de 25 ans (attention, je ne dis pas que c’est rose pour eux) mais dans les plus de 50 ans, la courbe part sur la lune et personne ne parle de ce vrai drame qui est pourtant très visible sans avoir fait l’ENA pour s’en rendre compte.

nous perdons des naissances tous les ans, cela ne colle pas avec notre taux de fécondité record dont on nous parle souvent.

J’ai donc commencé à « jouer » avec données de chiffres du chômage et j’ai ensuite cherché d’autres données à traiter et afficher sur le site. Sur data.gouv.fr, il y a de plus en plus de choses et ce n’est pas toujours simple de trouver son « bonheur ». En butinant un peu, j’ai trouvé les données sur les accidents de la route de 2005 à 2015. J’ai donc traité les données pour en faire des graphiques et tableaux, par département, ville etc.. Et je voulais mettre en parallèle la réponse des radars, malheureusement, il n’y a aucun chiffre sur les radars. J’ai trouvé un petit tableau de 5 lignes dans un fichier pdf de 300 pages… Bref rien d’exploitable. Donc, en attendant, j’affiche uniquement les graphiques des évolutions des accidents. Ensuite j’ai eu l’idée d’utiliser les données des prénoms de naissance depuis 1905 pour en faire des statistiques sur les naissances. Normalement, on a tous les compteurs même quand les prénoms rares sont anonymisés en « _PRENOMS_RARE ». Du coup là aussi, j’ai pu constater que le nombre de naissances ne se porte pas bien, nous perdons des naissances tous les ans, cela ne colle pas avec notre taux de fécondité record dont on nous parle souvent.
Ensuite je me suis attaqué à un très gros morceau, les impôts sur le revenu. J’ai dû analyser 1202 fichiers Excel pour en faire ce que j’ai fait. Vous pouvez consulter l’évolution de l’impôt sur le revenu au niveau national, départemental et jusqu’au niveau d’une ville. Je crois que c’est la partie qui m’a donné le plus de mal pour rendre lisible autant de données. Je pense que je ne me suis pas trop mal débrouillé, mais ce n’est pas à moi de le dire. Sur cette partie-là, j’ai tout vérifié un nombre incalculable de fois pour être sûr que je n’affichais rien d’incohérent. C’est un sujet tricky et je ne fais pas tout ça non plus pour avoir des problèmes. Donc j’ai également demandé à des personnes de tester mes données en comparant aux fichiers Excel.

Vous remarquerez que je ne fais aucune analyse sur le site, aucun commentaire, le site est neutre

J’ai récemment analysé les précédentes présidentielles. Là encore, j’ai fait des graphiques et cartes de France pour y voir clair. Ici aussi, vous pouvez consulter au niveau de la ville pour voir les évolutions des votes entre 1995 et 2012. Et pour finir, j’ai analysé les réserves parlementaires des députés : encore une fois, j’ai essayé de faire en sorte que chacun puisse trouver ce qu’il cherche. Vous pouvez consulter la réserve d’un député en particulier, consulter par département, par groupe parlementaire et là où c’est intéressant, par bénéficiaire. J’ai découvert que le Conseil d’état et la Cour des comptes sont financés par les réserves parlementaires de l’Assemblée nationale. Du coup je me pose des questions sur indépendance des organes aussi importants de l’État. Pour le moment, je me suis cassé le nez sur les municipales de 2014, j’ai passé beaucoup de temps pour en faire quelque chose, mais il y a tellement d’erreurs à corriger manuellement que j’ai mis de côté pour le moment.
Je vais continuer d’analyser d’autres data que je trouve intéressantes à partager et à rendre lisibles. Vous remarquerez que je ne fais aucune analyse sur le site, aucun commentaire, le site est neutre, je fais juste en sorte que chacun puisse y voir clair. (Sur le blog, il peut arriver que je sois taquin, mais c’est sans parti pris et sans malveillance).

Guillaume : Quels langages utilises-tu et quelles technologies exploites-tu pour faire fonctionner le site ?

politologue.com : Je code tout moi même en .NET, je n’en dirai pas plus pour éviter qu’on vienne chatouiller mes affaires 🙂

Guillaume : Tu sembles te baser (en partie au moins) sur les réseaux sociaux pour donner des orientations, des tendances. Dans quelle mesure penses-tu que les réseaux sociaux reflètent de manière fiable les opinions d’une société ?

politologue.com : Effectivement, c’est amusant quand les gens me disent (souvent, en voulant se rassurer) : « Ah mais tout le monde n’est pas sur Facebook ! », « Facebook ça ne représente pas tout le monde… », « Les vieux ne sont pas sur Facebook… ». Et bien en fait, si, ça marche même plutôt pas mal. « L’échantillon » Facebook est assez représentatif. Regardez autour de vous, vous devez avoir comme moi des personnes de tout âge qui sont et ne sont pas sur Facebook, jeunes ou « vieux ». Du coup, il ne représente pas toute la population, mais le miroir n’est finalement pas si déformé que ça.
Et si cela ne fonctionnait pas, je n’aurai pas pu prédire Fillon et Hamon aussi clairement que j’ai pu le faire sur mon blog. Avant les primaires, je n’avais pas encore mis en place le blog et j’avais pronostiqué de la même façon à mon entourage la victoire de Trump, personne ne voulait me croire, et j’aurais dû faire des paris !

le buzz énorme de Nicolas Dupont-Aignan a rendu mon graphique aussi bordélique que cette campagne présidentielle !

Je ne vais pas prendre la confiance et prétendre que je vais avoir raison à chaque fois, je profite de chaque élection pour tenter d’améliorer mon système de calcul. Là où je ne me suis jamais trompé pour le moment c’est sur la première place des premiers et deuxièmes tours. Pour les autres places, c’était plus hasardeux à cause des impondérables liés aux primaires ouvertes comme le vote de gauche qui vient voter à la primaire de la droite. Ce genre d’impondérables, je ne peux pas les voir car je mesure l’engagement. Et dans ce genre de cas, il n’y a pas d’engagement quantifiable. Pour la Présidentielle, à priori, il n’y aura pas ce genre d’impondérables, chacun aura son challenger.
J’ai mis à disposition un graphique qui se met à jour toutes les nuits avec les scores de la veille, vous remarquerez que le buzz énorme de Nicolas Dupont-Aignan a rendu mon graphique aussi bordélique que cette campagne présidentielle !

Guillaume : As-tu des inspirations, notamment peut-être à l’étranger, qui t’ont amené à faire le travail que tu fais ?

politologue.com : Non, en fait j’ai pour habitude de faire à mon idée, je ne regarde pas ce que font les autres. Je ne suis même pas sûr qu’un site fasse ce que je fais et comme je le fais. Il y a un tas de gros sites qui analysent les pages Facebook avec un tas de données, mais rien de centré sur un thème comme je fais et finalement avec les données essentielles. J’aime bien les choses simples et efficaces.

Guillaume : Vis-tu d’une manière ou d’une autre de ce site ou est-ce que tu envisages de le faire ?

politologue.com : Le site ne me rapporte rien ou quelques centimes avec le bandeau que j’ai mis en haut de la page, en résumé ça me coûte même de l’argent. Mais ce n’est pas important pour le moment, si j’aime faire tout ça, c’est parce que cela m’amuse de le faire et que je peux me permettre de passer un peu de temps dessus. Si cela devient contraignant, cela ne m’amusera plus et je passerai à autre chose.
J’ai des idées pour faire évoluer le concept, une fois que tout sera bien rodé, et si le site se fait un nom, j’envisagerai peut-être d’essayer de faire quelque chose pour rentabiliser, ne serait-ce que pour payer le temps passé à faire tout ça qui mine de rien représente un coût également.

Guillaume : Dans ma vie professionnelle, j’ai pu découvrir des techniques telles que celle dite de l’ATDMF (Analyse Technique Dynamique des Marchés Financiers). Ce procédé vise à prévoir des orientations notamment boursières en fonction de comportements de graphiques. Pensez-vous que toute information, consultée sur une durée suffisamment longue, permet d’anticiper des événements futurs, quel que soit le thème ? Y a-t-il des limites ?

politologue.com : C’est difficile à dire, l’humain est imprévisible, les marchés n’ont pas leur part d’humanité comme une élection. Le truc le plus anxiogène de l’humanité est le changement… vous auriez demandé à une IA en 2012, avec un slogan comme « Le changement c’est maintenant » elle vous aurait prédis l’échec assuré.

Pour une élection (…) cela ne se joue pas sur du long terme (…) la présidentielle se se joue à partir de maintenant et pour les 30 derniers jours

Je pense qu’il est plus facile de prédire la montée ou la chute d’un cours (car il y a des facteurs comme la météo, les saisons etc.. mais également des impondérables) qu’une élection. Dans une élection il y a une grande part d’irrationnel, les gens arrivent à défendre un programme tout en dénigrant les autres sans les avoir lu. Finalement c’est à celui qui sera le plus convaincant, le mieux packagé etc… Le débat à 11 du 4 avril peut engager des mouvements, ça aussi tant que cela ne se produit pas, c’est imprévisible.
Pour une élection, de mon point de vue et avec tout ce que je vois, cela ne se joue pas sur du long terme, au pire sur les derniers mois, la présidentielle se se joue à partir de maintenant et pour les 30 derniers jours. Le buzz de Nicolas Dupont-Aignan qui était complètement imprédictible a chamboulé la campagne, cela fait va laisser une trace réelle dans la campagne et j’ai le sentiment que personne ne le voit.

Guillaume : Quel avenir pour le site politologue.com ?

politologue.com : Pour le moment je continue de m’amuser en apportant ma pierre à l’édifice. Après les élections législatives, je pense que le site suscitera moins l’intérêt mais je vais continuer d’éplucher les données de l’open data.
J’aime dire que le slogan du site est « Rende lisible l’invisible », j’espère que c’est le cas, en tout cas moi j’y vois clair, c’est déjà ça ! Le truc amusant que je fais en ce moment est un Live sur Facebook. Je le fais 1 fois par jour pendant 4 heure et j’affiche les nouveaux fans des candidats en temps réel sur la période des 4h, si vous n’avez pas vu passer, jetez un oeil (celui que j’ai fait hier ). J’ai fait le premier pendant le débat de TF1 et comme cela amusait tout le monde, je vais en faire un par jour jusqu’à l’élection. Cela avait eu moins de succès pendant les débat des primaires.

Guillaume : La question qui nous brûle les lèvres : en se basant sur les données que vous collectez, qui anticipez-vous au second tour de l’élection présidentielle ?

Le trio de tête est Le Pen, Mélenchon et Fillon, je pourrai être plus affirmatif quelques jours avant le 1er tour : je ferai sûrement d’autres calculs en rapport avec mes graphiques de la page des présidentielles. Et les débats à 11 peuvent également changer la donne… Mais pour le moment je pense que ce n’est pas impossible d’envisager un deuxième tour Marine Le Pen vs Jean-Luc Mélenchon, même si les sondages ne le voient pas venir.
Après, n’oubliez pas de mettre des pincettes sur mes pronostics. Comme je le dis souvent, « ça vaut ce que ça vaut et ce n’est pas pire qu’un sondage »
J’ai juste un approche différente dans mon coin, ce n’est pas mon métier, c’est un passe-temps que je partage avec qui cela intéresse. Seuls les votes compteront le soir du 1er tour et si on pouvait pronostiquer de façon sûre, les bookmakers seraient submergés…

Les liens des thèmes abordés dans l’interview

Devenez un auditeur VIP

Garantissez une diffusion sur le long terme et un contenu indépendant grâce au modèle vertueux du financement participatif avec Patreon et profitez d’un flux privé sans publicité.

Je débloque les avantages
Partager cet épisode

Podcasteur technophile enthousiaste. Je réalise le podcast Tech Café et co-réalise le podcast Relife.

Vos commentaires

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

En lire plus...

Licence Creative Commons
Le Podcast Tech Café de Guillaume Vendé est mis à disposition selon les termes de la licence Creative Commons Attribution - Pas d’Utilisation Commerciale 4.0 International.

Les livres de Guillaume Poggiaspalla

Mon offre

Machines de jeux