Apprendre : La Data-Visualisation

Introduction

La data-visualisation, c’est la représentation visuelle d’un ensemble de données, l’objectif étant d’élaborer la forme la plus adaptée pour rendre compte d’un phénomène particulier. Les données peuvent être de n’importe quel type (nominales, ordonnées, quantitatives, catégorielles…), et présenter de larges variétés de structures : hiérarchiques (mind map, arbres…), en réseau (cartes comportementales, flux…), géographiques (cartes…), temporelles (frises, cycles), textuelles etc…

Grâce à l’informatique, qui permet de de collecter et de traiter de nombreuses données en masse, la data visualisation est devenu de plus en plus répandue : un nuage de tags sur un blog, une courbe de tendance sur un moteur de recherches, la courbe d’évolution de la bourse en temps réel… Tout ça, c’est de la data visu. Autant dire qu’il y en a tout autour de nous.

L'information design (ou data visualisation, ou en français, la représentation graphiques des données) est un domaine détudes très récents, et de plus en plus étudié.
L’information design (ou data visualization, ou en français, la représentation graphiques des données) est un domaine d’études très récents, et de plus en plus étudié. Le terme data visualization tend à prendre le dessus ces dernières années.

La visualisation d’un ensemble de données permet de mieux évaluer certains concepts et leurs tendances, qui peuvent être difficiles à saisir lorsque l’on se contente des données brutes ou textuelles. Ainsi, se renseigner sur un sujet via des représentations visuelles des données qui lui sont liées peut largement contribuer à sa compréhension, et voire même aider à trouver des patterns/tendances qui n’étaient pas visibles au format brut. Ces résultats, émergents de la représentation, peuvent être analyser afin de déterminer la nature du phénomène faisant évoluer les variables concernées.
Il s’agit donc d’un outil précieux de compréhension, mais aussi d’analyse, pouvant jouer le rôle de révélateur.

La réciproque de ce concept c’est que maîtriser la data visualisation est un outil très efficace pour communiquer ses idées. Créer des Flow Charts, par exemple, peut grandement aider la mise en place d’un processus pour une équipe de travail, et créer des mind maps peut grandement aider l’écriture d’un scénario (comme j’en parlais déjà pour Alien 2347), etc…

Les conférences TED de Hans Rosling, exposant des données démographiques via des représentations graphiques intelligentes et interactives, sont très convaincantes : on y apprend beaucoup sur le monde, mais aussi sur le pouvoir de la data visu : mettre en évidence, efficacement. A voir aussi, sa conférence How to not be Ignorant about the World, son documentaire Don’t Panic, et le site internet de la fondation GapMinder, dont le but est de promouvoir les Objectifs du millénaire pour le développement des Nations unies, sur lequel figure une version en ligne de l’outil de visualisation de données démographiques qu’il a mis au point et qui est le support de chacune de ses interventions.

Une troisième raison qui peut motiver l’apprentissage de la data visualisation, c’est le développement d’un regard critique envers le choix de certaines représentations qui ne montreraient pas (intentionnellement ou non) l’essence d’un phénomène (par exemple, une carte choroplètes bichrome des résultats d’élection par régions n’en dis pas très long sur la proportion des gens qui ont voté dans un pays). Exemple ci dessous avec la President Map 2008 du New York Times.

Cela fait un petit moment que le sujet m’intéresse, avec une curiosité particulière pour les approches informatiques interactives, esthétiques et collaboratives liées à ce type d’outils. Grâce à une gestion de l’espace dynamique, l’informatique permet la mise en place de systèmes de filtres et changement d’échelle pour les données, de systèmes d’accessibilité (zoom et changement de jeu de couleur), des systèmes d’informations enrichis qui n’apparaissent qu’après une action de l’utilisateur afin de faciliter la lecture du graphique au premier coup d’œil sans être surchargé d’informations, voir même changer les modes de représentation.

Mind Map (carte mentale dîte heuristique) que j'avais élaboré sur Mindomo afin de préparer ma série de tutoriels sur ReaScript.
Extrait d’une Mind Map (carte mentale dîte heuristique) que j’avais élaboré sur Mindomo afin de préparer ma série de tutoriels sur ReaScript. J’utilise beaucoup les cartes mentales pour préparer mes projets.

Il m’arrive assez régulièrement de partir à la recherche des nouveautés sur le sujet juste pour le plaisir des yeux, que ce soit purement technique (un web service, un framework JavaScript) ou des exemples concrets liés à un sujet particulier (Arte présente parfois des dossiers web autour d’un documentaire, très fournis en graphiques interactifs). Car certaines représentations ne se contente pas d’être intéressantes, elles sont aussi visually appealing, et d’autant plus si leur esthétique est liée au sujet, si elles sont enrichis d’icônes, de symboles, de contenus multimédia et d’illustrations de graphistes leur donnant un vraie côté artistique.

Les infographies de chez elearning infographics ne sont pas intéractives mais sont très plaisantes à regarder.
Les infographies de chez elearning infographics ne sont pas interactives mais sont très plaisantes à regarder. Elles sont plutôt destinées à l’impression. Notez que Infographics en anglais ne vient pas de Graphique Informatique comme en Français, mais de Information Graphics.

Récemment, j’ai découvert dans une boutique de la Cité des Sciences, Understanding the World: The Atlas of Infographics. Plus de 500 pages grand format illustrées en couleur, sur le monde (la démographie, l’économie, les ressources, etc…). Un très beau livre qui en dit beaucoup sur nos sociétés et leurs évolutions, de manière moderne et pédagogique. Cela a repiqué ma curiosité sur la data visu. Marie se l’étant offert, il me tarde de pouvoir le lire (hé hé hé !).

Understanding the World: The Atlas of Infographics, par Sandra Rendgen
Understanding the World: The Atlas of Infographics, par Sandra Rendgen

Ayant parlé de ce domaine d’étude avec mon ami Adib, celui-ci me ramena de la bibliothèque du CNAM pas moins de 3 livres sur le sujet. Il m’aura fallu une dizaine de jours pour les finir, et comme c’était très intéressant, je tenais à vous les présenter succinctement, afin que de vous donner quelques pistes pour que vous aussi puissiez découvrir ce sujet passionnant ! 🙂

Livres

Data Vision

Datavision de David MCCANDLESS

Un très beau livre plein d’images, aucun texte en dehors des illustrations (le lecteur doit tirer ses propres conclusions sur les graphiques représentés), sur des sujets tout aussi variés que la composition des cafés, les femmes de dictateurs, en passant par la structure de l’ADN et la consommation d’eau par jour d’une personne lambda. On y apprend à être sensibilisé au sujet de la data visu, tout en douceur, la variétés des illustrations et des sujets abordés, dans l’ensemble plutôt légers, rendant la lecture très agréable. Le livre n’est d’ailleurs pas dépourvu d’humour, ce qui est très apprécié et nous fait sortir de l’image ennuyeuse que pourrait avoir de prime abord les statistiques. J’y ai notamment appris la composition du mocha (et oui) ainsi que le coût financier de la dernière grande crise économique comparée à d’autres grandes sommes (comme le budget des Nations Unis et l’Industrie du Tabac). Spoiler alert : c’est énorme.

L’auteur a aussi un site internet, Information is Beautiful, sur lequel il poste des représentation interactives de très hautes qualités. J’ai particulièrement apprécié celle qui montre le pourcentage de vérité de certains films dits tirés d’une histoire vraie.

imitation-game
The Imitation Game, le biopic sur Alan Turing, semble avoir pris de grandes libertés par rapport à la vie réelle de l’intéressé. Un peu trop à mon goût.

Design de l’information

Design de l'Information, par Isabel Meirelles
Design de l’Information, par Isabel Meirelles

Ce livre est à l’opposé du précédant dans le ton : on est là dans la recherche plutôt universitaire, le vocabulaire est très soutenu. La data visu est présenté comme un objet en constante évolution en fonction des innovations (techniques et conceptuelles) et de l’évolution des supports de transmission de l’information. Les études de cas présentées sont souvent très avancées dans le domaine, et témoigne d’une certaine richesse de réflexion de la part de leurs créateurs. L’auteur nous présente une pensée en évolution sur le sujet et l’histoire même de la data visu y est exploré en détails.

Ainsi, on y apprend que un jour un homme a décidé de mettre des couleurs sur une carte pour représenter une phénomène et il a fallu des dizaines d’années avant que d’autres se rendent compte que c’était une bonne idée, que c’est une seule personne qui a inventé les diagrammes circulaires, les diagrammes linéaires et les diagrammes en bâton (William Playfair, le père spirituel de tout les experts de data visu 😛 ), et que certes, les cartes du monde seront toujours imparfaites (la projection d’un sphère sur un plan sur un plan ne se faisant pas sans compromis géométrique, le dilemme reposant sur le respect des surfaces ou celui des angles et des distances), mais que l’on emploie rarement le type de projection qui serait le plus optimisé (même Google Maps et Mappy ne propose que la projection Mercator, soit l’une des plus anciennes des projections, qui a été conçu pour les navigateurs). D’ailleurs, j’ai enfin compris à quoi servait les homolosine (un mot que même le correcteur d’orthographe ne connaît pas).

Les cartes homolosines ont une allure de peau de clémentine. C'est une façon de representer une sphère sur un plan en limitant les distortions (ici, celles des terres). En contre partie, il y a une impression de trous dans la carte (mais ce n'est pas liés à une manque de données géographiques, toute la surface de la Terre est bien représentée sur cette illustration).
Les cartes homolosines ont une allure de peau de clémentine, quand on a réussi à l’enlever sans la casser (ce qui est toujours une petite satisfaction). C’est une façon de représenter une sphère sur un plan en limitant les distorsions de certaines surfaces (ici, celles des terres). En contre partie, il y a une impression de trous dans la carte (mais ce n’est pas liés à une manque de données géographiques, toute la surface de la Terre est bien représentée sur cette illustration). Les habitants du Groenland sont malheureusement un peu désavantagé par cette reproduction. Le mieux, ça reste un globe 😛

Vous pourrez aussi apprendre en quoi les cartes isarytmiques avec leurs lignes isométriques et leurs bandes isoplèthes sont intéressantes, et en quoi les cartogrammes sont utiles. Oui, j’ai beaucoup aimé le chapitre sur les représentation spatio-temporels. 😛

100 Diagrams that Changed the World

100 Diagrams That Changed the World, par Scott Christianson
100 Diagrams That Changed the World, par Scott Christianson

Ce livre retrace aussi l’histoire de la data visu, mais avec une approche plus générale sur les œuvres et la vie de leurs auteurs. Cependant, le livre se penche un peu trop sur les diagrammes de certains brevet, qui en tant que représentation n’ont pas spécialement fait évoluer la data visu, mais témoignent juste d’une invention qui a changé le monde (même si ce n’est pas toujours le cas, certains de ces diagrammes étant restés cachés pendant des siècles à l’abris des regards). Bon, en apprendre plus sur certaines inventions qui ont changé le monde et leurs auteurs, c’est bien aussi ! 🙂
On reste dans le diagramme à l’ancienne (pas interactivités, presque pas d’infographie) mais ça n’en est pas moins intéressant.

L'un des premiers graphiques mettant en relation la valeur d'une variable en fonction d'un axe temporel, par William PLayfair.
William Playfair et son Line Graph, le premiers graphique mettant en relation la valeur d’une variable économique en fonction d’un axe temporel. Une invention visuelle qui fera date.

Passionnés des sciences, le livre m’a quand même bien plus, bien que j’ai préféré la démarche du second vis à vis du sujet abordé.


Pour aller plus loin sur le sujet, compte lire Understanding the World, ce qui devrait prendre un certains temps vu la taille de l’ouvrage. En bonus, j’en saurais un peu plus sur le monde en général, ce qui est toujours bien ! Un jour aussi je prendrais le temps de jouer avec un framework JavaScript de data visu à l’occasion (highchart.js, chart.js, D3.js, AnyChart… ils ont tous l’air intéressant !). Le côté interactif de la chose est très intéressant je trouve.

Merci encore à Adib pour la lecture, et Marie (pour ma prochaine lecture du coup :P).

Connaissez-vous d’autres ouvrages ou ressources intéressantes concernant la data visualisation ?


Illustrations :

  • Image à la une : dataviz catalog, un site servant de guide pour aider à choisir un mode de représentation des données.
  • Wikipedia.org
  • Amazon.com
  • Woah, article super intéressant et si bien écrit !! De la première ligne à la fin ma lecture est restée égale, un tour de force sachant que deux enfants courent dans tous les sens autour de moi en me lançant des bouts de pâte à modelé dans les cheveux ! T’es le meilleur.

  • Oh bah ça alors je m’attendais pas à une réponse aussi positive et aussi rapidement haha <3 Merci beaucoup, c'est très encourageant, je vais écrire d'autres articles sur les choses que j'apprends du coup 😛
    Bises !!

  • Article très intéressant ! C’est clair que la data viz est très présente aujourd’hui dans un monde où l’information évolue énormément et que nous aimons le “tout tout de suite”. Du coup c’est une façon très intelligente d’arriver au mieux à régler ces deux problèmes. Je trouve donc que ton article reprend assez bien l’intérêt de la data viz et tes propositions de lecture m’ont vraiment beaucoup intrigué ! En tout cas bravo je partage ça !

  • aaah, j’espérais bien que cet article te plaise héhéhé 🙂
    Tu me diras ce que tu en penses si jamais tu arrives à te procurer les livres 😛
    et grand merci pour le partage !!