Introduction
La data-visualisation, c’est la représentation visuelle d’un ensemble de données, l’objectif étant d’élaborer la forme la plus adaptée pour rendre compte d’un phénomène particulier. Les données peuvent être de n’importe quel type (nominales, ordonnées, quantitatives, catégorielles…), et présenter de larges variétés de structures : hiérarchiques (mind map, arbres…), en réseau (cartes comportementales, flux…), géographiques (cartes…), temporelles (frises, cycles), textuelles etc…
Grâce à l’informatique, qui permet de de collecter et de traiter de nombreuses données en masse, la data visualisation est devenu de plus en plus répandue : un nuage de tags sur un blog, une courbe de tendance sur un moteur de recherches, la courbe d’évolution de la bourse en temps réel… Tout ça, c’est de la data visu. Autant dire qu’il y en a tout autour de nous.

La visualisation d’un ensemble de données permet de mieux évaluer certains concepts et leurs tendances, qui peuvent être difficiles à saisir lorsque l’on se contente des données brutes ou textuelles. Ainsi, se renseigner sur un sujet via des représentations visuelles des données qui lui sont liées peut largement contribuer à sa compréhension, et voire même aider à trouver des patterns/tendances qui n’étaient pas visibles au format brut. Ces résultats, émergents de la représentation, peuvent être analyser afin de déterminer la nature du phénomène faisant évoluer les variables concernées.
Il s’agit donc d’un outil précieux de compréhension, mais aussi d’analyse, pouvant jouer le rôle de révélateur.
La réciproque de ce concept c’est que maîtriser la data visualisation est un outil très efficace pour communiquer ses idées. Créer des Flow Charts, par exemple, peut grandement aider la mise en place d’un processus pour une équipe de travail, et créer des mind maps peut grandement aider l’écriture d’un scénario (comme j’en parlais déjà pour Alien 2347), etc…
Les conférences TED de Hans Rosling, exposant des données démographiques via des représentations graphiques intelligentes et interactives, sont très convaincantes : on y apprend beaucoup sur le monde, mais aussi sur le pouvoir de la data visu : mettre en évidence, efficacement. A voir aussi, sa conférence How to not be Ignorant about the World, son documentaire Don’t Panic, et le site internet de la fondation GapMinder, dont le but est de promouvoir les Objectifs du millénaire pour le développement des Nations unies, sur lequel figure une version en ligne de l’outil de visualisation de données démographiques qu’il a mis au point et qui est le support de chacune de ses interventions.
Une troisième raison qui peut motiver l’apprentissage de la data visualisation, c’est le développement d’un regard critique envers le choix de certaines représentations qui ne montreraient pas (intentionnellement ou non) l’essence d’un phénomène (par exemple, une carte choroplètes bichrome des résultats d’élection par régions n’en dis pas très long sur la proportion des gens qui ont voté dans un pays). Exemple ci dessous avec la President Map 2008 du New York Times.
- En 2008, le New York Times a mis en place un outil en ligne pour visualiser le résultat des élections présidentielles des USA.
- Les différents modes de représentation ne donnent pas les mêmes informations sur les résultats. Ainsi, la carte à bulles, qui encode le nombre de vote décart entre les deux partis, révèle que l’ouest des USA a très majoritairement voté pour Obama (ce qui grandement contribué à sa victoire), chose que ne révèle pas la visualisation plus classique par état (ci contre).
Cela fait un petit moment que le sujet m’intéresse, avec une curiosité particulière pour les approches informatiques interactives, esthétiques et collaboratives liées à ce type d’outils. Grâce à une gestion de l’espace dynamique, l’informatique permet la mise en place de systèmes de filtres et changement d’échelle pour les données, de systèmes d’accessibilité (zoom et changement de jeu de couleur), des systèmes d’informations enrichis qui n’apparaissent qu’après une action de l’utilisateur afin de faciliter la lecture du graphique au premier coup d’œil sans être surchargé d’informations, voir même changer les modes de représentation.

Il m’arrive assez régulièrement de partir à la recherche des nouveautés sur le sujet juste pour le plaisir des yeux, que ce soit purement technique (un web service, un framework JavaScript) ou des exemples concrets liés à un sujet particulier (Arte présente parfois des dossiers web autour d’un documentaire, très fournis en graphiques interactifs). Car certaines représentations ne se contente pas d’être intéressantes, elles sont aussi visually appealing, et d’autant plus si leur esthétique est liée au sujet, si elles sont enrichis d’icônes, de symboles, de contenus multimédia et d’illustrations de graphistes leur donnant un vraie côté artistique.

Récemment, j’ai découvert dans une boutique de la Cité des Sciences, Understanding the World: The Atlas of Infographics. Plus de 500 pages grand format illustrées en couleur, sur le monde (la démographie, l’économie, les ressources, etc…). Un très beau livre qui en dit beaucoup sur nos sociétés et leurs évolutions, de manière moderne et pédagogique. Cela a repiqué ma curiosité sur la data visu. Marie se l’étant offert, il me tarde de pouvoir le lire (hé hé hé !).

Ayant parlé de ce domaine d’étude avec mon ami Adib, celui-ci me ramena de la bibliothèque du CNAM pas moins de 3 livres sur le sujet. Il m’aura fallu une dizaine de jours pour les finir, et comme c’était très intéressant, je tenais à vous les présenter succinctement, afin que de vous donner quelques pistes pour que vous aussi puissiez découvrir ce sujet passionnant ! 🙂
Livres
Data Vision

Un très beau livre plein d’images, aucun texte en dehors des illustrations (le lecteur doit tirer ses propres conclusions sur les graphiques représentés), sur des sujets tout aussi variés que la composition des cafés, les femmes de dictateurs, en passant par la structure de l’ADN et la consommation d’eau par jour d’une personne lambda. On y apprend à être sensibilisé au sujet de la data visu, tout en douceur, la variétés des illustrations et des sujets abordés, dans l’ensemble plutôt légers, rendant la lecture très agréable. Le livre n’est d’ailleurs pas dépourvu d’humour, ce qui est très apprécié et nous fait sortir de l’image ennuyeuse que pourrait avoir de prime abord les statistiques. J’y ai notamment appris la composition du mocha (et oui) ainsi que le coût financier de la dernière grande crise économique comparée à d’autres grandes sommes (comme le budget des Nations Unis et l’Industrie du Tabac). Spoiler alert : c’est énorme.
L’auteur a aussi un site internet, Information is Beautiful, sur lequel il poste des représentation interactives de très hautes qualités. J’ai particulièrement apprécié celle qui montre le pourcentage de vérité de certains films dits tirés d’une histoire vraie.

Design de l’information

Ce livre est à l’opposé du précédant dans le ton : on est là dans la recherche plutôt universitaire, le vocabulaire est très soutenu. La data visu est présentée comme un objet en constante évolution en fonction des innovations (techniques et conceptuelles) et de l’évolution des supports de transmission de l’information. Les études de cas présentées sont souvent très avancées dans le domaine, et témoigne d’une certaine richesse de réflexion de la part de leurs créateurs. L’auteur nous présente une pensée en évolution sur le sujet et l’histoire même de la data visu y est exploré en détails.
Ainsi, on y apprend que un jour un homme a décidé de mettre des couleurs sur une carte pour représenter une phénomène et il a fallu des dizaines d’années avant que d’autres se rendent compte que c’était une bonne idée, que c’est une seule personne qui a inventé les diagrammes circulaires, les diagrammes linéaires et les diagrammes en bâton (William Playfair, le père spirituel de tout les experts de data visu 😛 ), et que certes, les cartes du monde seront toujours imparfaites (la projection d’un sphère sur un plan sur un plan ne se faisant pas sans compromis géométrique, le dilemme reposant sur le respect des surfaces ou celui des angles et des distances), mais que l’on emploie rarement le type de projection qui serait le plus optimisé (même Google Maps et Mappy ne propose que la projection Mercator, soit l’une des plus anciennes des projections, qui a été conçu pour les navigateurs). D’ailleurs, j’ai enfin compris à quoi servait les homolosine (un mot que même le correcteur d’orthographe ne connaît pas).

Vous pourrez aussi apprendre en quoi les cartes isarytmiques avec leurs lignes isométriques et leurs bandes isoplèthes sont intéressantes, et en quoi les cartogrammes sont utiles. Oui, j’ai beaucoup aimé le chapitre sur les représentation spatio-temporels. 😛
100 Diagrams that Changed the World

Ce livre retrace aussi l’histoire de la data visu, mais avec une approche plus générale sur les œuvres et la vie de leurs auteurs. Cependant, le livre se penche un peu trop sur les diagrammes de certains brevet, qui en tant que représentation n’ont pas spécialement fait évoluer la data visu, mais témoignent juste d’une invention qui a changé le monde (même si ce n’est pas toujours le cas, certains de ces diagrammes étant restés cachés pendant des siècles à l’abri des regards). Bon, en apprendre plus sur certaines inventions qui ont changé le monde et leurs auteurs, c’est bien aussi ! 🙂
On reste dans le diagramme à l’ancienne (pas interactivités, presque pas d’infographie) mais ça n’en est pas moins intéressant.

Passionnés des sciences, le livre m’a quand même bien plus, bien que j’ai préféré la démarche du second vis à vis du sujet abordé.
Pour aller plus loin sur le sujet, je compte lire Understanding the World, ce qui devrait prendre un certains temps vu la taille de l’ouvrage. En bonus, j’en saurais un peu plus sur le monde en général, ce qui est toujours bien ! Un jour aussi je prendrais le temps de jouer avec un framework JavaScript de data visu à l’occasion (highchart.js, chart.js, D3.js, AnyChart… ils ont tous l’air intéressant !). Le côté interactif de la chose est attise ma curiosité !
Merci encore à Adib pour la lecture, et Marie (pour ma prochaine lecture du coup :P).
Connaissez-vous d’autres ouvrages ou ressources intéressantes concernant la data visualisation ?
Illustrations :
- Image à la une : dataviz catalog, un site servant de guide pour aider à choisir un mode de représentation des données.
- Wikipedia.org
- Amazon.com