28.03.2018

Les bonnes pratiques et l’histoire de la dataviz en 6 minutes

Voici le condensé en 6 minutes, de 12 heures de formation que je donnais à l’ENSAE sur l’histoire et les bonnes pratiques de la dataviz.

dataviz simple

Je souhaite commencer par redéfinir quelques mots clés que l’on connait tous: l’Open Data, le Data Journalism, le Big Data et la Dataviz.

L’Open Data n’est pas un phénomène nouveau

 

Commençons par l’Open Data. Ce n’est pas un phénomène nouveau, bien qu’il soit de plus en plus popularisé par internet, ce principe existe en France depuis les années 70.

 

Nous payons la collecte de données par les collectivités locales et autres organismes gouvernementaux à travers nos impôts. Il est donc normal que nous y ayons accès.

 

Ce qu’internet a permis c’est une meilleure accessibilité aux données.

Open data trend toucan toco

Depuis 10 ans les recherches sur Google pour le terme Open Data ne cessent d’augmenter.

Le data journalisme, les prémices de la dataviz

 

Ceux qui se servent tout particulièrement de ces données sont les journalistes. L’utilisation des données, leur visualisation et leur démocratisation par les journalistes a donné place au Data Journalism.

 

Les grands noms qui ont popularisé cette pratique sont Simon Rogers du Guardian et Mike Bostock du New York Times. Ce dernier a d’ailleurs créé le framework que nous utilisons chez Toucan Toco pour créer nos dataviz: le d3.js.

 

Le Big Data, un buzzword utile

 

En parallèle de cela, le phénomène du Big Data s’est développé. Le Big Data est un terme marketing popularisé par les grands éditeurs de logiciels, qu’il faut absolument remercier. Car avant d’être une révolution technologique, le Big Data est une révolution culturelle. Il a changé les mentalités dans les entreprises.

 

Il a fait évoluer la logique des néophytes et des non-techniciens pour qu’ils s’intéressent à la donnée. L’apparition de ce concept a permis à d’autres utilisateurs de découvrir la valeur de la donnée. Elle peut être utilisée en interne par les collaborateurs ou elle peut être mise en avant, en tant que service auprès de clients et de partenaires.

 

Le Big Data amène une réelle prise de conscience par l’ensemble des collaborateurs en entreprise.

La Dataviz, démocratiser la compréhension des données

 

De ce besoin est née la Dataviz. Bien que le concept des graphiques ne soit pas nouveau, la dataviz permet de représenter des jeux de données complexes en des graphiques interactifs et/ou éditorialisés.

 

Voici quelques bonnes pratiques à ce sujet.

Les bonnes pratiques de la dataviz

 

Les deux dataviz que je vais vous présenter sont excellentes, car elles racontent les données pour les utilisateurs. Elles ne représentent pas “seulement” des données.

 

Afin qu’une dataviz soit pertinente, elle doit faire passer un message. C’est pourquoi une dataviz qui fonctionne est éditorialisée et personnalisée. Tout se joue sur la manière dont on raconte ses données. C’est ce qui permet de rendre la donnée actionnable et opérationnelle.

 

1. Éditorialiser la visualisation de données

 

Tout le monde connaît la représentation des données par arrondissement avec différents niveaux de couleurs qui représentent le niveau de revenu de chaque zone.

 

C’est une approche analytique, simple et efficace. Le seul problème c’est qu’elle ne parle à personne. On s’identifie pas vraiment à un arrondissement en particulier. Lorsque j’indique où j’habite je vais plutôt avoir tendance à donner le nom du métro le proche.

 

La logique de Vincent Garreau est totalement en phase avec cela. Au lieu de reprendre l’angle généraliste, il propose de s’immiscer dans le parcours quotidien des habitants de Paris. Il propose une représentation graphique du niveau de vie autour des stations de métro. L’analyse est beaucoup plus fine et parle mieux aux personnes.

 

On a envie de cliquer sur plusieurs points. On veut voir là où l’on travaille, là où nos amis habitent… C’est cet engouement pour l’information qui rend cette dataviz réussie.

dataviz vincent garreau

Pour jouer avec la dataviz c’est ici.

 

 

2. Personnaliser la visualisation de données

 

Le Pariteur permet d’illustrer les inégalités entre les hommes et les femmes. Il s’adapte à un parcours individuel en prenant en compte du salaire et de la CSP de chaque utilisateur. Une seul message est donné, les femmes de votre âge dans votre profession gagnent moins d’argent que vous.

 

Ce n’est plus un chiffre dans une étude auquel vous ne pouvez pas vous rattacher.

 

La beauté de cette dataviz, c’est qu’elle arrive à présenter des informations d’une manière à faire passer un message qui ne s’adresse pas à une masse, mais à un individu en particulier.

 

dataviz le pariteur

Pour jouer avec la dataviz c’est ici

 

Le principe de la personnalisation c’est qu’avez une information particulière, ici l’âge et le sexe, j’accède à la donnée en fonction de mon histoire. Ce qui me fait ressentir une émotion immédiate. Cette émotion reste ancrée, car elle s’applique à mon univers. Si je regarde ce résultat, je me demande pourquoi. Je suis indigné. Le message est passé !

 

Encore une fois, cette dataviz est un succès car elle ne fait pas que retranscrire des graphiques plats et généralistes. Les données sur les inégalités de salaires sont disponibles depuis des dizaines d’années. Cependant elles n’ont eu un impact que lorsque des journalistes ou des projets comme celui ont décidé de s’emparer de la donnée.

 

Les mauvaises pratiques en dataviz

 

Le camembert, ça pue !

pie chart fail

J’exagère un peu avec ce Piechart mais qui n’a jamais vu cela en réunion ?

dataviz piec hart bar chart

Les graphiques en camembert ou Pie Chart sont en angle. Visuellement, ils ne permettent pas de facilement faire la différence entre plusieurs éléments. Surtout quand les données ont des valeurs proches. Ici vous n’arrivez pas à distinguer si la part bleue est plus ou moins grande que la part orange.

 

On peut le remplacer facilement avec un barchart, le graphique que l’on voit à gauche. Avec ou sans les pourcentages, je vois d’un coup d’oeil que la part orange est plus grande que la part bleue.

 

#nevergoforapiechart

 

Le beau n’est pas forcément clair

table chart beautiful but useless

Ici l’auteur de cette dataviz a essayé de démontrer la part du déficit comparé aux autres centres de dépenses du Royaume-Uni. A votre avis, lequel des deux rectangles pointés est-il le plus important ?

 

La réponse: c’est le même niveau de dépenses ! Ils ont la même taille, pourtant j’aurais dit que la partie couleur chaire était au moins une fois et demie plus grande.

 

D’où l’intérêt de réfléchir en amont à vos dataviz. Si vous faites tout le travail de structurer la donnée, de la représenter, mais que votre visualisation est mal choisie, vous louperez l’effet escompté. Votre message ne sera pas compris.

 

#designfirst

uselful barchart bar chart dataviz

Ici je vois directement les deux dépenses dont je parlais précédemment en premier et deuxième centre de dépense. Je vois que leur taille est presque équivalente. Par ailleurs j’ai l’information centrale qui est placée en médiane et qui joue de catalyseur pour servir mon message.

 

Si je regarde les dépenses supérieures à mon déficit, je remarque que le premier centre de dépense équivaut à des investissements. Ce qui me permet de relativiser sur le déficit budgétaire.

 

Un conseil dans vos visualisations, ayez toujours un comparable, une valeur absolue ne veut rien dire.

 

Pour aller plus loin, retrouvez mon intervention sur le sujet

 

 

Le pape de la dataviz

Je souhaitais vous partager une vidéo, désormais extrêmement connue, de Hans Rosling, considéré par beaucoup comme le pape de la dataviz. C’est la personne qui m’a montré l’intérêt de raconter une histoire autour d’une visualisation.

 

C’est lui qui m’a donné envie de créer une solution de data storytelling et qui m’a convaincu que l’on pouvait rendre la donnée sexy.

 

Dans cette vidéo Hans Rosling commente tel un commentateur sportif l’évolution des Pays en voie de développement.

 

 Hans Rosling dataviz

Regardez les 7 premières minutes, ce sont celles qui comptent le plus

 

Le data storytelling, scénariser la donnée pour les métiers

Le Data Storytelling prend la suite de la dataviz en s’adressant à tout néophyte de la donnée dans l’entreprise. Ces personnes ont besoin d’un outil leur facilitant la lecture et l’interprétation des données de leur organisation.

 

Le data storytelling scénarise la donnée et la rend interactive et actionnable. Les informations les plus importantes apparaissent clairement et un message simple est légué aux utilisateurs.

 

Par ailleurs la mise en forme de cette information s’adapte aux différents besoins de l’entreprise.

 

Le data storytelling transcende la Dataviz car il rend la donnée actionnable. Il permet de mieux piloter les différentes activités des entreprises.

 

 

 

 

 

Kilian Bazin, Co-fondateur et directeur général de Toucan Toco

à lire aussi