Tech Blog

Small data is the new big data | Toucan Toco

Rédigé par Florent Rambaud | Dec 30, 2016 5:00:00 AM

Savez-vous combien de fois vous avez ressenti de la frustration cette semaine ou encore combien de personnes vous ont remerciées ? Les auteures de Dear Data le savent ! Elles se sont intéressées à ces ‘petites’ données et nous racontent les histoires de leur quotidien.

Dear Data: 52 semaines de dataviz!

Les designers Giorgia Lupi et Stefanie Posavec collectent chaque semaine des données les concernant sur un thème précis. Elles construisent ensuite une datavisualisation basée sur ces données et se l’envoient par courrier. La légende de chaque visualisation étant portée au verso de la carte.

“Dear Data” contient un an d’échanges sur des thèmes aussi variés que ‘a week of thank you’ ou ‘a week of drinks’.

Giorgia Lupi est designer d’origine italienne et vit à New York. Elle est co-fondatrice d’Accurat qui est à l’origine de visualisations comme The lifecycle of ideas ou Famous writers sleep habit.

Ses meilleures visualisations dans le livre :

Stefanie Posavec est information designer d’origine américaine et vit à Londres. Elle a été la première data artist en residence chez Facebook et travaille désormais comme freelance.

Ses meilleures visualisations dans le livre:

Small data vs big data

Giorgia et Stefanie reconnaissent s’inscrire en partie dans la lignée d’autres ‘self reporters’ ou ‘quantified selfers’ comme Nicholas Feltron.

Giorgia et Stefanie collectent une quantité limitée de données sur le nombre extrêmement limité de 2 personnes. Pourquoi se limiter ainsi? Pourquoi ne pas collecter les données liées à davantage de personnes? Pourquoi ne pas prolonger la période de collecte de données de plusieurs semaines/mois?

Lorsque le nombre d’observations réalisées dépasse un certain niveau, il devient nécessaire de raisonner par aggrégats. Ces aggrégats (moyennes, médianes, maxima) sont le seul moyen d’analyser des centaines, milliers voire milliards de données collectées.

Cependant, pour les auteures de Dear Data, l’agrégation de données fait perdre d’autres type d’informations importantes, comme les particularités et aspérités propres à chaque observation qui n’ont de sens et d’intérêt que pour la personne concernée par les données.

En prenant une loupe et en s’intéressant au small data, à ces miettes de données que nous produisons tous au quotidien, on peut en apprendre bien plus sur soi-même que via les rapports d’une énième étude.

Le plus sympa dans l’histoire c’est que tout le monde peut essayer! Il suffit de choisir un thème, collecter des données pendant une semaine puis les analyser et réaliser avec un papier et crayon une visualisation qui nous permet d’en faire ressortir une histoire.

Chez Toucan Toco nous pensons également que les données de l’entreprise ne doivent pas être gardées agrégées entre les mains des 1% d’analyste mais diffusées largement dans l’entreprise aux autres 99% qu’ils soient décideurs, producteurs ou acteurs de cette donnée. Ces personnes découvriront une autre histoire dans leurs données.

Par ailleurs j’étais particulièrement curieux de savoir comment le thème ‘a week of to-do’ avait été traité et me suis demandé quelle visualisation j’aurais pu construire sur ce sujet.

Et vous faites-vous vos to-do?

A week of to-do par Giorgia

A week of to-do par Stefanie

Je préfère l’approche de Stefanie qui permet davantage d’avoir une idée de ce qui s’est passé dans la semaine en un coup d’oeil :

  • les catégories des tâches sont évidentes (couleur),
  • les nouvelles tâches apparaissent clairement (elles commencent en bas de la visualisation),
  • pour un jour donné on voit facilement les tâches qui ont été finalisées / les nouvelles tâches.

Ce qui manque :

  • mise en évidence des tâches finalisées au cours de la semaine (le prix à payer pour avoir un flux de tâches qui progresse de haut en bas),
  • une vue synthétique de la semaine (même si nous avons déjà accès aux “key stats” de la semaine en légende),
  • la notion de tâche prioritaire
  • la notion de satisfaction liée à l’avancement ou à la finalisation de la tâche (Ai-je bien avancé aujourd’hui? Est-ce que le résultat est celui que j’attendais?)

Notre to-do! (en fake data :( )

 
 

Notre méthode

  • Source : Fake data! Mais j’utilise trello pour écrire mes to-do, qu’elles soient professionnelles ou personnelle. Ce qui est pratique avec trello (en dehors d’être 100% gratuit!) c’est que chaque tâche est tracée. Je sais quand une tâche a été créée et quand elle est marquée comme en cours de réalisation/réalisée. J’aurais pu utiliser ces données réelles ici.
  • Méthode : s’inspirer des visualisations de Dear Data et identifier ce qui peut être amélioré et comment l’utilisation d’une visualisation interactive contre une représentation papier, peut faciliter la découverte de données.

Et vous ? Si vous avez un thème qui vous tient à coeur, la patience de collecter des données: un papier et un crayon c’est tout ce dont vous avez besoin pour l’explorer :)