Objectif : Obtenir une vue globale sur la combinaison de plusieurs indicateurs et entités. Idéal pour recouper des données transverses.
Une " Heat Map ", ou carte de chaleur, est une technique de visualisation de données. Elle se révèle très utile pour la visualisation de données statistiques complexes.
Plus précisément, il s'agit d'un outil d'analyse de données reposant sur l'utilisation des couleurs. Elles remplacent la hauteur ou la longueur des bandes sur un diagramme.
Les cartes de chaleurs sont utilisées dans tous les domaines pour rendre les ensembles de données compréhensibles et exploitables. Les Heat Maps servent par exemple aux médecins, aux ingénieurs, aux sociologues, ou aux chercheurs de tous les domaines.
Voici un exemple de Heat Map interactive de ToucanToco. Elle permet d’identifier la relation entre les pays et les ventes de modèle d'automobile.
De manière générale, les heatmaps permettent de mettre en lumière les relations entre deux variables. Ceci permet d'identifier des tendances et des patterns de manière intuitive en se basant sur les couleurs.
Il peut s'agir de n'importe quel type de variable, comme des étiquettes de catégories ou des valeurs numériques. La colorisation quant à elle peut représenter toute sorte de métrique. Il peut s'agir d'un compte de fréquence, ou d'un résumé statistique comme une moyenne. Elle peut aussi représenter une qualité au lieu d'une quantité.
Lors de la création d'une carte de chaleur, choisissez la palette de couleurs qui correspond le mieux à vos données. En règle générale, les couleurs vives représentent les valeurs faibles et les couleurs les plus hautes valeurs.
N'oubliez pas d'ajouter une légende à votre carte de chaleur pour préciser à quoi les couleurs correspondent. Vous pouvez aussi ajouter les valeurs numériques correspondantes pour un résultat plus détaillé.
Il existe plusieurs types de cartes de chaleur. L'une des plus populaires est la " clustered heatmap ". Elle permet de créer des associations entre les points de données et leurs caractéristiques. Les outils analytiques proposant ce type de heatmap implémentent le clustering dans leur processus. Ce type de carte est très utile en biologie, notamment pour étudier les similarités entre les gênes de plusieurs individus.
Une autre variante de la heatmap est le " correlogramme ". Chaque variable sur les deux axes est remplacée par une liste de variables numériques dans l'ensemble de données, et chaque cellule représente la relation entre les variables sécantes. Ce type de carte de chaleur permet aux analystes de comprendre les relations entre les variables pour créer des modèles statistiques prédictifs ou descriptifs.