Skip to content
GRAPHIC WALKER
data-viz
Faire un nuage de points

Comment créer un graphique à dispersion

Les graphiques à dispersion sont un outil polyvalent en matière de visualisation des données, parfait pour montrer la relation entre deux variables. Ce guide vous guidera à travers le processus de création d'un graphique à dispersion à l'aide de RATH.

Principales caractéristiques des graphiques à dispersion

Le principal objectif des graphiques à dispersion est d'identifier des relations de corrélation. Si nous avons une valeur horizontale spécifique, un graphique à dispersion aide à prédire une valeur verticale correspondante. Souvent, la variable sur l'axe horizontal est considérée comme la variable indépendante, tandis que l'axe vertical représente la variable dépendante. Les relations entre les variables peuvent être positives ou négatives, fortes ou faibles, linéaires ou non linéaires.

Les graphiques à dispersion aident également à identifier d'autres motifs dans les données. Par exemple, les points de données peuvent être regroupés en fonction de leur proximité les uns des autres. Les graphiques à dispersion peuvent révéler des écarts inattendus dans les données et mettre en évidence des points aberrants. Cette fonction est utile lorsque vous souhaitez segmenter les données en différentes parties, comme dans la création de personas d'utilisateurs.

Exemple de graphique à dispersion

Préparation des données pour un graphique à dispersion

Pour créer un graphique à dispersion, vous devez sélectionner deux colonnes de votre tableau de données, une pour chaque axe du graphique. Chaque ligne du tableau devient un seul point dans le graphique, positionné en fonction de ses valeurs de colonne. Pour plus de détails sur la préparation d'un graphique à dispersion, consultez le chapitre Préparer les données.

Création d'un graphique à dispersion dans RATH

Dans RATH (opens in a new tab), vous pouvez créer un graphique à dispersion en suivant ces étapes :

  1. Importer vos données : Connectez-vous à votre compte et téléchargez votre fichier CSV ou Excel dans RATH, ou connectez votre base de données en ligne à RATH.

  2. Sélectionner le type de graphique : Dans l'onglet Exploration, choisissez le bouton Type de marque sur la barre d'outils et sélectionnez 'Scatter'.

  3. Créer le graphique : Faites glisser vos variables sur les étagères, en définissant l'axe des x et l'axe des y pour votre graphique à dispersion.

Cas d'utilisation des graphiques à dispersion

Les graphiques à dispersion sont des outils polyvalents pour la visualisation des données dans divers scénarios, tels que :

  1. Recherche de marché : Comprendre la corrélation entre le prix du produit et les ventes.

  2. Santé : Étudier la relation entre l'âge du patient et le temps de récupération.

  3. Science de l'environnement : Analyser la corrélation entre la température et le taux de fonte des glaces.

Conseils pour de meilleurs graphiques à dispersion

Ajouter une ligne de tendance : Si vous utilisez un graphique à dispersion pour examiner une relation prédictive ou de corrélation, vous pouvez ajouter une ligne de tendance montrant le meilleur ajustement mathématique aux données.

Troisième variable catégorique : Une troisième variable peut être ajoutée au graphique à dispersion. Si cette troisième variable est catégorique (comme la région géographique ou le genre), vous pouvez l'encoder en changeant la couleur des points.

Troisième variable numérique : Si la troisième variable est numérique, vous pouvez changer la taille des points, créant ainsi un diagramme en bulles. Alternativement, la teinte peut également être utilisée pour représenter des valeurs numériques.

Mettre en évidence les points d'intérêt : Pour présenter des informations, vous pouvez mettre en évidence des points spécifiques d'intérêt grâce à des annotations et des couleurs.

Alternatives aux graphiques à dispersion

Carte à dispersion : Si les deux variables sont des coordonnées géographiques, vous pouvez superposer les points sur une carte pour créer une carte à dispersion.

Carte thermique : Une carte thermique peut être utilisée lorsqu'il y a de nombreux points de données et que leur densité pose des problèmes de surimpression.

Graphique à dispersion connecté : Si la troisième variable indique des horodatages, un graphique à dispersion connecté peut montrer comment la relation entre les deux variables principales change avec le temps.

Conclusion

En résumé, les graphiques à dispersion sont des outils puissants pour visualiser et comprendre les relations entre deux variables numériques, identifier des motifs et des points aberrants, et segmenter les données. L'utilisation stratégique des graphiques à dispersion peut fournir des informations précieuses et faciliter la prise de décisions basée sur les données.