Skip to content

Plotly Express: Clairement Expliqué

La visualisation de données est un aspect crucial de l'analyse de données et de l'apprentissage automatique. Elle nous permet de comprendre des ensembles de données complexes et de tirer des enseignements qui pourraient ne pas être visibles à partir des données brutes. Un outil qui a rendu ce processus incroyablement simple est Plotly Express.

Plotly Express est une interface de haut niveau pour la visualisation de données. Il simplifie le processus de création de graphiques complexes et facilite la création de visualisations époustouflantes pour les débutants. Que vous soyez débutant ou programmeur expérimenté, ce guide complet vous montrera comment exploiter tout le potentiel de Plotly Express.

Qu'est-ce que Plotly Express ?

Plotly Express, souvent abrégé en PX, est un wrapper pour Plotly.py qui simplifie le processus de création de graphiques complexes. Il fournit une interface de haut niveau à la bibliothèque Plotly, ce qui signifie que vous pouvez créer des visualisations époustouflantes avec moins de lignes de code.

Plotly Express prend en charge une grande variété de graphiques, notamment les graphiques en nuage de points, les graphiques linéaires, les graphiques à barres, et plus encore. Il prend également en charge les animations, ce qui permet de créer des graphiques interactifs qui changent avec le temps ou en réponse aux interactions de l'utilisateur.

Une des fonctionnalités clés de Plotly Express est son intégration avec les DataFrames Pandas. Cela signifie que vous pouvez directement transmettre des objets DataFrame aux fonctions Plotly Express, ce qui facilite le travail avec de grands ensembles de données.

Plotly Express vs Plotly Graph Objects

Bien que Plotly Express et Plotly Graph Objects fassent tous deux partie de l'écosystème Plotly, ils ont des objectifs différents. Plotly Graph Objects est une interface de bas niveau offrant plus de contrôle et d'options de personnalisation. Plotly Express, quant à lui, est une interface de haut niveau qui simplifie le processus de création de graphiques.

Pour les débutants, Plotly Express est souvent le meilleur choix. Il est plus facile à utiliser et nécessite moins de code pour créer des visualisations complexes. Cependant, si vous avez besoin de plus de contrôle sur vos graphiques ou si vous voulez créer des visualisations personnalisées, vous trouverez peut-être Plotly Graph Objects plus adapté.

Types de visualisations avec Plotly Express

Plotly Express prend en charge une grande variété de visualisations. Voici quelques-uns des types les plus courants :

  1. Graphiques en nuage de points: Les graphiques en nuage de points sont utilisés pour afficher la relation entre deux variables numériques. Ils sont très utiles pour identifier les tendances, les motifs et les valeurs aberrantes dans vos données.

  2. Graphiques linéaires: Les graphiques linéaires sont utilisés pour afficher des données dans le temps. Ils sont couramment utilisés dans l'analyse de séries temporelles et pour suivre les changements au fil du temps.

  3. Graphiques à barres: Les graphiques à barres sont utilisés pour comparer la fréquence, le nombre ou d'autres caractéristiques de différentes catégories. Ils conviennent très bien aux données catégorielles.

  4. Histogrammes: Les histogrammes sont utilisés pour afficher la distribution d'une seule variable numérique. Ils sont très utiles pour comprendre la dispersion et l'asymétrie de vos données.

  5. Boîtes à moustaches: Les boîtes à moustaches sont utilisées pour afficher le résumé statistique d'une variable numérique. Elles montrent la médiane, les quartiles et les valeurs aberrantes potentielles dans vos données.

  6. Cartes thermiques: Les cartes thermiques sont utilisées pour afficher la corrélation entre deux variables ou plus. Elles sont utiles pour identifier les motifs et les groupes dans vos données.

Chacune de ces visualisations peut être créée en seulement quelques lignes de code avec Plotly Express. Dans la section suivante, nous verrons quelques exemples de création de ces graphiques.

Importation de Plotly Express en Python

Avant de pouvoir commencer à créer des visualisations avec Plotly Express, vous devez l'importer dans votre environnement Python. Si vous n'avez pas encore installé Plotly, vous pouvez le faire à l'aide de pip :

pip install plotly

Une fois Plotly installé, vous pouvez l'importer comme suit :

import plotly.express as px

Avec Plotly Express importé, vous êtes prêt à commencer à créer des visualisations époustouflantes !

Création de visualisations avec Plotly Express

La création de visualisations avec Plotly Express est simple. Commençons par créer un simple graphique en nuage de points. Tout d'abord, nous avons besoin de quelques données. Pour cet exemple, nous utiliserons l'ensemble de données intégré iris :

df = px.data.iris()

Maintenant, nous pouvons créer un graphique en nuage de points de la largeur du sépale par rapport à la longueur du sépale :

fig = px.scatter(df, x="sepal_width", y="sepal_length")
fig.show()

En seulement trois lignes de code, nous avons créé un graphique en nuage de points ! Mais Plotly Express peut faire beaucoup plus que des graphiques en nuage de points. Créons un graphique linéaire à l'aide de l'ensemble de données gapminder :

df = px.data.gapminder().query("country=='Canada'")
fig = px.line(df, x="year", y="lifeExp", title='Espérance de vie au Canada')
fig.show()

Encore une fois, en seulement quelques lignes de code, nous avons créé un graphique linéaire qui montre l'espérance de vie au Canada au fil du temps.

Personnalisation des graphiques dans Plotly Express

Un des points forts de Plotly Express est ses options de personnalisation. Vous pouvez facilement changer les couleurs, les étiquettes et d'autres aspects de vos graphiques.

Par exemple, personnalisons notre graphique en nuage de points précédent. Nous allons colorer les points par espèce et changer les étiquettes :

fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species",
                 labels={
                     "sepal_width": "Largeur du sépale (cm)",
                     "sepal_length": "Longueur du sépale (cm)",
                     "species": "Espèce"
                 },
                 title="Dimensions des sépales d'Iris")
fig.show()

Grâce à ces personnalisations, notre graphique est beaucoup plus informatif. Nous pouvons facilement distinguer entre les espèces et les étiquettes sont plus claires.

Plotly Express vs Other Libraries

En ce qui concerne la visualisation des données en Python, il existe plusieurs bibliothèques parmi lesquelles choisir. Deux des plus populaires, en dehors de Plotly Express, sont Matplotlib et Seaborn.

Matplotlib est une bibliothèque de bas niveau qui offre une grande flexibilité au détriment de la simplicité. Bien que vous puissiez créer presque n'importe quelle visualisation que vous pouvez imaginer, cela nécessite souvent beaucoup de code pour le faire.

Seaborn est une bibliothèque de haut niveau construite sur Matplotlib. Elle simplifie le processus de création de visualisations plus complexes, mais elle nécessite toujours une quantité importante de code pour la personnalisation.

Plotly Express, en revanche, trouve un équilibre entre simplicité et flexibilité. Il vous permet de créer des visualisations complexes avec un code minimal et offre également une large gamme d'options de personnalisation. De plus, la nature interactive des graphiques de Plotly Express constitue un avantage significatif par rapport aux graphiques statiques créés avec Matplotlib ou Seaborn.

Vous souhaitez créer rapidement des visualisations de données à partir d'un dataframe Pandas en Python sans code ?

PyGWalker est une bibliothèque Python pour l'analyse exploratoire des données avec visualisation. PyGWalker (opens in a new tab) peut simplifier votre flux de travail d'analyse et de visualisation des données dans Jupyter Notebook en transformant votre dataframe pandas (et votre dataframe polars) en une interface utilisateur de type Tableau pour l'exploration visuelle.

PyGWalker pour la visualisation des données (opens in a new tab)

Ajout de légendes et d'autres éléments dans Plotly Express

Ajouter des légendes, des titres et des libellés à vos graphiques Plotly Express est simple. La plupart de cela peut être fait directement dans la fonction de traçage elle-même. Par exemple, pour ajouter un titre à votre graphique, vous pouvez utiliser le paramètre title :

fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species", title="Dimensions des sépales de l'iris")
fig.show()

Pour ajouter des étiquettes d'axe, vous pouvez utiliser le paramètre labels comme nous l'avons vu dans les exemples précédents. Les légendes sont automatiquement ajoutées lorsque vous utilisez le paramètre color pour distinguer entre différentes catégories de vos données.

Pour des personnalisations plus avancées, vous pouvez utiliser la méthode update_layout :

fig.update_layout(
    title="Dimensions des sépales de l'iris",
    xaxis_title="Largeur des sépales (cm)",
    yaxis_title="Longueur des sépales (cm)",
    legend_title="Espèces",
    font=dict(
        family="Courier New, monospace",
        size=18,
        color="RebeccaPurple"
    )
)

Cela vous permet de personnaliser la police, la taille et la couleur de votre titre, de vos étiquettes et de votre légende.

Maintenant, passons à quelques questions fréquemment posées sur Plotly Express.

Questions fréquemment posées

  1. Qu'est-ce que Plotly Express ? Plotly Express est une bibliothèque de visualisation de données de haut niveau en Python. C'est un wrapper pour Plotly.py qui simplifie le processus de création de graphiques complexes.

  2. En quoi Plotly Express diffère-t-il des objets graphiques Plotly ? Plotly Express est une interface de haut niveau pour Plotly, ce qui signifie que vous pouvez créer des graphiques complexes avec moins de code. Les objets graphiques Plotly, en revanche, sont une interface de bas niveau qui offre plus de contrôle et d'options de personnalisation.

  3. Quels types de visualisations peuvent être créés avec Plotly Express ? Plotly Express prend en charge une grande variété de visualisations, notamment les graphiques de dispersion, les graphiques linéaires, les graphiques à barres, les histogrammes, les diagrammes en boîte et les cartes de chaleur. Il prend également en charge les animations.

  4. Plotly Express convient-il aux débutants ? Oui, Plotly Express est conçu pour être convivial et nécessite moins de code pour créer des visualisations complexes, ce qui en fait un excellent choix pour les débutants.

  5. Comment Plotly Express peut-il être importé dans Python ? Vous pouvez importer Plotly Express dans Python en utilisant la ligne de code suivante : import plotly.express as px.