Skip to content

Comment convertir un DataFrame Pandas en un tableau NumPy

Updated on

Si vous êtes familier avec l'analyse de données, vous avez probablement travaillé à la fois avec des DataFrames Pandas et des tableaux NumPy. Alors que les DataFrames offrent des capacités avancées de manipulation des données, les tableaux NumPy sont idéaux pour effectuer des opérations numériques sur de grands ensembles de données.

Dans cet article, nous allons explorer comment convertir facilement un DataFrame Pandas en un tableau NumPy. Nous couvrirons tout, de la syntaxe et des exemples de code aux bonnes pratiques et conseils utiles. Donc, que vous soyez débutant ou data scientist expérimenté, continuez à lire pour apprendre comment développer facilement vos compétences en analyse de données.

Vous voulez créer rapidement une visualisation des données à partir d'un DataFrame Pandas en Python sans code?

PyGWalker est une bibliothèque Python pour l'analyse exploratoire de données avec visualisation. PyGWalker (opens in a new tab) peut simplifier votre flux de travail d'analyse de données et de visualisation de données dans Jupyter Notebook, en transformant votre dataframe pandas (et le dataframe polarisé) en une interface utilisateur de style Tableau pour l'exploration visuelle.

PyGWalker pour la visualisation des données (opens in a new tab)

Qu'est-ce qu'un DataFrame Pandas?

Un DataFrame Pandas est une structure de données tabulaire de 2 dimensions, de taille modifiable, couramment utilisée pour la manipulation et l'analyse de données. Il est similaire à un tableau Excel ou une table SQL et peut contenir une grande variété de types de données tels que les entiers, les nombres décimaux et les chaînes de caractères.

En Pandas, un DataFrame est créé à partir de dictionnaires ou en lisant un fichier de données CSV, Excel ou d'autres types. Vous pouvez manipuler un DataFrame de nombreuses façons, telles que la sélection des lignes et des colonnes, le tri, le filtrage et l'agrégation des données.

Qu'est-ce qu'un tableau NumPy?

Un tableau NumPy, en revanche, est un conteneur multidimensionnel d'éléments du même type et de même taille. Il peut contenir divers types de données numériques tels que les entiers, les nombres décimaux et les nombres complexes.

Les tableaux NumPy sont idéaux pour les opérations numériques en raison de leur capacité à effectuer des calculs mathématiques sur des tableaux entiers sans boucles ou itérations. Ils offrent également une large gamme de fonctions mathématiques et sont souvent utilisés pour le calcul scientifique et l'analyse de données.

Étapes pour convertir un DataFrame Pandas en tableau NumPy

La conversion d'un DataFrame Pandas en un tableau NumPy est facile. Les étapes suivantes décrivent le processus:

  1. Installez le package NumPy s'il n'est pas déjà installé:

    pip install numpy
  2. Importez les packages Pandas et NumPy:

    import pandas as pd
    import numpy as np
  3. Créez un DataFrame Pandas à l'aide d'un dictionnaire:

    data = {'Name': ['John', 'Jane', 'Sam'],
            'Age': [25, 29, 36],
            'Sex': ['Male', 'Female', 'Male']}
    df = pd.DataFrame(data)
  4. Convertissez le DataFrame en un tableau NumPy en utilisant la méthode to_numpy():

    tableauNumPy = df.to_numpy()

Une fois que vous avez suivi les étapes ci-dessus, vous devriez avoir un tableau NumPy qui contient les mêmes données que votre DataFrame Pandas.

Exemples de code

Pour consolider votre compréhension, voici quelques exemples de code qui montrent comment convertir des DataFrames Pandas en tableaux NumPy dans divers scénarios.

Convertir une seule colonne en tableau NumPy

Si vous avez un DataFrame avec une seule colonne, vous pouvez le convertir en un tableau NumPy en utilisant le code suivant:

df = pd.DataFrame({'A': [1, 2, 3, 4, 5]})
tableauNumPy = df['A'].to_numpy()

Convertir plusieurs colonnes en tableau NumPy

Vous pouvez également convertir plusieurs colonnes d'un DataFrame en un tableau NumPy. Considérez le code suivant:

df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})
tableauNumPy = df[['A', 'B']].to_numpy()

Ici, nous sélectionnons les colonnes 'A' et 'B' à inclure dans notre tableau NumPy.

Convertir des lignes sélectionnées en tableau NumPy

Si vous voulez convertir un sous-ensemble de lignes de votre DataFrame en un tableau NumPy, vous pouvez utiliser la méthode iloc. Par exemple:

df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})
tableauNumPy = df.iloc[1:3, :].to_numpy()

Cet extrait de code sélectionne les lignes 1 à 3 du DataFrame et inclut toutes les colonnes dans le tableau NumPy résultant.

Convertir toutes les colonnes sauf une en tableau NumPy

Pour exclure une colonne spécifique de votre DataFrame lors de sa conversion en tableau NumPy, vous pouvez spécifier explicitement les colonnes que vous souhaitez inclure. Par exemple:

df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10], 'C': [11, 12, 13, 14, 15]})
tableauNumPy = df[['A', 'B']].to_numpy()

Cet extrait de code sélectionne les colonnes 'A' et 'B' du DataFrame, ce qui donne un tableau NumPy qui ne contient que ces colonnes.

Conclusion

Dans ce guide complet, nous avons expliqué comment convertir un DataFrame Pandas en un tableau NumPy en Python. Nous avons illustré la syntaxe et fourni plusieurs exemples de code pour montrer comment convertir des DataFrames dans différents scénarios. Nous espérons que vous avez trouvé ce guide utile et qu'il vous aidera à développer vos compétences en analyse de données. En exploitant les forces des DataFrames et des tableaux NumPy, vous pouvez pousser votre analyse de données à de nouveaux sommets. Bon codage!

Questions fréquemment posées

  1. Comment convertir des données de table en format JSON?

    Pour convertir des données de table en format JSON, vous pouvez itérer sur les lignes de la table et créer un dictionnaire pour chaque ligne, où les clés sont les noms des colonnes et les valeurs sont les valeurs correspondantes dans la ligne. Vous pouvez ensuite stocker ces dictionnaires dans une liste et utiliser la fonction json.dumps() pour convertir la liste en format JSON.

  2. Comment convertir une table en JSON en Python ?

    En Python, vous pouvez convertir une table au format JSON en utilisant la bibliothèque pandas. Chargez les données de la table dans un DataFrame pandas, puis utilisez la méthode to_json() pour convertir le DataFrame au format JSON. Vous pouvez spécifier différentes options pour la conversion JSON, telles que l'orientation de la sortie JSON en tant que enregistrements, colonnes ou valeurs.

  3. Comment convertir une liste en JSON en Python ?

    En Python, vous pouvez convertir une liste au format JSON en utilisant la fonction json.dumps(). Passez la liste en tant qu'argument à json.dumps() et cela renverra une représentation de chaîne au format JSON de la liste. Vous pouvez également spécifier des options supplémentaires, telles que l'indentation de la sortie JSON pour une meilleure lisibilité.