Skip to content

Eine neue Spalte zu einer Pandas DataFrame hinzufügen: Methoden und Techniken

Updated on

Das Arbeiten mit DataFrames ist ein wesentlicher Bestandteil der Datenanalyse und Datenwissenschaft. Pandas ist eine weit verbreitete Bibliothek für die Datenmanipulation und -analyse und bietet eine benutzerfreundliche und flexible Möglichkeit, mit DataFrames zu arbeiten. Ein DataFrame ist eine zweidimensionale dataStruktur mit benannten Spalten unterschiedlicher Typen. Es ist wie eine Tabellenkalkulation oder eine SQL-Tabelle, aber mit mehr Leistung und Flexibilität. In diesem Artikel werden wir lernen, wie man einer bestehenden Pandas DataFrame eine neue Spalte hinzufügt. Wir werden auch verschiedene Methoden und Techniken diskutieren, um eine neue Spalte in einem Pandas DataFrame einzufügen.

Möchten Sie schnell Datenvisualisierungen in Python erstellen?

PyGWalker ist ein Open Source Python-Projekt, das den Workflow der Datenanalyse und -visualisierung direkt in einer Jupyter Notebook-basierten Umgebung beschleunigen kann.

PyGWalker (opens in a new tab) verwandelt Ihren Pandas Dataframe (oder Polars Dataframe) in eine visuelle Benutzeroberfläche, in der Sie Variablen per Drag & Drop ziehen und ablegen können, um Diagramme mit Leichtigkeit zu erstellen. Verwenden Sie einfach den folgenden Code:

pip install pygwalker
import pygwalker as pyg
gwalker = pyg.walk(df)

Sie können PyGWalker jetzt direkt mit diesen Online-Notebooks ausführen:

Und vergessen Sie nicht, uns auf GitHub ein ⭐️ zu geben!

PyGWalker in Kaggle Notebook ausführen (opens in a new tab)PyGWalker in Google Colab ausführen (opens in a new tab)PyGWalker ein ⭐️ auf GitHub geben (opens in a new tab)
PyGWalker in Kaggle Notebook ausführen (opens in a new tab)PyGWalker in Google Colab ausführen (opens in a new tab)PyGWalker in Google Colab ausführen (opens in a new tab)

Was ist ein Pandas DataFrame?

Ein Pandas DataFrame ist eine zweidimensionale Datenstruktur mit benannten Achsen. Es ist wie eine Tabellenkalkulation oder eine SQL-Tabelle, aber mit mehr Leistung und Flexibilität. Ein DataFrame kann aus verschiedenen Eingabe-Datenformaten wie CSV, Excel, SQL-Datenbanken und anderen erstellt werden. Ein DataFrame kann mit verschiedenen Methoden und Funktionen der Pandas-Bibliothek manipuliert und analysiert werden.

Wie fügt man eine neue Spalte zu einem Pandas DataFrame hinzu?

Um einer bestehenden Pandas DataFrame eine neue Spalte hinzuzufügen, können verschiedene Methoden und Techniken verwendet werden. Der häufigste Weg, eine neue Spalte hinzuzufügen, ist die Verwendung der einfachen Zuweisung. Schauen wir uns ein Beispiel an.

Angenommen, wir haben einen DataFrame mit zwei Spalten: 'Name' und 'Alter'.

import pandas as pd
 
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Alter': [25, 30, 35, 40]
}
 
df = pd.DataFrame(data)
print(df)

Ausgabe:

       Name  Alter
0     Alice     25
1       Bob     30
2   Charlie     35
3     David     40

Nun möchten wir eine neue Spalte 'Gehalt' zum DataFrame hinzufügen. Wir können die einfache Zuweisung wie folgt verwenden.

df['Gehalt'] = [50000, 60000, 70000, 80000]
print(df)

Ausgabe:

       Name  Alter  Gehalt
0     Alice     25   50000
1       Bob     30   60000
2   Charlie     35   70000
3     David     40   80000

Wir sehen, dass eine neue Spalte 'Gehalt' zum DataFrame hinzugefügt wurde.

Unterschiedliche Methoden zum Einfügen einer neuen Spalte in ein Pandas DataFrame

Es gibt verschiedene Methoden und Techniken, um eine neue Spalte in ein Pandas DataFrame einzufügen. Lassen Sie uns diese nacheinander diskutieren.

Methode 1: Einfache Zuweisung

Wie wir im vorherigen Beispiel gesehen haben, können wir eine neue Spalte zu einem DataFrame mit Hilfe der einfachen Zuweisung hinzufügen. Wir können einer neuen Spaltenbezeichnung im DataFrame eine Liste oder ein numpy Array zuweisen, wie im folgenden Beispiel gezeigt.

df['NeueSpalte'] = [1, 2, 3, 4]

Methode 2: Insert-Methode

Eine andere Möglichkeit, eine neue Spalte in einem Pandas DataFrame einzufügen, ist die Verwendung der insert-Methode. Die insert-Methode nimmt drei Argumente entgegen: loc, column und value. loc ist der Index der Spalte, wo wir die neue Spalte einfügen möchten. column ist der Name der neuen Spalte und value ist der Wert, den wir der neuen Spalte zuweisen möchten.

df.insert(loc=1, column='NeueSpalte', value=[1, 2, 3, 4])

Methode 3: Concatenate-Methode

Wir können auch zwei DataFrames entlang der Achse 1 konkatenieren, um eine neue Spalte zu einem vorhandenen DataFrame hinzuzufügen. Die neue Spalte wird auf der rechten Seite des vorhandenen DataFrames hinzugefügt. Die concat-Methode nimmt zwei DataFrames als Argumente entgegen und konkateniert sie entlang der Achse 1.

df2 = pd.DataFrame({'NeueSpalte': [1, 2, 3, 4]})
df = pd.concat([df, df2], axis=1)

Methode 4: Assign-Methode

Die assign-Methode ermöglicht es uns, eine neue Spalte in einem DataFrame zu erstellen und ein neues DataFrame mit der neuen Spalte zurückzugeben. Sie nimmt ein Wörterbuch als Argument, wobei jeder Schlüssel den Namen einer neuen Spalte repräsentiert und jeder Wert die Werte der neuen Spalte repräsentiert.

df = df.assign(NeueSpalte=[1, 2, 3, 4])

Kann ich eine vorhandene Spalte in einem Pandas DataFrame überschreiben und gleichzeitig eine neue Spalte hinzufügen?

Ja, wir können eine vorhandene Spalte in einem Pandas DataFrame überschreiben und gleichzeitig eine neue Spalte hinzufügen. Wenn wir Werte einer Spalte zuweisen, werden die vorhandenen Werte dieser Spalte durch die neuen Werte ersetzt.

df['Alter'] = [26, 31, 36, 41]

Wie kann ich Spalten an einer bestimmten Position in einem Pandas DataFrame einfügen?

Wir können Spalten an einer bestimmten Position in einem Pandas DataFrame mit der insert Methode einfügen. Der Parameter loc gibt die Position an, an der die Spalte eingefügt werden soll. Wir können den Ganzzahlindex der Spalte verwenden, um ihre Position anzugeben.

df.insert(2, 'NeueSpalte', [1, 2, 3, 4])

Wir können auch den Spaltennamen verwenden, um ihre Position anzugeben.

df.insert(df.columns.get_loc("Alter"), 'NeueSpalte', [1, 2, 3, 4])

Fazit

In diesem Artikel haben wir gelernt, wie wir eine neue Spalte zu einem vorhandenen Pandas DataFrame hinzufügen können. Wir haben verschiedene Methoden und Techniken diskutiert, um eine neue Spalte in einem Pandas DataFrame einzufügen, einschließlich einfacher Zuweisung, insert Methode, concatenate Methode und assign Methode. Wir haben auch besprochen, wie wir eine vorhandene Spalte überschreiben können, während wir eine neue Spalte hinzufügen, und wie wir Spalten an einer bestimmten Position in einem Pandas DataFrame einfügen können. Mit diesen Techniken können Sie Ihre DataFrames effizient und effektiv manipulieren.