Skip to content

Wie man eine Spalte in Pandas umbenennt: Verständlich erklärt

Updated on

Datenanalyse ist eine entscheidende Aufgabe in der datengetriebenen Welt von heute. Es erfordert das Bereinigen, Organisieren und Umwandeln von Rohdaten in ein verständliches und aussagekräftiges Format. Eine der grundlegendsten Aufgaben bei der Datenanalyse ist die Umbenennung von Spalten, da sie die Daten informativer und verständlicher macht.

In diesem Tutorial werden wir untersuchen, wie man Spalten in einem Pandas DataFrame mit verschiedenen Methoden umbenennt. Wir werden bewährte Methoden, Tipps und Tricks diskutieren, um Ihre Datenanalyse klarer und prägnanter zu machen. Fangen wir an!

Möchten Sie schnell Datenvisualisierungen aus einer Python Pandas Dataframe erstellen, ohne Code zu schreiben?

PyGWalker ist eine Python-Bibliothek für explorative Datenanalyse mit Visualisierung. PyGWalker (opens in a new tab) kann Ihren Workflow für Datenanalyse und Datenvisualisierung in Jupyter Notebook vereinfachen, indem es Ihren Pandas DataFrame (und Polars DataFrame) in eine Tableau-ähnliche Benutzeroberfläche für visuelle Exploration umwandelt.

PyGWalker für Datenvisualisierungen (opens in a new tab)

Was ist die Umbenennung von DataFrame-Spalten?

Bevor wir uns ins Codieren stürzen, lassen Sie uns zunächst verstehen, was die Umbenennung von Spalten in einem Pandas DataFrame ist und warum sie wichtig ist.

In einem Pandas DataFrame werden Spalten als eindeutige Bezeichner benannt, die eine Spalte von einer anderen unterscheiden. Manchmal sind diese eindeutigen Bezeichner nicht aussagekräftig oder inkonsistent mit den Daten, was zu Verwirrung und Fehlinterpretation führen kann. In solchen Fällen hilft die Umbenennung von Spalten, diese aussagekräftiger und verständlicher zu machen.

Die Umbenennung von Spalten ist ein Vorgang, bei dem der Name einer oder mehrerer Spalten in einem Pandas DataFrame geändert wird. Dies geschieht entweder durch Auswahl der Spaltenbezeichnungen oder ihrer Indizes. Es verbessert die Lesbarkeit der Daten und hilft dabei, die Beziehungen zwischen verschiedenen Spalten zu verstehen.

Wie benennt man eine Spalte in einem Pandas DataFrame um?

Pandas bietet verschiedene Möglichkeiten, Spalten in einem DataFrame umzubenennen. Wir werden die am häufigsten verwendeten Methoden und bewährten Methoden zur Umbenennung von Spalten erkunden.

Umbenennen einer einzelnen Spalte

Beginnen wir mit der einfachsten Methode zur Umbenennung einer einzelnen Spalte in einem Pandas DataFrame. Wir verwenden die Methode rename, um das zu tun.

# Erstellen Sie ein Beispieldatenframe
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Age': [25, 24, 28],
        'Gender': ['Male', 'Male', 'Male']}
 
df = pd.DataFrame(data)
 
# Benennen Sie die Spalte 'Age' in 'Years' um
df = df.rename(columns={'Age': 'Years'})
 
# DataFrame ausgeben
print(df) 

Ausgabe:

    Name  Years Gender
0   John     25   Male
1   Alex     24   Male
2  Peter     28   Male

Hier haben wir ein Beispieldatenframe mit den Spalten Name, Age und Gender erstellt. Wir haben die Methode rename verwendet, um den Namen der Spalte Age in Years zu ändern. Die rename-Methode nimmt ein Wörterbuch als Eingabe an, wobei die Schlüssel die alten Spaltennamen und die Werte die neuen Spaltennamen sind.

Mehrere Spalten umbenennen

Das Umbenennen einer einzelnen Spalte ist einfach, aber was ist, wenn wir mehrere Spalten auf einmal umbenennen möchten? In solchen Fällen können wir dieselbe Methode rename mit einem Wörterbuch aus alten und neuen Spaltennamen verwenden.

# Erstellen Sie ein Beispieldatenframe
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Age': [25, 24, 28],
        'Department': ['IT', 'HR', 'Marketing']}
 
df = pd.DataFrame(data)
 
# Benennen Sie die Spalten 'Age' und 'Department' um
df = df.rename(columns={'Age': 'Years', 'Department': 'Dept'})
 
# DataFrame ausgeben
print(df) 

Ausgabe:

    Name  Years       Dept
0   John     25         IT
1   Alex     24         HR
2  Peter     28  Marketing

Hier haben wir zwei Spalten, Age in Years und Department in Dept, umbenannt, indem wir die Methode rename mit einem Wörterbuch aus alten und neuen Spaltennamen verwendet haben.

Spalten mit der Methode set_axis umbenennen

Eine weitere Möglichkeit, Spalten in einem Pandas DataFrame umzubenennen, besteht darin, die Methode set_axis zu verwenden. Es handelt sich um eine flexible und bequeme Methode, mit der Spalten durch Auswahl ihrer Indizes oder Labels umbenannt werden können.

# Erstellen Sie ein Beispieldatenframe
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Age': [25, 24, 28],
        'Gender': ['Male', 'Male', 'Male']}
 
df = pd.DataFrame(data)
 
# Benennen Sie die Spalten 'Age' und 'Gender' nach Index um
df.columns = df.columns.set_axis(['a', 'Years', 'b'], axis=1, inplace=False)
 
# DataFrame ausgeben
print(df) 

Ausgabe:

    Name  Years     b
0   John     25  Male
1   Alex     24  Male
2  Peter     28  Male

Hier haben wir die Methode set_axis verwendet, um die Spalten mit Indexpositionen umzubenennen. Die Methode nimmt drei Parameter - Labels, Axis und Inplace - an. Wir haben die Labels auf die neuen Spaltennamen und die Axis auf 1 gesetzt, was für Spalten steht. Der Inplace-Parameter ist auf False gesetzt, um ein neues DataFrame zurückzugeben.

Spalten mit List Comprehension umbenennen

Wir können auch Spalten in einem Pandas DataFrame mit List Comprehension umbenennen. Es handelt sich um eine einfache und elegante Methode, mit der mehrere Spalten auf einmal umbenannt werden können.

# Erstellen Sie ein Beispieldatenframe
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Age': [25, 24, 28],
        'Department': ['IT', 'HR', 'Marketing']}
 
df = pd.DataFrame(data)
 
# Benennen Sie die Spalten 'Age' und 'Department' mit List Comprehension um
df.columns = [col.replace('_', ' ').title() for col in df.columns]
 
# DataFrame ausgeben
print(df) 

Ausgabe:

    Name  Age  Department
0   John   25          IT
1   Alex   24          HR
2  Peter   28   Marketing

Hier haben wir die Listenkomprehension verwendet, um die Spalten durch Ersetzen der Unterstriche durch Leerzeichen und Umwandeln des ersten Buchstabens in Großbuchstaben mit der title()-Methode umzubenennen.

DataFrame nach Index umbenennen

Das Umbenennen einer Spalte nach Index ist auch in Pandas DataFrame möglich. Wir können die rename-Methode mit einem Wörterbuch alter und neuer Spaltenindexpositionen verwenden.

# Beispiel DataFrame erstellen
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Alter': [25, 24, 28],
        'Abteilung': ['IT', 'HR', 'Marketing']}
 
df = pd.DataFrame(data)
 
# Umbenennen der Spalte '2' in 'Abteilung' nach Index
df = df.rename(columns={2: 'Abteilung'})
 
# DataFrame anzeigen
print(df) 

Ausgabe:

    Name  Alter Abteilung
0   John     25        IT
1   Alex     24        HR
2  Peter     28 Marketing

Hier haben wir die rename-Methode verwendet, um die Spalte mit dem Index 2 in Abteilung umzubenennen.

DataFrame-Spalte mit Liste umbenennen

Wir können auch Spalten in Pandas DataFrame umbenennen, indem wir eine Liste von Spaltennamen auswählen. Schauen wir uns an, wie das geht.

# Beispiel DataFrame erstellen
import pandas as pd
 
data = {'Name': ['John', 'Alex', 'Peter'],
        'Alter': [25, 24, 28],
        'Abteilung': ['IT', 'HR', 'Marketing']}
 
df = pd.DataFrame(data)
 
# Umbenennen der Spalten 'Name' und 'Abteilung' mit einer Liste von Spaltennamen
df.columns = ['ID', 'Jahre', 'Abteilung']
 
# DataFrame anzeigen
print(df) 

Ausgabe:

    ID  Jahre Abteilung
0  John     25        IT
1  Alex     24        HR
2 Peter     28 Marketing

Hier haben wir eine Liste von Spaltennamen verwendet, um die Spalten Name und Abteilung in ID bzw. Abteilung umzubenennen.

Fazit

In diesem Tutorial haben wir gelernt, wie man Spalten in Pandas DataFrame mit verschiedenen Methoden umbenennt - rename-Methode, set_axis-Methode, Listenkomprehension, Umbenennen nach Index und Umbenennen mit einer Liste. Wir haben auch bewährte Verfahrensweisen, Tipps und Tricks erforscht, um Ihre Datenanalyse organisierter und informativer zu gestalten.

Die Umbenennung von Spalten ist ein wichtiger Schritt in der Datenanalyse, da sie die Lesbarkeit der Daten verbessert und hilft, die Beziehungen zwischen verschiedenen Spalten zu verstehen. Durch die Verwendung der oben diskutierten Methoden können Sie Spalten in Pandas DataFrame leicht umbenennen und Ihre Datenanalyse effektiver und effizienter gestalten.

Wir hoffen, dass dieses Tutorial hilfreich und informativ war. Viel Spaß beim Codieren!


Links:

Häufig gestellte Fragen

  1. Wie kann man eine Spalte in einem DataFrame umbenennen?

    Um eine Spalte in einem DataFrame umzubenennen, können Sie die Methode rename() in pandas verwenden. Geben Sie den alten Spaltennamen und den neuen Spaltennamen mit einem Wörterbuch oder einer Zuordnung an. Diese Methode ermöglicht es Ihnen, eine einzelne Spalte oder mehrere Spalten auf einmal umzubenennen.

  2. Wie benennt man eine Spalte nach Spaltenindex in Pandas um?

    In pandas können Sie eine Spalte nach Spaltenindex mit der Methode rename() und dem Parameter columns umbenennen. Übergeben Sie ein Wörterbuch, bei dem die Schlüssel die aktuellen Spaltenindizes sind und die Werte die neuen Spaltennamen sind. Diese Methode ermöglicht es Ihnen, Spalten basierend auf ihrer Position im DataFrame umzubenennen.

  3. Wie kann man mehrere Spalten in einem DataFrame umbenennen?

    Um mehrere Spalten in einem DataFrame umzubenennen, können Sie die Methode rename() mit dem Parameter columns verwenden. Übergeben Sie ein Wörterbuch, bei dem die Schlüssel die aktuellen Spaltennamen sind und die Werte die neuen Spaltennamen sind. Diese Methode ermöglicht es Ihnen, mehrere Spalten gleichzeitig umzubenennen und bietet Flexibilität bei der Umbenennung von Spalten basierend auf spezifischen Kriterien.