Skip to content

Sortieren von Pandas DataFrame: Beispiele und Tipps

Updated on

Der Pandas DataFrame ist ein leistungsstarkes Tool zur Datenanalyse in Python. Es ermöglicht Ihnen, große Datensätze einfach zu speichern und zu manipulieren. Das Sortieren von Daten ist eine häufige Operation, die hilfreich ist, um Daten zu erforschen und zu visualisieren. In diesem Tutorial werden wir erläutern, wie Sie Daten in einem Pandas DataFrame sortieren können, einschließlich des Sortierens nach Spalte, mehreren Spalten, Index und mehr.

Möchten Sie schnell Datenvisualisierungen in Python erstellen?

PyGWalker ist ein Open-Source-Projekt in Python, das den Datenanalyse- und Visualisierungsworkflow direkt in einer Jupyter-Notebook-Umgebung beschleunigen kann.

PyGWalker (opens in a new tab) verwandelt Ihr Pandas Dataframe (oder Polars Dataframe) in eine visuelle Benutzeroberfläche, in der Sie Variablen per Drag & Drop ziehen und ablegen können, um Diagramme mühelos zu erstellen. Verwenden Sie einfach den folgenden Code:

pip install pygwalker
import pygwalker as pyg
gwalker = pyg.walk(df)

Du kannst PyGWalker jetzt direkt mit diesen Online-Notebooks ausführen:

Und vergiss nicht, uns auf GitHub ⭐️ zu geben!

PyGWalker in Kaggle-Notebook ausführen (opens in a new tab)PyGWalker in Google Colab ausführen (opens in a new tab)PyGWalker auf GitHub ⭐️ geben (opens in a new tab)
PyGWalker in Kaggle-Notebook ausführen (opens in a new tab)PyGWalker in Google Colab ausführen (opens in a new tab)PyGWalker in Google Colab ausführen (opens in a new tab)

Was ist ein Pandas DataFrame?

Ein Pandas DataFrame ist eine zweidimensionale tabellenartige Datenstruktur, die Zeilen und Spalten enthält. Es kann verschiedene Datentypen wie Zahlen, Zeichenketten und Daten enthalten. Man kann es sich als eine Tabellenkalkulation oder eine SQL-Tabelle vorstellen. Es ist eine bequeme Möglichkeit, Daten mit Python zu speichern und zu manipulieren.

Wie installiert man Pandas in Python?

Bevor wir uns mit dem Sortieren eines Pandas DataFrame beschäftigen, müssen Sie sicherstellen, dass Pandas auf Ihrem System installiert ist. Dies können Sie tun, indem Sie den folgenden Befehl in Ihrem Terminal oder der Eingabeaufforderung ausführen:

pip install pandas

Dies installiert die neueste Version von Pandas auf Ihrem System.

Wie erstellt man einen Pandas DataFrame?

Es gibt viele Möglichkeiten, einen Pandas DataFrame zu erstellen. Eine der häufigsten Möglichkeiten besteht darin, ihn aus einem Wörterbuch von Listen zu erstellen. Hier ist ein Beispiel:

import pandas as pd
 
data = {'Name': ['John', 'Jane', 'Bob', 'Lisa'],
        'Age': [25, 30, 45, 23],
        'Salary': [50000, 60000, 80000, 40000]}
 
df = pd.DataFrame(data)
 
print(df)

Ausgabe:

   Name  Age  Salary
0  John   25   50000
1  Jane   30   60000
2   Bob   45   80000
3  Lisa   23   40000

In diesem Beispiel haben wir ein Wörterbuch von drei Listen erstellt, wobei jede Liste eine Spalte im DataFrame darstellt. Anschließend haben wir die Funktion pd.DataFrame() verwendet, um einen DataFrame aus dem Wörterbuch zu erstellen.

Was ist der Unterschied zwischen dem Sortieren in aufsteigender und absteigender Reihenfolge?

Bevor wir mit dem Sortieren eines Pandas DataFrame beginnen, ist es wichtig, den Unterschied zwischen dem Sortieren in aufsteigender und absteigender Reihenfolge zu verstehen. Das Sortieren in aufsteigender Reihenfolge bedeutet, dass die Werte von niedrig nach hoch sortiert werden. Das Sortieren in absteigender Reihenfolge bedeutet, dass die Werte von hoch nach niedrig sortiert werden.

Wie sortiere ich einen Pandas DataFrame nach Spalte?

Das Sortieren eines Pandas DataFrame nach Spalte ist eine häufige Operation. Sie können die Methode sort_values() verwenden, um einen DataFrame nach einer einzelnen Spalte zu sortieren. Hier ist ein Beispiel:

import pandas as pd
 
data = {'Name': ['John', 'Jane', 'Bob', 'Lisa'],
        'Age': [25, 30, 45, 23],
        'Salary': [50000, 60000, 80000, 40000]}
 
df = pd.DataFrame(data)
 
# nach der Spalte "Age" in aufsteigender Reihenfolge sortieren
df.sort_values('Age', ascending=True, inplace=True)
 
print(df)

Ausgabe:

   Name  Age  Salary
3  Lisa   23   40000
0  John   25   50000
1  Jane   30   60000
2   Bob   45   80000

In diesem Beispiel haben wir den DataFrame nach der Spalte "Age" in aufsteigender Reihenfolge mit der Methode sort_values() sortiert. Wir haben den Parameter ascending auf True gesetzt, um in aufsteigender Reihenfolge zu sortieren. Der Parameter inplace ist auf True eingestellt, um den ursprünglichen DataFrame zu ändern.

Kann ich einen Pandas DataFrame nach mehreren Spalten sortieren?

Ja, Sie können einen Pandas DataFrame nach mehreren Spalten sortieren. Sie müssen eine Liste von Spaltennamen an die Methode sort_values() übergeben. Hier ist ein Beispiel:

import pandas as pd
 
data = {'Name': ['John', 'Jane', 'Bob', 'Lisa'],
        'Age': [25, 30, 45, 23],
        'Salary': [50000, 60000, 80000, 40000]}
 
df = pd.DataFrame(data)
 
# nach der Spalte "Age" in aufsteigender Reihenfolge und dann nach der Spalte "Salary" in absteigender Reihenfolge sortieren
df.sort_values(['Age', 'Salary'], ascending=[True, False], inplace=True)
 
print(df)

Ausgabe:

   Name  Age  Salary
3  Lisa   23   40000
0  John   25   50000
1  Jane   30   60000
2   Bob   45   80000

In diesem Beispiel haben wir das DataFrame nach der Spalte "Age" in aufsteigender und dann nach der Spalte "Salary" in absteigender Reihenfolge sortiert. Wir haben eine Liste von Spaltennamen an die Methode sort_values() übergeben und eine Liste von booleschen Werten an den Parameter ascending, um die Sortierrichtung für jede Spalte anzugeben.

Wie sortiert man ein Pandas DataFrame nach dem Index?

Sie können auch ein Pandas DataFrame nach seinem Index mit der Methode sort_index() sortieren. Hier ist ein Beispiel:

import pandas as pd
 
data = {'Name': ['John', 'Jane', 'Bob', 'Lisa'],
        'Age': [25, 30, 45, 23],
        'Salary': [50000, 60000, 80000, 40000]}
 
df = pd.DataFrame(data)
 
# sortiere den Index in absteigender Reihenfolge
df.sort_index(ascending=False, inplace=True)
 
print(df)

Ausgabe:

   Name  Age  Salary
3  Lisa   23   40000
2   Bob   45   80000
1  Jane   30   60000
0  John   25   50000

In diesem Beispiel haben wir das DataFrame mit der Methode sort_index() nach dem Index in absteigender Reihenfolge sortiert. Der Parameter ascending ist auf False gesetzt, um in absteigender Reihenfolge zu sortieren.

Wie sortiert man ein Pandas DataFrame nach Datum?

Das Sortieren eines Pandas DataFrames nach Datum ist eine häufige Operation in der Zeitreihenanalyse. Sie können die Methode sort_values() mit dem Datentyp datetime verwenden. Hier ist ein Beispiel:

import pandas as pd
 
data = {'Date': ['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04'],
        'Sales': [100, 200, 150, 300]}
 
df = pd.DataFrame(data)
 
# Konvertiere Spalte "Date" in den Datentyp "datetime"
df['Date'] = pd.to_datetime(df['Date'])
 
# sortiere nach der Spalte "Date" in aufsteigender Reihenfolge
df.sort_values('Date', ascending=True, inplace=True)
 
print(df)

Ausgabe:

        Date  Sales
0 2022-01-01    100
1 2022-01-02    200
2 2022-01-03    150
3 2022-01-04    300

In diesem Beispiel haben wir ein DataFrame mit einer "Date" Spalte und einer "Sales" Spalte erstellt. Wir haben die Methode to_datetime() verwendet, um die "Date" Spalte in den Datentyp datetime zu konvertieren. Anschließend haben wir die Methode sort_values() verwendet, um das DataFrame nach der "Date" Spalte in aufsteigender Reihenfolge zu sortieren.

Pandas DataFrame Werte sortieren

Die Methode sort_values() ist die Hauptmethode zum Sortieren eines Pandas DataFrames. Sie kann ein DataFrame nach einer einzelnen Spalte oder mehreren Spalten sortieren. Sie unterstützt auch das Sortieren nach Index und nach Datum.

Fazit

Das Sortieren von Daten in einem Pandas DataFrame ist eine wesentliche Operation für die Datenanalyse und -visualisierung. In diesem Tutorial haben wir behandelt, wie man ein Pandas DataFrame nach Spalte, mehreren Spalten, Index und Datum sortiert. Wir haben auch den Unterschied zwischen dem Sortieren in aufsteigender und absteigender Reihenfolge besprochen. Durch das Beherrschen dieser Techniken werden Sie in der Lage sein, Daten wie ein Profi zu manipulieren.