Skip to content
PYGWALKER
Anleitungen
charts
So erstellen Sie ein Histogramm oder Heatmap in PyGWalker

So erstellen Sie ein Histogramm oder Heatmap in PyGWalker

Updated on

Erfahren Sie, wie Sie bin verwenden, um Histogramm oder Heatmap in PyGWalker zu erstellen. PyGWalker ist eine Open-Source-Python-Bibliothek für die Erstellung von Datenvisualisierungen mit einfachen Drag-and-Drop-Operationen.

Einführung in Histogramme und Heatmaps

Histogramme

Ein Histogramm ist ein Diagramm, das zeigt, wie numerische Daten verteilt sind. Werte werden in „Buckets“ (auch als Bins bekannt) gruppiert, und die Anzahl der Werte, die in jeden Bucket passen, wird dann gezählt.

Histogramme stellen die Buckets anstelle der tatsächlichen Werte dar. Jeder Balken symbolisiert einen Bucket, und die Höhe des Balkens zeigt die Häufigkeit (z.B. die Anzahl) der Werte an, die in das Intervall dieses Buckets fallen.

Heatmaps

Eine Heatmap ist ähnlich wie ein Histogramm, aber über die Zeit, wobei jedes Zeitintervall sein eigenes Histogramm darstellt. Anstatt die Balkenhöhe als Darstellung der Häufigkeit zu verwenden, werden Zellen verwendet, und die Zellen werden proportional zur Anzahl der Werte im Bucket eingefärbt.

Heatmaps sind ein fantastisches Werkzeug zur Datenvisualisierung, da sie komplexe Informationen effizient vermitteln und leicht verständlich machen.

So erstellen Sie Histogramm & Heatmap in PyGWalker

Erstellen eines Histogramms in PyGWalker

Sie können ein Histogramm in PyGWalker folgendermaßen erstellen:

  1. Importieren Sie Ihre Daten.

  2. Klicken Sie auf das Dropdown-Symbol des Feldes im Messsegment. Wählen Sie „Neue Berechnung“. Es wird einige Transformationen geben, die Sie durchführen können. Klicken Sie auf die Bin-Transformationsoption. Und es wird ein neues Feld bin (Ihr Feldname) im Dimensionssegment erstellt.

    image.png

  3. Verwenden Sie "bin (Ihr Feldname)" als x-Achse und "row count" als y-Achse, und Sie erhalten ein Histogramm.

image.png

Erstellen einer Heatmap in PyGWalker

Sie können eine Heatmap in PyGWalker folgendermaßen erstellen:

  1. Importieren Sie Ihre Daten.

  2. Wählen Sie den Diagrammtyp: Klicken Sie auf die Schaltfläche „mark type“ in der Werkzeugleiste und wählen Sie „Rechteck“.

  3. Variable konvertieren: Klicken Sie mit der linken Maustaste auf Ihre Variable, und es wird ein Menü angezeigt. Wählen Sie die Option „Neue Berechnung“. Es wird einige Transformationen geben, die Sie durchführen können. Klicken Sie auf die Bin-Transformationsoption. Und es wird ein neues Feld bin (Ihr Feldname) im Dimensionssegment erstellt.

    image.png

  4. Diagramm erstellen: Ziehen Sie Ihre Variablen auf die x-Achse, y-Achse und Farbschichten, um Ihre Heatmap zu erstellen.

image.png

Beste Praktiken für die Nutzung von Histogramm & Heatmap

Histogramm

Verwendung einer Nullbasislinie

Ein wichtiger Aspekt von Histogrammen ist, dass sie mit einer Nullbasislinie geplottet werden müssen. Da die Häufigkeit der Daten in jedem Bin durch die Höhe jedes Balkens impliziert wird, wird die Wahrnehmung der Verteilung der Daten verzerrt, wenn die Basislinie geändert oder eine Lücke in der Skala eingeführt wird.

Wählen Sie interpretable Bin-Grenzen

Generell sind Bin-Größen von 1, 2, 2,5, 4 oder 5 (die 5, 10 und 20 gleichmäßig teilen) oder deren Zehnerpotenzen geeignete Ausgangspunkte. Außerdem werden Bins mit den Größen 3, 7 oder 9 wahrscheinlich schwerer zu lesen sein, daher sollten Sie diese nur verwenden, wenn es unbedingt erforderlich ist.

Heatmap

Auswahl einer geeigneten Farbpalette

Farbe ist ein Kernelement der Heatmap, daher sollten Sie sicherstellen, dass Sie eine geeignete Farbpalette wählen, die zu den Daten passt. Häufig wird es eine sequentielle Farbabstufung zwischen Wert und Farbe geben, wobei hellere Farben kleineren Werten und dunklere Farben größeren Werten entsprechen oder umgekehrt.

Einschließen einer Legende

In der Regel benötigt eine Heatmap eine Legende, die erklärt, wie verschiedene Farben mit unterschiedlichen Zahlen korrelieren. Die Werte einer Heatmap können von den Betrachtern ohne einen Schlüssel nicht verstanden werden, da Farbe und Wert nicht intrinsisch miteinander verbunden sind. Eine Legende ist nicht notwendig, wenn nur die relativen Muster der dargestellten Daten wichtig sind und nicht die genaue Beziehung zwischen Wert und Farbe.

Fazit

Durch das Verständnis der Grundlagen von Heatmaps und Histogrammen und die Verwendung dieser Design-Tipps können Sie effektive und intuitive Heatmaps und Histogramme in PyGWalker erstellen. Viel Spaß bei Ihrer Datenvisualisierungsreise.