Skip to content
PYGWALKER
Anleitungen
Wie man PygWalker mit Gradio verwendet

Demo bei Huggingface (opens in a new tab)

Wie man PygWalker mit Gradio verwendet

PygWalker ist eine Python-Bibliothek, mit der Sie Ihre Daten in eine interaktive Visualisierungs-App umwandeln können (ähnlich wie Tableau oder PowerBI). Zum Beispiel verwenden Datenwissenschaftler in Jupyter Notebook häufig PygWalker, um Daten in ein interaktives Modul einzubetten, in dem sie Visualisierungen mit Drag-and-Drop oder natürlicher Sprache erkunden können, ohne Code zu schreiben oder zu anderen Tools zu wechseln.

Aber wie teilen Sie die interaktive Visualisierung mit anderen? Wie ermöglichen Sie es Ihren Benutzern, die Daten selbst zu erkunden? In diesem Tutorial zeigen wir Ihnen, wie Sie PygWalker mit Gradio verwenden können, um eine Datenexplorations- und Sharing-App zu erstellen.

Was ist Gradio?

Gradio (opens in a new tab) ist eine Python-Bibliothek, mit der Sie schnell anpassbare UI-Komponenten rund um Ihre Machine-Learning-Modelle, Deep-Learning-Modelle und andere Funktionen erstellen können. Es ermöglicht Ihnen, mit nur wenigen Codezeilen eine einfache, freigabefähige Benutzeroberfläche für Ihr Modell zu erstellen. Gradio ist ein großartiges Tool, um schnell eine Web-App zu erstellen und Ihr Modell mit anderen zu teilen.

Wie man PygWalker mit Gradio verwendet

Bevor wir PygWalker mit Gradio ausführen, stellen Sie sicher, dass Ihr Computer eine Python-Umgebung eingerichtet hat (Version 3.6 oder höher). Wenn das erledigt ist, befolgen Sie diese einfachen Schritte:

Großartig! Sie haben bereits bedeutende Fortschritte gemacht. Ich werde Ihnen helfen, den Tutorial-Artikel mit den bereitgestellten Informationen zu vervollständigen.

Schritt-für-Schritt-Anleitung zur Integration von PygWalker mit Gradio

1. Installation

Bevor wir eintauchen, müssen Sie sowohl die Bibliotheken "pygwalker" als auch "gradio" installiert haben. Wenn Sie das noch nicht getan haben, ist das mit pip ein Kinderspiel:

pip install pygwalker gradio

2. Importieren der erforderlichen Bibliotheken

Importieren Sie alle erforderlichen Module, die Sie benötigen, wie im bereitgestellten Code gezeigt:

import gradio as gr
import pygwalker as pyg
from datasets import load_dataset

3. Laden Sie Ihren Datensatz

Für dieses Tutorial verwenden wir den NYC-Airbnb-Datensatz von Gradio, aber Sie können ihn gerne gegen einen beliebigen Datensatz Ihrer Wahl austauschen:

dataset = load_dataset("gradio/NYC-Airbnb-Open-Data", split="train")
df = dataset.to_pandas()

4. Erstellen Sie die Gradio-Schnittstelle mit PygWalker

Verwenden Sie die Blocks-Funktion von Gradio, um die Benutzeroberflächenkomponenten zu kapseln, wie im bereitgestellten Code gezeigt:

with gr.Blocks() as demo:
    gr.Label("Daten mit PygWalker und Gradio visuell erkunden")
    gr.Markdown("Dies ist eine Daten-App, die mit der Bibilothek PygWalker und der Gradio-Bibliothek erstellt wurde. Sie können Drag-and-Drop-Operationen verwenden, um die Daten zu erkunden. Starten Sie Ihre Analyse jetzt!")
    gr.HTML(pyg.walk(dataset=df, spec="./viz-config.json", debug=False, return_html=True))

Hier ist eine Aufschlüsselung:

  • gr.Label(): Bietet eine Beschriftung oder einen Titel für Ihre Gradio-Benutzeroberfläche.
  • gr.Markdown(): Ermöglicht das Hinzufügen von text-formatiertem Markdown zur detaillierten Beschreibung oder Information.
  • gr.HTML(): Hier kommt pygwalker ins Spiel. Die Funktion pyg.walk() verwandelt den Datensatz in eine interaktive Visualisierung, die dann in der Gradio-Benutzeroberfläche durch dieses HTML-Element dargestellt wird.

5. Starten Sie die App

Schließlich können Sie mit einem einfachen Befehl die Web-App starten:

demo.launch()

Durch Ausführen des Skripts sollte Ihre interaktive Datenvisualisierung in einem Browser verfügbar sein. Sie können den Datensatz mithilfe der Drag-and-Drop-Funktionalität oder natürlicher Sprache erkunden (erfordert einen Kanaries-API-Key zur Aktivierung).

Demo bei Huggingface (opens in a new tab)

Eine nativere Möglichkeit, PygWalker in Gradio zu integrieren

PygWalker enthält einige erweiterte Funktionen, wie z.B. Kernel-Berechnung, die einen durch DuckDB unterstützten Engine ermöglichen, die Datenexploration zu beschleunigen. Seit PygWalker version>=0.3.10 gibt es native Unterstützung für Gradio.

from pygwalker.api.gradio import PYGWALKER_ROUTE, get_html_on_gradio
 
with gr.Blocks() as demo:
    # Datensatz laden
    dataset = load_dataset("gradio/NYC-Airbnb-Open-Data", split="train")
    df = dataset.to_pandas()
    pyg_app = get_html_on_gradio(df, spec="./viz-config.json")
    gr.HTML(pyg_app)
 
app = demo.launch(app_kwargs={
    "routes": [PYGWALKER_ROUTE]
})

Fazit

Durch die Kombination der Leistung von PygWalker und Gradio können Sie schnell interaktive Datenvisualisierungen erstellen und teilen. Es vereinfacht nicht nur die Datenexploration, sondern ermöglicht auch den demokratischen Zugang zu Dateninsights, sodass selbst Nicht-Technik-Benutzer mit Ihren Erkenntnissen interagieren können. Probieren Sie es aus und teilen Sie Ihre Erkenntnisse mit der Welt!

Referenzen

[1] Gradio (opens in a new tab) [2] PygWalker-Dokumentation (opens in a new tab) [3] pygwalker + gradio Playground (opens in a new tab) [4] PygWalker Github (opens in a new tab)