Guide de démarrage rapide de PyGWalker

Démarrage rapide dans Jupyter Notebook

Importez pygwalker et pandas dans votre Jupyter Notebook pour commencer.

import pandas as pd
import pygwalker as pyg

Chargez vos données sous forme de dataframe, puis transmettez-le à pygwalker.

df = pd.read_csv('./<your_csv_file_path>.csv')
walker = pyg.walk(df)

pygwalker accepte non seulement des dataframes pandas, mais aussi des dataframes modin et même une connexion de données, comme Snowflake.

Amélioration des performances de pygwalker

Parfois, votre dataframe peut être assez volumineux et ralentir les performances de pygwalker. Nous vous proposons maintenant un moyen simple d'améliorer ses performances avec un paramètre supplémentaire kernel_computation.

pyg.walk(df, kernel_computation=True)

En définissant kernel_computation=True, vous activez le nouveau moteur de calcul de pygwalker basé sur DuckDB.

Utilisation de pygwalker avec Snowflake

Parfois, vos données peuvent être extrêmement volumineuses et vous ne souhaitez pas les charger dans la mémoire locale. PyGWalker permet de pousser toutes ses calculs dans des services OLAP distants, tels que Snowflake.

pip install --upgrade --pre pygwalker
pip install --upgrade --pre "pygwalker[snowflake]"

Voici un exemple de code d'utilisation de pygwalker avec Snowflake.

import pygwalker as pyg
from pygwalker.data_parsers.database_parser import Connector
conn = Connector(
    "snowflake://user_name:password@account_identifier/database/schema",
    """
        SELECT
            *
        FROM
            SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.ORDERS
    """
)
walker = pyg.walk(conn)

Démarrage rapide dans Streamlit

PyGWalker est puissant pour l'exploration de données en local, et il serait encore meilleur s'il pouvait être utilisé dans une application web. Il existe plusieurs façons de l'implémenter :

Utiliser Streamlit (opens in a new tab) pour construire une application web.

Streamlit est un excellent outil pour construire des applications de données avec Python, en particulier pour les scientifiques des données qui ne sont pas familiers avec le développement web. Voici un exemple rapide d'utilisation de PyGWalker avec Streamlit.

from pygwalker.api.streamlit import StreamlitRenderer
import pandas as pd
import streamlit as st
 
# Adjust the width of the Streamlit page
st.set_page_config(
    page_title="Use Pygwalker In Streamlit",
    layout="wide"
)
 
# Add Title
st.title("Use Pygwalker In Streamlit")
 
# You should cache your pygwalker renderer, if you don't want your memory to explode
@st.cache_resource
def get_pyg_renderer() -> "StreamlitRenderer":
    df = pd.read_csv("./bike_sharing_dc.csv")
    # If you want to use feature of saving chart config, set `spec_io_mode="rw"`
    return StreamlitRenderer(df, spec="./gw_config.json", spec_io_mode="rw")
 
 
renderer = get_pyg_renderer()
 
renderer.explorer()

(opens in a new tab)

Consultez cet article de la communauté pour en savoir plus sur l'utilisation de PyGWalker avec Streamlit : pygwalker streamlit api

Installation Dataset