Guía de la API de PyGWalker para Jupyter
Esta guía explica cómo usar PyGWalker en notebooks de Jupyter, cubriendo las funciones principales y sus parámetros.
Funciones Principales
1. walk()
Crea una instancia interactiva de GraphicWalker.
import pygwalker as pyg
walker = pyg.walk(dataset)
2. render()
Renderiza una configuración específica de gráficos.
import pygwalker as pyg
walker = pyg.render(dataset, spec="./gw_config.json")
3. table()
Muestra el conjunto de datos como una tabla interactiva.
import pygwalker as pyg
walker = pyg.table(dataset)
Parámetros Comunes
Parámetro | Tipo | Predeterminado | Descripción |
---|---|---|---|
dataset | Union[DataFrame, Connector] | - | Datos de entrada. Ver Dataset Of Walker para detalles. |
gid | Union[int, str] | None | ID del div contenedor de GraphicWalker. Formato: 'gwalker-{gid}'. Autogenerado si es None. |
field_specs | Optional[Dict[str, FieldSpec]] | None | Especificaciones de campo. Inferido automáticamente si no se especifica. |
theme_key | Literal['vega', 'g2'] | 'g2' | Tipo de tema para GraphicWalker. |
appearance | Literal['media', 'light', 'dark'] | 'media' | Configuración de tema. 'media' detecta automáticamente el tema del sistema operativo. |
spec | str | "" | Datos de configuración del gráfico (ID, JSON o URL). |
kernel_computation | bool | None | Habilita la computación de alto rendimiento del núcleo para conjuntos de datos más grandes. |
kanaries_api_key | str | "" | Clave API de Kanaries. |
default_tab | Literal["data", "vis"] | "vis" | Pestaña predeterminada para mostrar (solo para walk() ). |
cloud_computation | bool | False | Habilita la computación en la nube (sube datos a la nube de Kanaries). |
Mejores Prácticas y Consejos
-
Conjuntos de Datos Grandes: Para archivos CSV > 1GB, usa
kernel_computation=True
para habilitar el procesamiento de alto rendimiento. -
Tematización:
- Configura el tema con
appearance='light'
oappearance='dark'
. - Si el tema de PyGWalker no coincide con el de Jupyter, configura explícitamente la apariencia.
- Configura el tema con
-
Guardando Gráficos:
- Guarda en un archivo o exporta como código.
- Guía detallada sobre cómo guardar y compartir (opens in a new tab)
-
Rendimiento: Usa
kernel_computation=True
para conjuntos de datos más grandes y aprovecha el motor interno basado en DuckDB. -
Computación en la Nube: Configura
cloud_computation=True
para usar la nube de Kanaries para el procesamiento de datos (requiere clave API).
Ejemplos
- Demo en Kaggle: EDA de Airbnb con PyGWalker (opens in a new tab)
- GitHub: Demo del Notebook de Jupyter (opens in a new tab)
Para un uso más avanzado y ejemplos de integración, consulta la documentación de PyGWalker (opens in a new tab).
Preguntas y Respuestas Relacionadas
Mi pygwalker no puede manejar CSV > 1GB, ¿qué debo hacer?
PyGWalker tiene un motor interno basado en DuckDB que te permite manejar conjuntos de datos mucho más grandes con alto rendimiento. Puedes habilitarlo con el parámetro kernel_computation=True
.
¿Cómo configurar el tema de pygwalker (claro u oscuro)?
Puedes configurar el tema con el parámetro appearance
. Valores disponibles: dark
| light
| media
. Por defecto es media
, que se ajusta automáticamente según el sistema.
¿Por qué mi pygwalker es oscuro pero mi Jupyter es claro?
pygwalker sigue el tema del sistema por defecto. Pero algunos Jupyter no pueden seguir el tema del sistema.
Puedes configurar el tema con appearance='light'
para que pygwalker use el tema claro.
¿Cómo guardar los gráficos de pygwalker en Jupyter?
Hay dos maneras de guardar los gráficos y el estado de pygwalker. Guárdalo en un archivo o exporta como código. Más detalles (opens in a new tab)