PyGWalker 数据集指南
本指南介绍了如何将 PyGWalker 与各种数据源一起使用,包括不同的 DataFrame 库和数据库。
使用 DataFrame
PyGWalker 支持多种 DataFrame 库。以下是使用方法:
Pandas
import pygwalker as pyg
import pandas as pd
df = pd.read_csv("data.csv")
walker = pyg.walk(df)
Polars
import pygwalker as pyg
import polars as pl
df = pl.read_csv("data.csv")
walker = pyg.walk(df)
Modin
import pygwalker as pyg
import modin.pandas as mpd
df = mpd.read_csv("data.csv")
walker = pyg.walk(df)
使用数据库
PyGWalker 可以通过 SQLAlchemy 连接到各种数据库。以下是设置方法:
使用连接器
要连接到数据库,请使用 Connector
类:
from pygwalker.data_parsers.database_parser import Connector
conn = Connector(
"snowflake://username:password@host/database/schema",
"""
SELECT
*
FROM
XXX
"""
)
连接器参数
参数 | 类型 | 默认值 | 描述 |
---|---|---|---|
url | str | - | 数据库 URL(参考 SQLAlchemy 文档) |
view_sql | str | - | 选择数据的 SQL 查询 |
engine_params | Optional[Dict[str, Any]] | 无 | 其他引擎参数(参考 SQLAlchemy 文档) |
特定数据库示例
Snowflake
from pygwalker.data_parsers.database_parser import Connector
import pygwalker as pyg
conn = Connector(
"snowflake://username:password@host/database/schema",
"SELECT * FROM table_name"
)
walker = pyg.walk(conn)
PostgreSQL
from pygwalker.data_parsers.database_parser import Connector
import pygwalker as pyg
conn = Connector(
"postgresql+psycopg2://username:password@host:port/database",
"SELECT * FROM table_name"
)
walker = pyg.walk(conn)
其他数据库
PyGWalker 支持所有与 SQLAlchemy 兼容的数据库。使用特定数据库的方法:
- 参考 SQLAlchemy 文档获取正确的 URL 格式。
- 安装相应的数据库驱动。
- 使用具有正确 URL 和 SQL 查询的
Connector
类。
有关支持的数据库及其配置的更多信息,请查阅 SQLAlchemy 文档。