PyGWalker 文档
PyGWalker - 一种用于可视化探索数据的 Python 库
PyGWalker (opens in a new tab) 可以简化您在 Jupyter Notebook 中进行数据分析和数据可视化的工作流程,通过将 pandas 数据帧转换为交互式用户界面,用于进行可视化探索。
PyGWalker(发音类似于"Pig Walker",只是为了好玩)是 "Python binding of Graphic Walker" 的缩写。它将 Jupyter Notebook 与 Graphic Walker (opens in a new tab) 集成在一起,这是 Tableau 的开源替代品。它允许数据科学家利用简单的拖放操作甚至自然语言查询来可视化/清理/注释数据。
请访问 Google Colab (opens in a new tab),Kaggle Code (opens in a new tab) 或 Graphic Walker 在线演示 (opens in a new tab) 进行测试!
如果您更喜欢使用 R 语言,请查看 GWalKR (opens in a new tab),这是 Graphic Walker 的 R 包装器。
入门指南
在 Kaggle 运行 | 在 Colab 运行
使用 Kaggle 或 Colab 运行 PyGWalker。
设置 PyGWalker
在使用 PyGWalker 之前,请确保通过命令行使用 pip 或 conda 安装所需的软件包。
pip
pip install pygwalker
Conda-forge
conda install -c conda-forge pygwalker
查看 conda-forge feedstock (opens in a new tab) 获取更多帮助。
在 Jupyter Notebook 中使用 PyGWalker
将 PyGWalker 和 pandas 导入到您的 Jupyter Notebook 中,开始使用。
您可以在不影响现有工作流程的情况下使用 PyGWalker。例如,您可以这样加载数据帧并调用 PyGWalker:
import pandas as pd
import pygwalker as pyg
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)
现在您可以使用交互式用户界面进行数据分析和可视化,进行简单的拖放操作。
一些您可以使用 PyGwalker 做的很酷的事情:
- 您可以将标记类型更改为其他类型以创建不同的图表,例如折线图。
- 您可以通过将多个度量添加到行/列中来创建合并视图,以比较不同的度量。
- 您可以将维度放入行或列中,以通过维度值划分为多个子视图的分面视图。
- PyGWalker 包含一个功能强大的数据表,提供快速查���数据及其分布、数据概要情况的功能。您还可以向表格中添加筛选器或更改数据类型。
- 您可以将数据探索结果保存到本地文件中。
...
API 参考
pygwalker.walk
参数:
- dataset: dataframe 或连接器
- gid: 函数容器的 ID
- env: 使用 pygwalker 的环境
- field_specs: 字段规范
- hide_data_source_config: 是否隐藏数据源导入和导出按钮
- theme_key: 图表主题类型
- dark: 主题设置
- spec: 图表配置数据
- use_preview: 是否使用预览功能
- kernel_computation: 是否使用核心计算数据
- 其他关键字参数
...
已测试的环境
- Jupyter Notebook
- Google Colab
- Kaggle Code
- Jupyter Lab
- Jupyter Lite
- Databricks Notebook
- Visual Studio Code 的 Jupyter 扩展
- 大多数与 IPython 内核兼容的 Web 应用程序
- Streamlit,在
pyg.walk(df, env='Streamlit')
中可用
...
配置和隐私政策
您可以使用 pygwalker config
命令设置隐私配置。
...
许可证
Apache License 2.0 (opens in a new tab)
...
如有任何问题或需要支持,请加入我们的 Discord (opens in a new tab) 频道或在 GitHub 上提出问题。