Skip to content
PYGWALKER
PyGWalker

PyGWalker

PyGWalker - 一种用于可视化探索数据的 Python 库

PyGWalker (opens in a new tab) 可以简化您在 Jupyter Notebook 中进行数据分析和数据可视化的工作流程,通过将 pandas 数据帧转换为交互式用户界面,用于进行可视化探索。

PyGWalker(发音类似于"Pig Walker",只是为了好玩)是 "Python binding of Graphic Walker" 的缩写。它将 Jupyter Notebook 与 Graphic Walker (opens in a new tab) 集成在一起,这是 Tableau 的开源替代品。它允许数据科学家利用简单的拖放操作甚至自然语言查询来可视化/清理/注释数据。

请访问 Google Colab (opens in a new tab)Kaggle Code (opens in a new tab)Graphic Walker 在线演示 (opens in a new tab) 进行测试!

如果您更喜欢使用 R 语言,请查看 GWalKR (opens in a new tab),这是 Graphic Walker 的 R 包装器。

入门指南

在 Kaggle 运行 | 在 Colab 运行

使用 Kaggle 或 Colab 运行 PyGWalker。

设置 PyGWalker

在使用 PyGWalker 之前,请确保通过命令行使用 pip 或 conda 安装所需的软件包。

pip

pip install pygwalker

Conda-forge

conda install -c conda-forge pygwalker

查看 conda-forge feedstock (opens in a new tab) 获取更多帮助。

在 Jupyter Notebook 中使用 PyGWalker

将 PyGWalker 和 pandas 导入到您的 Jupyter Notebook 中,开始使用。

您可以在不影响现有工作流程的情况下使用 PyGWalker。例如,您可以这样加载数据帧并调用 PyGWalker:

import pandas as pd
import pygwalker as pyg
 
df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)

现在您可以使用交互式用户界面进行数据分析和可视化,进行简单的拖放操作。

一些您可以使用 PyGwalker 做的很酷的事情:

  • 您可以将标记类型更改为其他类型以创建不同的图表,例如折线图。
  • 您可以通过将多个度量添加到行/列中来创建合并视图,以比较不同的度量。
  • 您可以将维度放入行或列中,以通过维度值划分为多个子视图的分面视图。
  • PyGWalker 包含一个功能强大的数据表,提供快速查���数据及其分布、数据概要情况的功能。您还可以向表格中添加筛选器或更改数据类型。
  • 您可以将数据探索结果保存到本地文件中。

...

API 参考

pygwalker.walk

参数:

  • dataset: dataframe 或连接器
  • gid: 函数容器的 ID
  • env: 使用 pygwalker 的环境
  • field_specs: 字段规范
  • hide_data_source_config: 是否隐藏数据源导入和导出按钮
  • theme_key: 图表主题类型
  • dark: 主题设置
  • spec: 图表配置数据
  • use_preview: 是否使用预览功能
  • kernel_computation: 是否使用核心计算数据
  • 其他关键字参数

...

已测试的环境

  • Jupyter Notebook
  • Google Colab
  • Kaggle Code
  • Jupyter Lab
  • Jupyter Lite
  • Databricks Notebook
  • Visual Studio Code 的 Jupyter 扩展
  • 大多数与 IPython 内核兼容的 Web 应用程序
  • Streamlit,在 pyg.walk(df, env='Streamlit') 中可用

...

配置和隐私政策

您可以使用 pygwalker config 命令设置隐私配置。

...

许可证

Apache License 2.0 (opens in a new tab)

...

如有任何问题或需要支持,请加入我们的 Discord (opens in a new tab) 频道或在 GitHub 上提出问题。