Skip to content

PyGWalker 퀵스타트

Jupyter 노트북에서 빠른 시작

먼저 pygwalker와 pandas를 Jupyter 노트북에 import하세요.

import pandas as pd
import pygwalker as pyg

데이터를 dataframe으로 로드한 다음, pygwalker에 전달하세요.

df = pd.read_csv('./<your_csv_file_path>.csv')
walker = pyg.walk(df)

pygwalker는 판다스 dataframe뿐만 아니라 modin dataframe이나 snowflake와 같은 데이터 연결도 사용할 수 있습니다.

pygwalker의 성능 향상

때로는 데이터프레임이 매우 크기 때문에 pygwalker의 성능이 느려질 수 있습니다. 이제 한 가지 추가 매개변수 kernel_computation을 사용하여 성능을 향상시킬 수 있는 간단한 방법을 제공합니다.

pyg.walk(df, kernel_computation=True)

kernel_computation=True로 설정하면 DuckDB에서 제공하는 pygwalker의 새로운 계산 엔진을 활성화할 수 있습니다.

Snowflake로 pygwalker 사용하기

데이터가 극도로 큰 경우 로컬 메모리에 로드하는 것을 원하지 않을 수 있습니다. PyGWalker는 Snowflake와 같은 원격 OLAP 서비스로 모든 계산을 수행할 수 있습니다.

pip install --upgrade --pre pygwalker
pip install --upgrade --pre "pygwalker[snowflake]" 
 

다음은 Snowflake와 함께 pygwalker를 사용하는 코드 예시입니다.

import pygwalker as pyg
from pygwalker.data_parsers.database_parser import Connector
conn = Connector(
    "snowflake://user_name:password@account_identifier/database/schema",
    """
        SELECT
            *
        FROM
            SNOWFLAKE_SAMPLE_DATA.TPCH_SF1.ORDERS
    """
)
walker = pyg.walk(conn)

Streamlit에서 빠른 시작

PyGWalker는 로컬 환경에서 데이터 탐색에 사용하기 강력하며, 웹 앱에서 실행되면 더욱 훌륭할 수 있습니다. 이를 구현하는 방법은 여러 가지가 있습니다:

Streamlit은 파이썬으로 데이터 앱을 구축하는 데 좋은 도구로, 특히 웹 개발에 익숙하지 않은 데이터 과학자들에게 유용합니다. 다음은 Streamlit과 함께 PyGWalker를 사용하는 빠른 예시입니다.

from pygwalker.api.streamlit import StreamlitRenderer
import pandas as pd
import streamlit as st
 
# Adjust the width of the Streamlit page
st.set_page_config(
    page_title="Use Pygwalker In Streamlit",
    layout="wide"
)
 
# Add Title
st.title("Use Pygwalker In Streamlit")
 
# You should cache your pygwalker renderer, if you don't want your memory to explode
@st.cache_resource
def get_pyg_renderer() -> "StreamlitRenderer":
    df = pd.read_csv("./bike_sharing_dc.csv")
    # If you want to use feature of saving chart config, set `spec_io_mode="rw"`
    return StreamlitRenderer(df, spec="./gw_config.json", spec_io_mode="rw")
 
 
renderer = get_pyg_renderer()
 
renderer.explorer()

PyGWalker를 Streamlit과 함께 사용하는 방법에 대해 더 알아보려면 커뮤니티의 이 문서를 확인하세요: pygwalker streamlit api