2023년 파이썬에서 가장 성장하는 상위 10개 데이터 시각화 라이브러리
Updated on
파이썬의 강력한 시각화 생태계는 사용자에게 여러 라이브러리를 제공합니다. 이는 유연성을 제공하지만, 각 라이브러리의 강점과 한계를 이해하는 것이 중요합니다. 2023년에는 상위 10개의 데이터 시각화 파이썬 라이브러리의 새로운 트렌드에 대해 자세히 알아보겠습니다.
순위는 2023년에 라이브러리의 GitHub 저장소에서 받은 별의 수를 기준으로 합니다. 더 많은 별을 받을수록 순위가 높아집니다.
1위 PyGWalker
kanaries/pygwalker가 2023년 이후로 받은 별 수: 7486
2023년에 가장 인기있는 데이터 시각화 파이썬 라이브러리입니다. 코드 한 줄로 데이터프레임을 Tableau/PowerBI와 같은 대화형 데이터 탐색 앱으로 변환할 수 있습니다. (opens in a new tab) 차트를 구축하기 위해 사용하는 간단한 드래그 앤 드롭/채팅 인터페이스를 제공합니다. 주피터 노트북에서 실행될 수 있으므로 코드와 시각화 앱 간에 전환할 필요가 없습니다. 또한 이를 사용하여 지도상에서 대화형 공간 시각화도 구축할 수 있습니다. (opens in a new tab) 또한 JavaScript와 R 버전도 있습니다.
- 장점: 코드 한 줄로 대화형 데이터 탐색 앱 생성, 드래그 앤 드롭/채팅 인터페이스, 지도상에서 대화형 시각화 구축 가능
- 단점: 스타일을 맞춤 설정하기 어려움
Github: https://github.com/Kanaries/pygwalker (opens in a new tab)
2위 Matplotlib
matplotlib/matplotlib이 2023년 이후로 받은 별 수: 1821
Matplotlib은 2003년에 출시된 파이썬의 전통적인 데이터 시각화 라이브러리입니다. seaborn, pygal 등 다른 라이브러리의 기반으로 사용됩니다. 매우 유연하고 맞춤 설정이 가능하지만, 매우 번거롭고 간단한 시각화에도 다양한 코드를 필요로 합니다.
- 장점: 다른 라이브러리의 기반, 매우 유연하게 맞춤 설정 가능
- 단점: 높은 학습 곡선, 간단한 시각화에도 다양한 코드 필요, 미려함이 오래된 것처럼 보일 수 있음
Github: https://github.com/matplotlib/matplotlib (opens in a new tab)
3위 Plotly
plotly/plotly.py가 2023년 이후로 받은 별 수: 1705
Plotly는 pygwalker와 마찬가지로 멀티 플랫폼 데이터 시각화 라이브러리입니다. Plotly의 회사는 또한 Plotly 차트 코드를 대시보드와 같은 웹 앱으로 변환해주는 Dash를 개발했습니다.
- 장점: 상호작용 가능한 웹 시각화 제공, 대시로 출판 가능
- 단점: 온라인 모드는 인터넷 연결 필요, 무료 버전에는 플롯 수와 공개 가시성에 제한이 있음
Github: https://github.com/plotly/plotly.py (opens in a new tab)
4위 Bokeh
bokeh/bokeh가 2023년 이후로 받은 별 수: 1126
Bokeh는 데이터 과학 분야에서 유명한 회사인 Anaconda에서 개발되었습니다. 출시 날짜: 2013년
- 장점: 대화형 웹 시각화에 최적화, 대용량 데이터 처리 효율적
- 단점: Matplotlib 사용자에게는 문법이 익숙하지 않을 수 있음, 정적인 플롯보다는 웹 애플리케이션에 보다 적합
Github: https://github.com/bokeh/bokeh (opens in a new tab)
5위 Seaborn
mwaskom/seaborn이 2023년 이후로 받은 별 수: 1111
Seaborn은 matplotlib 기반으로 구축되어 있으므로 matplotlib의 유연성을 이용할 수 있지만, matplotlib의 번잡함을 상속합니다.
- 장점: Matplotlib 기반으로 구축되어 있으며 미려한 외관, 통계적인 플롯에 효율적
- 단점: Matplotlib보다는 맞춤 설정이 제한적, 고급 또는 비통계적인 플롯에는 적합하지 않을 수 있음
Github: https://github.com/mwaskom/seaborn (opens in a new tab)
6위 pyecharts
pyecharts/pyecharts가 2023년 이후로 받은 별 수: 1015
pyecharts는 유명한 자바스크립트 데이터 시각화 라이브러리인 apache/echarts의 파이썬 바인딩입니다.
- 장점: 다양한 차트 유형 지원, 3D 및 WebGL까지
- 단점: 복잡한 옵션 설정
Github: https://github.com/pyecharts/pyecharts (opens in a new tab)
7위 Altair (opens in a new tab)
altair-viz/altair가 2023년 이후로 받은 별 수: 604
Altair는 vega-lite를 기반으로 구축되었으며, 자바스크립트와 학계의 데이터 시각화 분야에서 매우 유명한 라이브러리입니다. vega-lite의 이점인 선언적 접근, 웹에 적합한 출력 등을 거의 모두 이용할 수 있습니다. 가장 중요한 장점은 vega-lite의 논문에 의하면 상호작용적 그래픽의 문법으로서의 선언적 명세입니다.
- 장점: 선언적 접근으로 코드를 단순화, 웹에 적합한 출력 생성. 더 직관적인 그래픽 생성을 위한 연산자 제공.
- 단점: vega-lite로 인해 맞춤 설정 및 차트 유형에 제한이 있을 수 있음. 복잡한 차트를 생성하려면 사용자가 복잡한 신호 흐름을 디자인해야 함.
Github: Altair (opens in a new tab)
8위 plotnine
has2k1/plotnine가 2023년 이후로 받은 별 수: 323
plotnine은 시각화 학계에서 매우 유명한 그래픽 문법(grammer of graphics)을 기반으로 디자인되었습니다. 이론은 R의 ggplot2의 기반이기도 합니다.
Github: https://github.com/has2k1/plotnine (opens in a new tab)
9위 Holoviews
holoviz/holoviews가 2023년 이후로 받은 별 수: 169
Holoviews는 bokeh를 기반으로 구축되어 있으므로 bokeh의 효율성을 이용할 수 있지만, bokeh의 낯선 문법을 상속합니다.
Github: https://github.com/holoviz/holoviews (opens in a new tab)
10위 vispy
vispy/vispy가 2023년 이후로 받은 별 수: 154
vispy는 OpenGL에 관심이 있는 사용자를 대상으로 합니다. 사용자가 더욱 유연하고 맞춤 설정 가능한 그래픽을 구축할 수 있는 일부 저수준 API를 제공합니다.
Github: https://github.com/vispy/vispy (opens in a new tab)
결론
2023년에는 파이썬의 데이터 시각화 분야가 풍부하고 다양하며, PyGWalker (opens in a new tab)가 직관적이고 상호작용적인 탐색 도구에 대한 수요를 대표합니다. Matplotlib과 같은 전통적인 라이브러리는 여전히 중요성을 유지하고 있지만, Plotly와 Bokeh와 같은 웹에 적합하고 상호작용적인 시각화로의 주목할 만한 변화가 있습니다. 이 상위 10개 목록의 다양성은 이상적인 라이브러리가 프로젝트 특성과 개인적인 선호도에 따라 달라질 수 있음을 나타냅니다.
주요 요점:
- PyGWalker의 상승은 사용자 친화적이고 상호작용적인 데이터 도구에 대한 수요를 나타냅니다.
- 웹에 적합한 시각화가 성장하는 추세입니다.
- Matplotlib과 같은 전통적인 라이브러리는 유연성 때문에 여전히 중요합니다.
- 올바른 선택은 프로젝트 요구 사항과 원하는 맞춤 설정에 따라 달라집니다.