Skip to content
2023년 파이썬에서 가장 성장하는 상위 10개 데이터 시각화 라이브러리

2023년 파이썬에서 가장 성장하는 상위 10개 데이터 시각화 라이브러리

파이썬의 강력한 시각화 생태계는 사용자에게 여러 라이브러리를 제공합니다. 이는 유연성을 제공하지만, 각 라이브러리의 강점과 한계를 이해하는 것이 중요합니다. 2023년에는 상위 10개의 데이터 시각화 파이썬 라이브러리의 새로운 트렌드에 대해 자세히 알아보겠습니다.

순위는 2023년에 라이브러리의 GitHub 저장소에서 받은 별의 수를 기준으로 합니다. 더 많은 별을 받을수록 순위가 높아집니다.

1위 PyGWalker

kanaries/pygwalker가 2023년 이후로 받은 별 수: 7486

2023년에 가장 인기있는 데이터 시각화 파이썬 라이브러리입니다. 코드 한 줄로 데이터프레임을 Tableau/PowerBI와 같은 대화형 데이터 탐색 앱으로 변환할 수 있습니다. (opens in a new tab) 차트를 구축하기 위해 사용하는 간단한 드래그 앤 드롭/채팅 인터페이스를 제공합니다. 주피터 노트북에서 실행될 수 있으므로 코드와 시각화 앱 간에 전환할 필요가 없습니다. 또한 이를 사용하여 지도상에서 대화형 공간 시각화도 구축할 수 있습니다. (opens in a new tab) 또한 JavaScript와 R 버전도 있습니다.

  • 장점: 코드 한 줄로 대화형 데이터 탐색 앱 생성, 드래그 앤 드롭/채팅 인터페이스, 지도상에서 대화형 시각화 구축 가능
  • 단점: 스타일을 맞춤 설정하기 어려움

Github: https://github.com/Kanaries/pygwalker (opens in a new tab)

2위 Matplotlib

matplotlib/matplotlib이 2023년 이후로 받은 별 수: 1821

Matplotlib은 2003년에 출시된 파이썬의 전통적인 데이터 시각화 라이브러리입니다. seaborn, pygal 등 다른 라이브러리의 기반으로 사용됩니다. 매우 유연하고 맞춤 설정이 가능하지만, 매우 번거롭고 간단한 시각화에도 다양한 코드를 필요로 합니다.

  • 장점: 다른 라이브러리의 기반, 매우 유연하게 맞춤 설정 가능
  • 단점: 높은 학습 곡선, 간단한 시각화에도 다양한 코드 필요, 미려함이 오래된 것처럼 보일 수 있음

Github: https://github.com/matplotlib/matplotlib (opens in a new tab)

3위 Plotly

plotly/plotly.py가 2023년 이후로 받은 별 수: 1705

Plotly는 pygwalker와 마찬가지로 멀티 플랫폼 데이터 시각화 라이브러리입니다. Plotly의 회사는 또한 Plotly 차트 코드를 대시보드와 같은 웹 앱으로 변환해주는 Dash를 개발했습니다.

  • 장점: 상호작용 가능한 웹 시각화 제공, 대시로 출판 가능
  • 단점: 온라인 모드는 인터넷 연결 필요, 무료 버전에는 플롯 수와 공개 가시성에 제한이 있음

Github: https://github.com/plotly/plotly.py (opens in a new tab)

4위 Bokeh

bokeh/bokeh가 2023년 이후로 받은 별 수: 1126

Bokeh는 데이터 과학 분야에서 유명한 회사인 Anaconda에서 개발되었습니다. 출시 날짜: 2013년

  • 장점: 대화형 웹 시각화에 최적화, 대용량 데이터 처리 효율적
  • 단점: Matplotlib 사용자에게는 문법이 익숙하지 않을 수 있음, 정적인 플롯보다는 웹 애플리케이션에 보다 적합

Github: https://github.com/bokeh/bokeh (opens in a new tab)

5위 Seaborn

mwaskom/seaborn이 2023년 이후로 받은 별 수: 1111

Seaborn은 matplotlib 기반으로 구축되어 있으므로 matplotlib의 유연성을 이용할 수 있지만, matplotlib의 번잡함을 상속합니다.

  • 장점: Matplotlib 기반으로 구축되어 있으며 미려한 외관, 통계적인 플롯에 효율적
  • 단점: Matplotlib보다는 맞춤 설정이 제한적, 고급 또는 비통계적인 플롯에는 적합하지 않을 수 있음

Github: https://github.com/mwaskom/seaborn (opens in a new tab)

6위 pyecharts

pyecharts/pyecharts가 2023년 이후로 받은 별 수: 1015

pyecharts는 유명한 자바스크립트 데이터 시각화 라이브러리인 apache/echarts의 파이썬 바인딩입니다.

  • 장점: 다양한 차트 유형 지원, 3D 및 WebGL까지
  • 단점: 복잡한 옵션 설정

Github: https://github.com/pyecharts/pyecharts (opens in a new tab)

7위 Altair (opens in a new tab)

altair-viz/altair가 2023년 이후로 받은 별 수: 604

Altair는 vega-lite를 기반으로 구축되었으며, 자바스크립트와 학계의 데이터 시각화 분야에서 매우 유명한 라이브러리입니다. vega-lite의 이점인 선언적 접근, 웹에 적합한 출력 등을 거의 모두 이용할 수 있습니다. 가장 중요한 장점은 vega-lite의 논문에 의하면 상호작용적 그래픽의 문법으로서의 선언적 명세입니다.

  • 장점: 선언적 접근으로 코드를 단순화, 웹에 적합한 출력 생성. 더 직관적인 그래픽 생성을 위한 연산자 제공.
  • 단점: vega-lite로 인해 맞춤 설정 및 차트 유형에 제한이 있을 수 있음. 복잡한 차트를 생성하려면 사용자가 복잡한 신호 흐름을 디자인해야 함.

Github: Altair (opens in a new tab)

8위 plotnine

has2k1/plotnine가 2023년 이후로 받은 별 수: 323

plotnine은 시각화 학계에서 매우 유명한 그래픽 문법(grammer of graphics)을 기반으로 디자인되었습니다. 이론은 R의 ggplot2의 기반이기도 합니다.

Github: https://github.com/has2k1/plotnine (opens in a new tab)

9위 Holoviews

holoviz/holoviews가 2023년 이후로 받은 별 수: 169

Holoviews는 bokeh를 기반으로 구축되어 있으므로 bokeh의 효율성을 이용할 수 있지만, bokeh의 낯선 문법을 상속합니다.

Github: https://github.com/holoviz/holoviews (opens in a new tab)

10위 vispy

vispy/vispy가 2023년 이후로 받은 별 수: 154

vispy는 OpenGL에 관심이 있는 사용자를 대상으로 합니다. 사용자가 더욱 유연하고 맞춤 설정 가능한 그래픽을 구축할 수 있는 일부 저수준 API를 제공합니다.

Github: https://github.com/vispy/vispy (opens in a new tab)

결론

2023년에는 파이썬의 데이터 시각화 분야가 풍부하고 다양하며, PyGWalker (opens in a new tab)가 직관적이고 상호작용적인 탐색 도구에 대한 수요를 대표합니다. Matplotlib과 같은 전통적인 라이브러리는 여전히 중요성을 유지하고 있지만, PlotlyBokeh와 같은 웹에 적합하고 상호작용적인 시각화로의 주목할 만한 변화가 있습니다. 이 상위 10개 목록의 다양성은 이상적인 라이브러리가 프로젝트 특성과 개인적인 선호도에 따라 달라질 수 있음을 나타냅니다.

주요 요점:

  1. PyGWalker의 상승은 사용자 친화적이고 상호작용적인 데이터 도구에 대한 수요를 나타냅니다.
  2. 웹에 적합한 시각화가 성장하는 추세입니다.
  3. Matplotlib과 같은 전통적인 라이브러리는 유연성 때문에 여전히 중요합니다.
  4. 올바른 선택은 프로젝트 요구 사항과 원하는 맞춤 설정에 따라 달라집니다.