2023年のPythonで人気のあるトップ10のデータ可視化ライブラリ
Updated on
Pythonの強力な可視化エコシステムにより、ユーザーは多数のライブラリを利用することができます。これにより柔軟性が提供されますが、各ライブラリの利点と制限を理解することが重要です。2023年のPythonで人気のあるトップ10のデータ可視化ライブラリの新しいトレンドについて詳しく見ていきましょう。
ランキングは各ライブラリのGitHubリポジトリが2023年に受け取ったスターの数に基づいています。スターの数が多いほど上位にランクされます。
第1位 PyGWalker
2023年にkanaries/pygwalkerが受け取ったスターの数: 7486
2023年に最も人気のあるデータ可視化Pythonライブラリです。1行のコードでデータフレームをTableauやPowerBIのようなインタラクティブなデータ探索アプリに変換します。 (opens in a new tab) チャートを作成するためのシンプルなドラッグアンドドロップ/チャットインターフェースを提供します。 jupyter notebookで実行することもできますので、コードと可視化アプリの切り替えが必要ありません。 さらに、地図上でのインタラクティブな空間可視化も作成することができます。 (opens in a new tab) また、JavaScriptとRのバージョンもあります。
- 利点: 1行のコードでインタラクティブなデータ探索アプリが作成可能、ドラッグアンドドロップ/チャットインターフェース、地図上でのインタラクティブな空間可視化が可能
- 欠点: カスタマイズ可能なスタイルに対してあまり柔軟ではない
Github: https://github.com/Kanaries/pygwalker (opens in a new tab)
第2位 Matplotlib
2023年にmatplotlib/matplotlibが受け取ったスターの数: 1821
Matplotlibは、2003年に公開された非常に伝統的なPythonのデータ可視化ライブラリです。Seaborn、Pygalなど、他の多くのライブラリの基盤として機能しています。 非常に柔軟性がありカスタマイズ可能ですが、簡単な可視化にも複雑なコードが必要な場合があり、効率もそれほど高くありません。
- 利点: 他の多くのライブラリの基盤、高いカスタマイズ性
- 欠点: 学習曲線が急、簡単な可視化にも複雑なコードが必要、見た目が古めかしいかもしれない
Github: https://github.com/matplotlib/matplotlib (opens in a new tab)
第3位 Plotly
2023年にplotly/plotly.pyが受け取ったスターの数: 1705
Plotlyは、pygwalkerのようなマルチプラットフォームのデータ可視化ライブラリです。Plotlyの会社はDashも開発しており、PlotlyのチャートコードをダッシュボードのようなWebアプリに変換することができます。
- 利点: インタラクティブなWeb対応の可視化が提供され、dashでデータアプリとして公開することも可能
- 欠点: オンラインモードではインターネット接続が必要、無料版にはプロット数と公開可視性の制限がある
Github: https://github.com/plotly/plotly.py (opens in a new tab)
第4位 Bokeh
2023年にbokeh/bokehが受け取ったスターの数: 1126
Bokehは、データサイエンスの世界で非常に有名なAnacondaによって作成されました。公開日: 2013年
- 利点: インタラクティブウェブ可視化のために作成されており、大規模なデータセットを効率的に処理することができる
- 欠点: Matplotlibのユーザーにとっては構文が馴染みにくいかもしれない、静的なプロットよりもWebアプリケーションに特化している
Github: https://github.com/bokeh/bokeh (opens in a new tab)
第5位 Seaborn
2023年にmwaskom/seabornが受け取ったスターの数: 1111
Seabornは、Matplotlibに基づいて構築されており、Matplotlibの柔軟性を活かす一方で、Matplotlibの冗長さも引き継いでいます。
- 利点: 美しい外観に特化したMatplotlib上に構築され、統計的なプロットに効率的
- 欠点: Matplotlibよりもカスタマイズ性が低く、高度な非統計的なプロットには適していないかもしれない
Github: https://github.com/mwaskom/seaborn (opens in a new tab)
第6位 pyecharts
2023年にpyecharts/pyechartsが受け取ったスターの数: 1015
pyechartsは、JavaScriptの有名なデータ可視化ライブラリapache/echartsのPythonバインディングです。
- 利点: 多様なチャートタイプをサポートし、3DやWebGLなども可能
- 欠点: 複雑なオプションの設定が必要
Github: https://github.com/pyecharts/pyecharts (opens in a new tab)
第7位 Altair (opens in a new tab)
2023年にaltair-viz/altairが受け取ったスターの数: 604
Altairは、ジャバスクリプトや学術的な可視化の世界で非常に有名なデータ可視化ライブラリvega-liteに基づいて構築されています。vega-liteのほぼすべての利点(宣言的なアプローチ、Web対応の出力など)を享受しています。 最も重要な利点は、vega-liteの論文によると、インタラクティブなグラフィックスの文法としての宣言的な仕様です。
- 利点: 宣言的なアプローチによりコードが簡素化され、Web対応の出力が生成される。より直感的な演算子でグラフィックスを作成することができる。
- 欠点: vega-liteによる制約があるため、カスタマイズ性やチャートの種類に制限がある。複雑なチャートを作成するには、複雑なシグナルフローの設計が必要になる場合がある。
Github: Altair (opens in a new tab)
第8位 plotnine
2023年にhas2k1/plotnineが受け取ったスターの数: 323
plotnineは、データの可視化の学術的な世界で非常に有名な理論である「グラフィックスの文法」に基づいて設計されています。この理論はRのggplot2の基盤ともなっています。
Github: https://github.com/has2k1/plotnine (opens in a new tab)
第9位 Holoviews
2023年にholoviz/holoviewsが受け取ったスターの数: 169
Holoviewsは、Bokehに基づいて設計されています。Bokehの効率性を活かしながら、Bokehの構文にはなじみのない部分も引き継いでいます。
Github: https://github.com/holoviz/holoviews (opens in a new tab)
第10位 vispy
2023年にvispy/vispyが受け取ったスターの数: 154
vispyはOpenGLに興味を持つユーザーを対象としています。ユーザーはより柔軟でカスタマイズ可能なグラフィックスを構築するためのいくつかの低レベルのAPIを提供しています。
Github: https://github.com/vispy/vispy (opens in a new tab)
結論
2023年、Pythonのデータ可視化のエコシステムは豊かで多様であり、PyGWalker (opens in a new tab)が直感的でインタラクティブな探索ツールに向けてリードしています。Matplotlibなどの伝統的なライブラリも依然として重要ですが、PlotlyやBokehのようなWeb対応のインタラクティブな可視化へのシフトが見られます。このトップ10リストの多様性は、最適なライブラリはプロジェクト固有の要件と個人の好みによって異なることを示しています。
要点:
- PyGWalkerの台頭は、ユーザーフレンドリーなインタラクティブなデータツールへの需要を表しています。
- Web対応の可視化が注目を集めています。
- Matplotlibのような伝統的なライブラリは柔軟性を持っているため重要です。
- 適切な選択肢は、プロジェクトの要件と望ましいカスタマイズによって異なります。