2023年Python中前十名增长最快的数据可视化库
Updated on
Python强大的可视化生态系统意味着用户可以使用众多库来进行数据可视化。虽然这提供了灵活性,但理解每个库的优势和局限性至关重要。让我们深入了解2023年Python中前十名数据可视化库的新趋势。
排名基于2023年各个库的GitHub仓库获得的星数。星数越多,排名越高。
第1名 PyGWalker
自2023年以来kanaries/pygwalker获得的星数为7486
2023年最受欢迎的Python数据可视化库。它可以将您的数据帧转换为交互式数据探索应用程序,类似于tableau/powerBI,仅需要一行代码。 (opens in a new tab) 它提供了简单的拖放/聊天界面,用于构建图表。 它可以在juypter notebook中运行,这意味着您不需要在代码和可视化应用程序之间切换。 此外,您还可以用它构建地图上的交互式空间可视化。 (opens in a new tab) 它还有JavaScript和R版本。
- 优点:一行代码即可进行交互式数据探索应用;拖放/聊天界面;在地图上构建交互式空间可视化。
- 缺点:样式可定制性不强。
GitHub链接: https://github.com/Kanaries/pygwalker (opens in a new tab)
第2名 Matplotlib
自2023年以来matplotlib/matplotlib获得的星数为1821
Matplotlib是Python中非常传统的数据可视化库,于2003年发布。它是许多其他库的基础,如seaborn、pygal等。 它非常灵活和可定制,但也非常冗长且不够高效,通常需要大量代码来进行简单的可视化。
- 优点:为许多其他库提供基础;高度可定制。
- 缺点:学习曲线较陡;在简单可视化方面可能需要大量代码;美观度可能显得过时。
GitHub链接: https://github.com/matplotlib/matplotlib (opens in a new tab)
第3名 Plotly
自2023年以来plotly/plotly.py获得的星数为1705
Plotly也是一个多平台的数据可视化库,类似于pygwalker。Plotly的公司还创建了Dash,可以将您的plotly图表代码转换为像仪表板一样的Web应用程序。
- 优点:提供交互式、准备上线的可视化;可以使用Dash作为数据应用程序发布。
- 缺点:在线模式需要互联网连接;免费版本对图表数量和公开可见性有限制。
GitHub链接: https://github.com/plotly/plotly.py (opens in a new tab)
第4名 Bokeh
自2023年以来bokeh/bokeh获得的星数为1126
Bokeh由Anaconda创建,Anaconda是数据科学领域非常著名的公司。发布日期:2013年
- 优点:用于交互式Web可视化;可以高效处理大型数据集。
- 缺点:语法对于Matplotlib用户可能会感到陌生;更适用于Web应用程序而非静态图。
GitHub链接: https://github.com/bokeh/bokeh (opens in a new tab)
第5名 Seaborn
自2023年以来mwaskom/seaborn获得的星数为1111
Seaborn是基于matplotlib构建的,这意味着它享受了matplotlib的灵活性,但也继承了matplotlib的冗长性。
- 优点:在Matplotlib基础上具有增强的美学性能;针对统计图表高效。
- 缺点:可定制性较matplotlib较低;可能不适用于高级或非统计图。
GitHub链接: https://github.com/mwaskom/seaborn (opens in a new tab)
第6名 pyecharts
自2023年以来pyecharts/pyecharts获得的星数为1015
pyecharts是著名的JavaScript数据可视化库apache/echarts的python绑定。
- 优点:支持多种图表类型,甚至包括3D和WebGL。
- 缺点:配置选项复杂。
GitHub链接: https://github.com/pyecharts/pyecharts (opens in a new tab)
第7名 Altair (opens in a new tab)
自2023年以来altair-viz/altair获得的星数为604
Altair基于vega-lite构建,vega-lite是JavaScript和可视化学术界非常著名的数据可视化库。它几乎享有vega-lite的所有优点,如申明式方法、准备上线的输出等。 最重要的优点是其交互式规范,根据vega-lite的论文,作为交互式图形语法。
- 优点:申明式方法简化代码;生成准备上线的输出。制作图形更直观的操作符。
- 缺点:由于vega-lite的限制,定制和图表类型存在限制。制作复杂图表可能需要用户设计复杂的信号流。
GitHub链接: Altair (opens in a new tab)
第8名 plotnine
自2023年以来has2k1/plotnine获得的星数为323
plotnine基于图形语法进行设计,图形语法是可视化学术界非常著名的理论。该理论也是R中ggplot2的基础。
GitHub链接: https://github.com/has2k1/plotnine (opens in a new tab)
第9名 Holoviews
自2023年以来holoviz/holoviews获得的星数为169
Holoviews基于bokeh构建,这意味着它享受了bokeh的效率,但也继承了bokeh的不熟悉语法。
GitHub链接: https://github.com/holoviz/holoviews (opens in a new tab)
第10名 vispy
自2023年以来vispy/vispy获得的星数为154
vispy针对对OpenGL感兴趣的用户。它为用户提供了一些低级API,以构建更灵活和可定制的图形。
GitHub链接: https://github.com/vispy/vispy (opens in a new tab)
总结
在2023年,Python的数据可视化领域丰富而多样,PyGWalker (opens in a new tab)引领着直观、交互式的探索工具的发展。尽管像Matplotlib这样的传统强大库仍然很重要,但在准备上线和交互式可视化方面出现了明显的转变,例如Plotly和Bokeh。此前十名列表的多样性表明理想的库取决于项目的具体需求和个人偏好。
关键要点:
- PyGWalker的崛起标志着对用户友好、交互式数据工具的需求。
- 准备上线的可视化正在受到关注。
- 由于其灵活性,传统库如Matplotlib仍然具有重要性。
- 正确的选择取决于项目需求和所需的定制性。