Skip to content

Plotly Express: Explicado de Forma Clara

Updated on

A visualização de dados é um aspecto crucial da análise de dados e aprendizado de máquina. Isso nos permite entender conjuntos de dados complexos e extrair insights que podem não ser aparentes nos dados brutos. Uma ferramenta que tornou esse processo extremamente fácil é o Plotly Express.

O Plotly Express é uma interface de alto nível para visualização de dados. Ele simplifica o processo de criação de gráficos complexos e facilita para iniciantes começarem a criar visualizações impressionantes. Se você é um iniciante ou um programador experiente, este guia abrangente mostrará como desbloquear todo o potencial do Plotly Express.

O que é o Plotly Express?

O Plotly Express, frequentemente abreviado como PX, é um invólucro para o Plotly.py que simplifica o processo de criação de gráficos complexos. Ele fornece uma interface de alto nível para a biblioteca Plotly, o que significa que você pode criar visualizações impressionantes com menos linhas de código.

O Plotly Express suporta uma grande variedade de gráficos, incluindo gráficos de dispersão, gráficos de linha, gráficos de barras e muito mais. Ele também suporta animações, tornando possível criar gráficos interativos que mudam ao longo do tempo ou em resposta a interações do usuário.

Uma das principais características do Plotly Express é a sua integração com DataFrames do Pandas. Isso significa que você pode passar diretamente objetos do DataFrame para as funções do Plotly Express, facilitando o trabalho com conjuntos de dados grandes.

Plotly Express vs Plotly Graph Objects

Embora o Plotly Express e os Plotly Graph Objects façam parte do ecossistema do Plotly, eles têm propósitos diferentes. Os Plotly Graph Objects é uma interface de baixo nível que fornece mais controle e opções de personalização. Por outro lado, o Plotly Express é uma interface de alto nível que simplifica o processo de criação de gráficos.

Para iniciantes, o Plotly Express geralmente é a escolha ideal. É mais fácil de usar e requer menos código para criar visualizações complexas. No entanto, se você precisar de mais controle sobre seus gráficos ou quiser criar visualizações personalizadas, talvez o Plotly Graph Objects seja mais adequado.

Tipos de Visualizações com o Plotly Express

O Plotly Express suporta uma ampla variedade de visualizações. Aqui estão alguns dos tipos mais comuns:

  1. Gráficos de Dispersão: Gráficos de dispersão são usados para exibir a relação entre duas variáveis numéricas. Eles são ótimos para identificar tendências, padrões e valores discrepantes nos dados.

  2. Gráficos de Linha: Os gráficos de linha são usados para exibir dados ao longo do tempo. Eles são comumente usados em análise de séries temporais e para acompanhar mudanças ao longo do tempo.

  3. Gráficos de Barras: Os gráficos de barras são usados para comparar a frequência, contagem ou outras características de diferentes categorias. Eles são ótimos para dados categóricos.

  4. Histogramas: Histogramas são usados para exibir a distribuição de uma única variável numérica. Eles são ótimos para entender a dispersão e assimetria dos dados.

  5. Diagramas de Caixa: Diagramas de caixa são usados para exibir o resumo estatístico de uma variável numérica. Eles mostram a mediana, quartis e potenciais valores discrepantes nos dados.

  6. Mapas de Calor: Mapas de calor são usados para exibir a correlação entre duas ou mais variáveis. Eles são ótimos para identificar padrões e agrupamentos nos dados.

Cada uma dessas visualizações pode ser criada com apenas algumas linhas de código no Plotly Express. Na próxima seção, veremos alguns exemplos de como criar esses gráficos.

Importando o Plotly Express para o Python

Antes de começar a criar visualizações com o Plotly Express, você precisará importá-lo para o seu ambiente do Python. Se você ainda não instalou o Plotly, você pode fazer isso usando o pip:

pip install plotly

Uma vez instalado o Plotly, você poderá importar o Plotly Express da seguinte forma:

import plotly.express as px

Com o Plotly Express importado, agora você está pronto para começar a criar visualizações impressionantes!

Criando Visualizações com o Plotly Express

A criação de visualizações com o Plotly Express é simples. Vamos começar criando um gráfico de dispersão simples. Primeiro, precisaremos de alguns dados. Para este exemplo, usaremos o conjunto de dados integrado iris:

df = px.data.iris()

Agora, podemos criar um gráfico de dispersão da largura da sépala versus o comprimento da sépala:

fig = px.scatter(df, x="sepal_width", y="sepal_length")
fig.show()

Com apenas três linhas de código, criamos um gráfico de dispersão! Mas o Plotly Express pode fazer muito mais do que apenas gráficos de dispersão. Vamos criar um gráfico de linha usando o conjunto de dados gapminder:

df = px.data.gapminder().query("country=='Canada'")
fig = px.line(df, x="year", y="lifeExp", title='Expectativa de vida no Canadá')
fig.show()

Novamente, em apenas algumas linhas de código, criamos um gráfico de linha que mostra a expectativa de vida no Canadá ao longo do tempo.

Personalizando os Gráficos no Plotly Express

Uma das vantagens do Plotly Express são suas opções de personalização. Você pode facilmente alterar as cores, rótulos e outros aspectos dos seus gráficos.

Por exemplo, vamos personalizar nosso gráfico de dispersão anterior. Vamos colorir os pontos por espécie e alterar os rótulos:

fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species",
                 labels={
                     "sepal_width": "Largura da Sépala (cm)",
                     "sepal_length": "Comprimento da Sépala (cm)",
                     "species": "Espécie"
                 },
                 title="Dimensões da Sépala do Íris")
fig.show()

Com essas personalizações, nosso gráfico está muito mais informativo. Podemos distinguir facilmente entre as espécies e os rótulos estão mais claros.

Plotly Express vs Outras Bibliotecas

Quando se trata de visualização de dados em Python, existem várias bibliotecas para escolher. Duas das mais populares, além do Plotly Express, são Matplotlib e Seaborn.

Matplotlib é uma biblioteca de baixo nível que oferece muita flexibilidade a custo de simplicidade. Embora você possa criar quase qualquer visualização que imaginar, muitas vezes requer bastante código para fazê-lo.

Seaborn é uma biblioteca de alto nível construída em cima do Matplotlib. Simplifica o processo de criação de visualizações mais complexas, mas ainda requer uma quantidade justa de código para personalização.

Plotly Express, por outro lado, encontra um equilíbrio entre simplicidade e flexibilidade. Permite criar visualizações complexas com código mínimo e também oferece uma ampla variedade de opções de personalização. Além disso, a natureza interativa dos gráficos do Plotly Express é uma vantagem significativa em relação aos gráficos estáticos criados com Matplotlib ou Seaborn.

Quer criar visualizações de dados a partir de um DataFrame Pandas em Python de forma rápida e sem código?

PyGWalker é uma biblioteca Python para Análise Exploratória de Dados com Visualização. PyGWalker (opens in a new tab) pode simplificar seu fluxo de trabalho de análise e visualização de dados no Jupyter Notebook, transformando seu DataFrame pandas (e DataFrame do Polars) em uma interface de usuário no estilo Tableau para exploração visual.

PyGWalker para visualização de dados (opens in a new tab)

Adicionando Legendas e Outros Elementos no Plotly Express

Adicionar legendas, títulos e rótulos aos gráficos do Plotly Express é simples. A maioria disso pode ser feita diretamente dentro da função de plotagem em si. Por exemplo, para adicionar um título ao seu gráfico, você pode usar o parâmetro title:

fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species", title="Dimensões da Sépala da Íris")
fig.show()

Para adicionar rótulos dos eixos, você pode usar o parâmetro labels, como vimos nos exemplos anteriores. As legendas são adicionadas automaticamente quando você usa o parâmetro color para distinguir entre diferentes categorias em seus dados.

Para customizações mais avançadas, você pode usar o método update_layout:

fig.update_layout(
    title="Dimensões da Sépala da Íris",
    xaxis_title="Largura da Sépala (cm)",
    yaxis_title="Comprimento da Sépala (cm)",
    legend_title="Espécie",
    font=dict(
        family="Courier New, monospace",
        size=18,
        color="RebeccaPurple"
    )
)

Isso permite personalizar a fonte, o tamanho e a cor do título, rótulos e legenda.

Agora, vamos ver algumas perguntas frequentes sobre o Plotly Express.

Perguntas Frequentes

  1. O que é o Plotly Express? O Plotly Express é uma biblioteca de visualização de dados de alto nível em Python. É um wrapper para o Plotly.py que simplifica o processo de criação de gráficos complexos.

  2. Como o Plotly Express difere dos Plotly Graph Objects? O Plotly Express é uma interface de alto nível para o Plotly, o que significa que você pode criar gráficos complexos com menos código. Os Plotly Graph Objects, por outro lado, são uma interface de baixo nível que oferece mais controle e opções de personalização.

  3. Que tipos de visualizações podem ser criadas com o Plotly Express? O Plotly Express suporta uma ampla variedade de visualizações, incluindo gráficos de dispersão, gráficos de linha, gráficos de barra, histogramas, box plots e mapas de calor. Ele também suporta animações.

  4. O Plotly Express é adequado para iniciantes? Sim, o Plotly Express foi projetado para ser fácil de usar e requer menos código para criar visualizações complexas, tornando-o uma ótima opção para iniciantes.

  5. Como o Plotly Express pode ser importado no Python? Você pode importar o Plotly Express no Python usando a seguinte linha de código: import plotly.express as px.