Skip to content

Como criar um DataFrame vazio no Pandas

Updated on

Como cientista de dados, trabalhar com conjuntos de dados é algo que fazemos diariamente. O conjunto de dados pode estar na forma de um arquivo CSV (Valores Separados por Vírgula), um arquivo JSON (Notação de Objetos JavaScript), um banco de dados SQL (Linguagem de Consulta Estruturada) ou uma API externa (Interface de Programação de Aplicativo). Depois de termos o conjunto de dados, precisamos trabalhar nele para extrair padrões e insights. Para fazer isso, usamos várias ferramentas e bibliotecas, uma das quais é o Pandas.

O Pandas é uma biblioteca Python amplamente utilizada para manipulação e análise de dados. Ele fornece uma interface fácil de usar para limpeza, transformação e visualização de dados. DataFrame, Series e Index são os principais componentes do Pandas. Neste artigo, vamos nos concentrar no DataFrame e aprender como criar um DataFrame vazio no Pandas.

Quer criar rapidamente Visualizações de Dados em Python?

PyGWalker é um Projeto Python de Código Aberto que pode ajudar a acelerar o fluxo de trabalho de análise e visualização de dados diretamente dentro de ambientes baseados em Jupyter Notebook.

PyGWalker (opens in a new tab) transforma o seu DataFrame do Pandas (ou DataFrame do Polars) em uma interface visual onde você pode arrastar e soltar variáveis para criar gráficos com facilidade. Basta usar o seguinte código:

pip install pygwalker
import pygwalker as pyg
gwalker = pyg.walk(df)

Você pode executar o PyGWalker agora mesmo com esses notebooks online:

E não se esqueça de nos dar uma ⭐️ no GitHub!

Execute o PyGWalker no Kaggle Notebook (opens in a new tab)Execute o PyGWalker no Google Colab (opens in a new tab)Dê uma ⭐️ ao PyGWalker no GitHub (opens in a new tab)
Execute o PyGWalker no Kaggle Notebook (opens in a new tab)Execute o PyGWalker no Google Colab (opens in a new tab)Execute o PyGWalker no Google Colab (opens in a new tab)

O que é DataFrame?

O DataFrame é uma estrutura de dados rotulada bidimensional com colunas de tipos potencialmente diferentes. É semelhante a uma planilha ou tabela SQL, onde os dados são organizados em um formato tabular. Consiste em linhas e colunas, onde cada linha representa um registro e cada coluna representa uma característica ou atributo desse registro. Um DataFrame é uma estrutura de dados versátil que pode armazenar vários tipos de dados, incluindo inteiros, pontos flutuantes, strings e até mesmo outras estruturas de dados do Pandas. Você pode realizar operações em um DataFrame, como filtragem, corte, união e agregação.

Por que precisamos de um DataFrame vazio?

Um DataFrame vazio é um DataFrame sem linhas e colunas. Às vezes, é útil criar um DataFrame vazio e preenchê-lo posteriormente com dados ou anexar dados a ele. Por exemplo, se quisermos armazenar dados sobre diferentes produtos em um DataFrame, podemos criar um DataFrame vazio com colunas como ProductID, ProductName, ProductDescription, Price, etc. e depois preenchê-lo com dados de diferentes fontes.

Como criar um DataFrame vazio?

Existem várias maneiras de criar um DataFrame vazio no Pandas. Aqui, vamos cobrir três métodos:

Método 1: Usando o construtor DataFrame()

A maneira mais fácil de criar um DataFrame vazio é usar o construtor DataFrame(). Este construtor retorna um DataFrame vazio sem colunas e sem linhas. Aqui está um exemplo:

import pandas as pd
 
df = pd.DataFrame()
print(df)

Saída:

Empty DataFrame
Columns: []
Index: []

Podemos ver que o DataFrame df não tem colunas e nem linhas. Para adicionar colunas, podemos simplesmente atribuir uma lista de nomes de colunas para df.columns. Por exemplo:

df.columns = ['ProductID', 'ProductName', 'ProductDescription', 'Price']
print(df)

Saída:

Empty DataFrame
Columns: [ProductID, ProductName, ProductDescription, Price]
Index: []

Agora, criamos um DataFrame vazio com quatro colunas.

Método 2: Usando o construtor dict()

O segundo método para criar um DataFrame vazio é usando o construtor dict(). Este método cria um dicionário vazio e, em seguida, converte-o em um DataFrame. Aqui está um exemplo:

import pandas as pd
 
data = dict(ProductID=[], ProductName=[], ProductDescription=[], Price=[])
df = pd.DataFrame(data)
print(df)

Saída:

Empty DataFrame
Columns: [ProductID, ProductName, ProductDescription, Price]
Index: []

Como no método anterior, podemos adicionar colunas atribuindo uma lista de nomes de colunas para df.columns.

Método 3: Usando o método from_dict()

O terceiro método para criar um DataFrame vazio é usar o método from_dict(). Este método cria um DataFrame a partir de um dicionário de listas vazias. Aqui está um exemplo:

import pandas as pd
 
data = {'ProductID': [], 'ProductName': [], 'ProductDescription': [], 'Price': []}
df = pd.DataFrame.from_dict(data)
print(df)

Saída:

DataFrame Vazio
Colunas: [ProductID, ProductName, ProductDescription, Price]
Index: []

Novamente, podemos adicionar colunas atribuindo uma lista de nomes de colunas a df.columns.

Como verificar se um DataFrame está vazio?

Às vezes, pode ser necessário verificar se um DataFrame está vazio ou não. Podemos fazer isso usando o atributo empty de um DataFrame. Este atributo retorna True se o DataFrame estiver vazio; caso contrário, retorna False. Aqui está um exemplo:

import pandas as pd
 
data = {'ProductID': [1, 2, 3], 'ProductName': ['A', 'B', 'C'], 'ProductDescription': ['Desc1', 'Desc2', 'Desc3'], 'Price': [10.0, 20.0, 30.0]}
df = pd.DataFrame(data)
 
print(df.empty)    # False
 
empty_df = pd.DataFrame()
print(empty_df.empty)    # True

Saída:

False
True

Neste exemplo, primeiro criamos um DataFrame df com alguns dados. Em seguida, usamos o atributo empty para verificar se ele está vazio ou não. Como o df tem dados, df.empty retorna False.

Então, criamos um DataFrame vazio empty_df usando o primeiro método e, novamente, verificamos se está vazio usando o atributo empty, que retorna True.

Conclusão

Criar um DataFrame vazio é uma operação comum na análise de dados. Neste artigo, aprendemos como criar um DataFrame vazio usando vários métodos no Pandas. Também aprendemos como verificar se um DataFrame está vazio ou não. Agora, você pode começar a experimentar com DataFrames do Pandas e melhorar suas habilidades em análise de dados.