Skip to content
RATH
Preparar Dados
Data Transformation

Transforme seus dados

A Transformação de Dados é um processo que ajuda a preparar os seus dados brutos para análise e modelagem. O processo consiste em quatro etapas principais para garantir que os dados sejam precisos e confiáveis.

  • Limpeza de Dados: Esta etapa consiste em corrigir erros, inconsistências e valores ausentes nos seus dados.

  • Filtragem de Dados: Esta etapa permite que você selecione somente os dados relevantes para sua análise.

  • Transformação de Dados: Esta etapa altera o formato dos seus dados para que sejam mais fáceis de trabalhar.

  • Amostragem de Dados: Esta etapa envolve a seleção de uma porção menor dos seus dados para economizar tempo e recursos.

Seguindo essas etapas, você será capaz de trabalhar com dados de alta qualidade que lhe darão resultados precisos em sua análise e modelagem.

Manipulação de dados com RATH

Limpeza de dados

A Limpeza de Dados é o processo de corrigir ou remover dados incorretos, corrompidos, com formato incorreto, duplicados ou incompletos de um conjunto de dados. A limpeza adequada de dados pode melhorar a qualidade da análise.

Antes de usar o RATH para a limpeza de dados, certifique-se de que seus conjuntos de dados tenham formatos de dados padronizados. Isso inclui:

  • Dados DateTime: devem ser padronizados como AAAA-MM-DD.
  • Dados Numéricos: devem estar corretos. Por exemplo, considere um conjunto de dados para registros de vendas de supermercado. Os dados de vendas devem ser padronizados como 100 em vez de $100 ou 100 dólares.

Para usar o RATH na limpeza de dados, basta importar seus dados de uma fonte de dados. O RATH pode automaticamente limpar seus dados.

Você também pode escolher uma opção do menu suspenso Método de Limpeza na aba da Fonte de Dados. Limpeza de Dados com RATH

Selecione uma das opções que corresponda aos seus requisitos para continuar.

Filtragem de Dados

Você também pode filtrar seus dados com o RATH. Vá para a visão Meta e clique no botão "Filtrar" de um determinado conjunto de dados para aplicar um filtro.No campo.

Filtragem de dados

Ative o filtro e selecione um determinado intervalo ou conjunto de valores. No exemplo acima, estamos selecionando os dados cuja temperatura está entre 20 e 30 graus.

Se você quiser apenas remover as anomalias, selecione o botão Seleção rápida e use o recurso de filtragem rápida para obter as partes principais dos dados. Você pode configurar mais detalhes na tela a seguir: Filtragem rápida de dados

Transformação de dados

Na visualização Tabela ou Meta, selecione a opção Transformações em um determinado campo. O RATH pode gerar automaticamente sugestões para transformação de dados.

Por exemplo, se você selecionar um objeto DateTime, o RATH sugerirá agrupar DateTime por unidades de tempo: Transformar campos na visualização de tabela

Para variáveis categóricas, o RATH sugerirá usar o algoritmo de Codificação One-hot. Transformar campos na visualização de tabela

Se o RATH detectar anomalias potenciais em um determinado campo, o RATH sugerirá usar o algoritmo Floresta de Isolamento. Transformar campos na visualização de tabela

Amostragem de dados

A amostragem de dados é o processo de selecionar uma porção representativa de dados de um conjunto de dados maior para obter inferências sobre a população geral. Ele permite uma exploração e análise eficientes e eficazes, reduzindo a quantidade de dados a serem processados, ao mesmo tempo em que fornece informações precisas.

Para obter mais detalhes sobre amostragem de dados, consulte as seções relacionadas no capítulo Conectar seus dados.