Explore dados no modo Copiloto
Neste tutorial, você pode aprender como descobrir visualizações de dados esclarecedoras e explorar os padrões e tendências subjacentes usando RATH como Copiloto para seu fluxo de trabalho de Análise Exploratória de Dados.
Na guia Exploração Semi-automática, você pode usar RATH como Copiloto para análise exploratória de dados, analisando automaticamente seus dados, gerando visualizações, aprendendo com suas preferências e fazendo recomendações para ajudá-lo a explorar tendências e padrões nos dados.
Além disso, você pode personalizar qualquer gráfico com uma interface semelhante ao Tableau.
No exemplo a seguir, estaremos trabalhando no conjunto de dados de demonstração chamado "Bike Sharing". Este conjunto de dados contém a contagem horária e diária de bicicletas alugadas entre os anos de 2011 e 2012 no sistema de compartilhamento de bicicletas em Washington, DC, juntamente com as informações climáticas e sazonais correspondentes. Você pode baixar este conjunto de dados público do Kaggle (opens in a new tab).
Pré-requisitos
-
Importar dados: Na guia Fonte de dados, clique no botão Importar dados, escolha Demonstração, e selecione o conjunto de dados "Bike Sharing".
-
Para processar outras fontes de dados, consulte o capítulo de Perfilagem de Dados.
Caso 1. Explore usuários registrados vs casuais
Encontre um gráfico para estudar
Neste caso, queremos descobrir: entre os usuários do serviço de compartilhamento de bicicletas, quantos deles são usuários registrados (registrados
), e quantos estão usando o serviço casualmente (occasionals
)?
Para fazer isso, vá para a guia Exploração Semi-automática. Role para baixo até a seção de Padrões Associados. Nesta seção, o RATH gera automaticamente visualizações com base no seu conjunto de dados.
Como queremos estudar os usuários registrados, localize o gráfico registrados
e clique no botão de "pino".
Na próxima tela, role para baixo até a seção de Padrões Associados. O RATH gera automaticamente um gráfico chamado: "registrados
, occasionals
". Este gráfico demonstra a relação entre usuários registrados e usuários ocasionais.
Clique novamente no botão de "pino" para estudar o gráfico.
Explore padrões, recursos e tendências subjacentes
O gráfico "registrados
, occasionals
" imediatamente nos traz perguntas: por que os dados estão agregados em dois clusters?
Role para baixo até a seção de Padrões Associados. O RATH entende automaticamente nossa intenção e gera um gráfico "dia útil
, registrados
, occasionals
" que responde à nossa pergunta.
Como este gráfico demonstra, os clientes preferem usar os serviços de compartilhamento de bicicletas durante a semana.Nos dias de semana, os usuários casuais tendem a andar de bicicleta compartilhada nos fins de semana para se divertirem.
Explorar subconjunto de dados
Você também pode explorar um subconjunto de seus dados em vez de todo o conjunto de dados. Navegue até a seção Subconjuntos Associados, onde o RATH gera automaticamente subconjuntos com base na análise de seus dados.
Selecione um subconjunto e clique no botão de fixar. O RATH gera novos gráficos sobre os subconjuntos selecionados, categorizados por padrões e recursos associados.
Esse recurso ajuda particularmente quando as dimensões do conjunto de dados são avassaladoras. Por exemplo, se você estiver tentando estudar dados de uma loja de comércio eletrônico com centenas de categorias de produtos.
Caso 2. Explorar horas preferidas para usuários registrados
Explorar padrões, recursos e tendências subjacentes
Nesse caso, gostaríamos de saber em que horário do dia os usuários registrados preferem usar o serviço de compartilhamento de bicicletas.
Iniciamos a exploração dos dados fixando o gráfico registrado
. Role a página até a seção Recursos Associados e localiza o gráfico "hora
, registrado
", que sugere as horas de pico do serviço de compartilhamento de bicicletas em um dia de trabalho.
Clique no botão de fixar para estudar esse gráfico. Queremos explorar mais, há alguma variável potencial que afeta a mudança horária de usuários registrados?
Role a página até a seção Recursos Associados e localize o gráfico "hora
, estação
, registrado
".
Dica: você pode clicar no botão Carregar mais para gerar mais Padrões / Recursos Associados.
Esse gráfico demonstra as mudanças sazonais dos usuários registrados. Você pode perceber que as horas de pico de uso para os usuários registrados são durante as noites de férias de verão.
Personalize seus gráficos
Se você encontrar um gráfico e preferir editá-lo como uma interface semelhante ao Tableau, clique na opção Editar gráfico para personalizar o gráfico na guia Exploração Manual. Para mais detalhes, consulte o capítulo Criar visualização de dados personalizada.
Melhores práticas
-
A Exploração Semi-automática é mais adequada para analistas de dados e cientistas de dados como um assistente automatizado de Inteligência Artificial, sem perturbar seu fluxo de trabalho existente. Você pode usar o RATH para gerar algumas visualizações e insights, conduzir exploração de dados automatizada e voltar ao seu fluxo de trabalho de análise de dados existente.
-
Para usuários que desejam explorar conjuntos de dados com uma interface parecida com a de um pintor e ferramentas, o Data Painter oferece uma interface parecida com a de um pintor para exploração direta e criativa de dados sem a necessidade de software de Business Intelligence complicado ou linguagens de programação.