Explorar datos en el Modo Copiloto
En este tutorial, puedes aprender cómo descubrir visualizaciones de datos perspicaces y explorar los patrones y tendencias subyacentes mediante el uso de RATH como Copiloto para tu flujo de trabajo de Análisis Exploratorio de Datos.
En la pestaña de Exploración semi-automática, puedes utilizar RATH como Copiloto para el análisis exploratorio de datos, analizando automáticamente tus datos, generando visualizaciones, aprendiendo de tus preferencias y haciendo recomendaciones para ayudarte a explorar tendencias y patrones en los datos.
Además, puedes personalizar cualquier gráfico dado con una interfaz similar a la de Tableau.
En el siguiente ejemplo, estaremos trabajando con el conjunto de datos de demostración llamado "Compartir bicicletas". Este conjunto de datos contiene el recuento horario y diario de bicicletas de alquiler entre 2011 y 2012 en el sistema de bicicletas compartidas Capital en Washington DC, con la información climática y estacional correspondiente. Puedes descargar este conjunto de datos público de Kaggle (opens in a new tab).
Requisitos previos
-
Importar datos: En la pestaña de Fuente de Datos, haz clic en el botón Importar datos, elige Demo, y selecciona el conjunto de datos "Compartir bicicletas".
-
Para procesar otras fuentes de datos, consulta el capítulo de Perfilado de datos.
Caso 1. Explorar usuarios registrados vs casuales
Encontrar un gráfico para estudiar
En este caso, queremos averiguar: ¿Entre los usuarios del servicio de compartir bicicletas, cuántos son usuarios registrados (registered
), y cuántos solo usan el servicio de forma casual (casual
)?
Para lograr esto, cambia a la pestaña de Exploración semi-automática. Desplázate hacia abajo hasta la sección Patrones Asociados. En esta sección, RATH genera automáticamente visualizaciones basadas en tu conjunto de datos.
Como queremos estudiar a los usuarios registrados, localiza el gráfico de registered
, y haz clic en el botón de fijar.
En la siguiente pantalla, desplázate hacia abajo hasta la sección Patrones Asociados. RATH automáticamente genera un gráfico llamado: "registered
, casual
". Este gráfico demuestra la relación entre los usuarios registrados y los usuarios casuales.
Haz clic en el botón de fijar nuevamente para estudiar el gráfico.
Explorar patrones, características y tendencias subyacentes
El gráfico de "registered
, casual
" nos plantea inmediatamente preguntas: ¿Por qué los datos se agregan en dos clusters?
Desplázate hacia abajo hasta la sección Patrones Asociados, RATH comprende automáticamente nuestra intención y genera un gráfico de "workingday
registered
, casual
" que responde a nuestra pregunta.
Como demuestra este gráfico, los clientes prefieren utilizar los servicios de compartir bicicletas durante los días laborables.### Explorar subconjuntos de datos
También puedes explorar un subconjunto de tus datos en lugar de todo el conjunto de datos. Ve a la sección de Subconjuntos Asociados, donde RATH genera automáticamente subconjuntos en base al análisis de tus datos.
Selecciona un subconjunto y haz clic en el botón de anclar. RATH generará nuevos gráficos sobre el subconjunto seleccionado categorizados por patrones y características asociados.
Esta función es especialmente útil cuando las dimensiones del conjunto de datos son abrumadoras. Por ejemplo, si estás intentando estudiar datos de una tienda online con cientos de categorías de productos.
Caso 2. Explorar las horas preferidas para usuarios registrados
Explorar patrones, características y tendencias subyacentes
En este caso, queremos saber a qué hora del día, los usuarios registrados prefieren utilizar el servicio de bicicletas compartidas.
Comenzamos la exploración de datos anclando el gráfico de registrados
. Desplázate hacia abajo hasta la sección de Características Asociadas y ubica el gráfico "hora
, registrados
", que sugiere las horas de mayor tráfico del servicio de bicicletas compartidas en un día laboral.
Haz clic en el botón de anclar para estudiar este gráfico. Queremos explorar más a fondo, ¿hay alguna variable potencial que afecte el cambio horario de los usuarios registrados?
Desplázate hacia abajo hasta la sección de Características Asociadas y ubica el gráfico "hora
, temporada
, registrados
".
Consejo: puedes hacer clic en el botón de Cargar Más para generar más Patrones/Características Asociadas.
Este gráfico muestra los cambios estacionales de los usuarios registrados. Puedes determinar que la hora pico de uso para los usuarios registrados son las noches de vacaciones en verano.
Personaliza tus gráficos
Si encuentras un gráfico y prefieres editarlo con una interfaz similar a Tableau, haz clic en la opción de Editar Gráfico para personalizar el gráfico en la pestaña de Exploración Manual. Para más detalles, consulta el capítulo de Crear Visualizaciones Personalizadas.
Mejores prácticas
-
La exploración semiautomática es ideal para analistas y científicos de datos como un asistente automatizado de IA, sin interrumpir tu flujo de trabajo existente. Puedes usar RATH para generar visualizaciones y conocimientos, conducir exploración automatizada de datos, y volver a tu flujo de trabajo de análisis de datos existente.
-
Para usuarios que desean explorar conjuntos de datos con una interfaz similar a la de un pintor y herramientas, Data Painter ofrece una interfaz similar a la de un pintor para una exploración de datos directa y creativa sin necesidad de un software de inteligencia empresarial o lenguajes de programación complicados.