Conceptos Básicos
Términos de Análisis de Datos y BI
Variables Categóricas
Etiquetas que se asignan a un campo de datos. Por ejemplo, considerando un conjunto de datos que representa una elección, hay dos variables categóricas: personas que votaron y las que no lo hicieron.
Comparación
Un método para analizar datos comparando dos diferentes conjuntos de variables.
Variables Continuas
Datos con un rango continuo de valores. Por ejemplo, la cantidad total de lluvia registrada en septiembre.
Campo
En Business Intelligence, después de importar tus datos, el software de BI asignará las columnas de tus datos a diferentes campos.
Tipo
Los tipos de datos se pueden definir como enteros, cadenas, fechas, etc., mientras que un rol puede ser dimensión o medida.
Filtrado de Datos
Un método para analizar datos filtrando un cierto subconjunto de datos.
Conjunto de Datos
Colección de datos que funciona como fuente para la visualización de datos.
Visualización de Datos
Los datos se presentan en una forma visual. Comúnmente presentado al público con contenido fácil de digerir, informativo e intuitivo.
Dimensión
En Business Intelligence, una dimensión significa valores cualitativos de los campos de tus datos como nombres y fechas.
Distribución
Un método para analizar datos colocando la correlación de información y tratando de comprender la interacción entre las variables.
Análisis Exploratorio de Datos
La primera ronda de análisis de datos es para descubrir patrones, anomalías y probar las aguas para supuestos. Usualmente requiere la asistencia de herramientas estadísticas y de visualización.
Funcionalidad
La funcionalidad que RATH proporciona al usuario final. Las características se enumeran como pestañas en el panel izquierdo.
Medida
En Business Intelligence, una medida significa valores numéricos de los campos de tus datos que puedes medir, como números.
Relación
La conexión de correlación entre dos o más variables de datos. Por ejemplo, el precio del petróleo frente al volumen total de producción de petróleo global.
Ordenamiento
Un método para analizar datos organizando los datos en un cierto orden, como en orden alfabético o del más pequeño al más grande.
Resumen
Un método para analizar datos produciendo un resumen estadístico. Por ejemplo, cantidad
, suma
, promedio
, máximo
.### Variable
Medida o atributo para un campo.
Características de RATH
Gráfico
Una visualización de datos que RATH genera y recomienda con IA. Un gráfico puede ser un gráfico de líneas, un gráfico de dispersión, un gráfico de barras, un gráfico de pastel, etc.
Graphic Walker
Un módulo que es una alternativa de código abierto a Tableau. También está integrado en RATH como la característica de Exploración manual.
Exploración manual
Interfaz similar a Tableau en la que se puede editar manualmente un gráfico dado. Ver: Graphic Walker.
Mega-auto exploración
En este modo, RATH analizaría las fuentes de datos y generar visualizaciones de datos mientras el usuario está completamente fuera de la mano.
Semi-auto exploración
En este modo, RATH funciona como un copiloto de exploración de datos para ayudar al usuario en el proceso de análisis de datos. RATH entenderá la intención del usuario, sugerirá gráficos de datos relacionados y proporcionará información sobre la fuente de sus datos.
Vega
Vega es una gramática de visualización, un lenguaje declarativo para crear, guardar y compartir diseños de visualización interactivos. Con Vega, puede describir la apariencia visual y el comportamiento interactivo de una visualización en un formato JSON y generar vistas basadas en la web utilizando Canvas o SVG. de Vega – A Visualization Grammar (opens in a new tab)
Otros conceptos de análisis de datos
Diagrama de flujo de datos UML
Un diagrama de flujo de datos UML es una representación gráfica de un sistema que muestra cómo fluyen los datos a través del sistema. Se utiliza para modelar los flujos de datos entre diferentes entidades en un sistema.
Diagrama de relación de datos (DRD)
Un diagrama de relación de datos (DRD) es una representación gráfica de las relaciones entre diferentes entidades en un conjunto de datos. Se utiliza para modelar las relaciones entre diferentes entidades y cómo están conectadas.
Esquema del modelo de datos
Un esquema del modelo de datos es un plan que define cómo se organiza y estructura los datos en una base de datos. Se utiliza para definir las relaciones entre diferentes entidades y cómo están conectadas.
Base de datos de relaciones de entidades (ERD)
Una Base de datos de relaciones de entidades (ERD) es un modelo de base de datos que se basa en el modelo de relación de entidades (ERM). Se utiliza para crear una representación visual de los datos y las relaciones entre diferentes entidades.