Skip to content
RATH
Conectar datos
Best Practices

Mejores prácticas para la conexión de datos

Muestreo de datos

El muestreo de datos es un método para seleccionar una muestra representativa de datos de un conjunto de datos más grande. El propósito de este proceso es reducir la cantidad de datos sin sacrificar la precisión de los resultados. En RATH, se recomienda utilizar el muestreo de datos para conjuntos de datos que superen los 100 MB.

Para obtener los mejores resultados, reduzca el número de filas en el conjunto de datos a menos de 100,000. Los conjuntos de datos con 100,000 a 1 millón de filas pueden experimentar cierto retraso, y para conjuntos de datos que superen 1 millón de filas, es necesario el muestreo de datos.

Puede seleccionar el tamaño de la muestra de la siguiente manera: haga clic en el botón de tamaño fijo de muestra y elija su tamaño de muestra deseado.

Muestreo de Datos

Alternativas al muestreo de datos

Puede utilizar ClickHouse, una Base de datos MPP (Procesamiento Paralelo Masivo), que está optimizada para procesar grandes conjuntos de datos y puede proporcionar un rendimiento mejorado en comparación con el muestreo de datos.

Para otros tipos de soporte de bases de datos MPP, póngase en contacto con el equipo de RATH para obtener soporte.# Mejores prácticas para la conexión de datos

Muestreo de datos

El muestreo de datos es un método para seleccionar una muestra representativa de datos de un conjunto de datos más grande. El propósito de este proceso es reducir la cantidad de datos sin sacrificar la precisión de los resultados. En RATH, se recomienda utilizar el muestreo de datos para conjuntos de datos que superen los 100 MB.

Para obtener los mejores resultados, reduzca el número de filas en el conjunto de datos a menos de 100,000. Los conjuntos de datos con 100,000 a 1 millón de filas pueden experimentar cierto retraso, y para conjuntos de datos que superen 1 millón de filas, es necesario el muestreo de datos.

Puede seleccionar el tamaño de la muestra de la siguiente manera: haga clic en el botón de tamaño fijo de muestra y elija su tamaño de muestra deseado.

Muestreo de Datos

Alternativas al muestreo de datos

Puede utilizar ClickHouse, una Base de datos MPP (Procesamiento Paralelo Masivo), que está optimizada para procesar grandes conjuntos de datos y puede proporcionar un rendimiento mejorado en comparación con el muestreo de datos.

Para otros tipos de soporte de bases de datos MPP, póngase en contacto con el equipo de RATH para obtener soporte.