Skip to content
RATH
Conectar Dados
Best Practices

Melhores práticas para conexão de dados

Amostragem de dados

A amostragem de dados é um método para selecionar um subconjunto representativo de dados de um conjunto de dados maior. O objetivo desse processo é reduzir a quantidade de dados sem sacrificar a precisão dos resultados. Na RATH, é recomendado usar a amostragem de dados para conjuntos de dados que excedem 100 MB.

Para obter melhores resultados, reduza o número de linhas no conjunto de dados para abaixo de 100.000. Conjuntos de dados com 100.000 a 1 milhão de linhas podem apresentar algum atraso, e para conjuntos de dados com mais de 1 milhão de linhas, a amostragem de dados é necessária.

Você pode selecionar o tamanho da amostra da seguinte maneira: Clique no botão de tamanho fixo da amostra e escolha o tamanho desejado. Amostragem de dados

Alternativas à amostragem de dados

Você pode usar o ClickHouse, um banco de dados MPP (processamento paralelo em massa), que é otimizado para processar grandes conjuntos de dados e pode fornecer desempenho melhorado em comparação com a amostragem de dados.

Para outros tipos de suporte a bancos de dados MPP, entre em contato com a equipe da RATH para suporte.# Melhores práticas para conexão de dados

Amostragem de dados

A amostragem de dados é um método para selecionar um subconjunto representativo de dados de um conjunto de dados maior. O objetivo desse processo é reduzir a quantidade de dados sem sacrificar a precisão dos resultados. Na RATH, é recomendado usar a amostragem de dados para conjuntos de dados que excedem 100 MB.

Para obter melhores resultados, reduza o número de linhas no conjunto de dados para abaixo de 100.000. Conjuntos de dados com 100.000 a 1 milhão de linhas podem apresentar algum atraso, e para conjuntos de dados com mais de 1 milhão de linhas, a amostragem de dados é necessária.

Você pode selecionar o tamanho da amostra da seguinte maneira: Clique no botão de tamanho fixo da amostra e escolha o tamanho desejado. Amostragem de dados

Alternativas à amostragem de dados

Você pode usar o ClickHouse, um banco de dados MPP (processamento paralelo em massa), que é otimizado para processar grandes conjuntos de dados e pode fornecer desempenho melhorado em comparação com a amostragem de dados.

Para outros tipos de suporte a bancos de dados MPP, entre em contato com a equipe da RATH para suporte.