Best Practices für die Datenverbindung
Datenauswahl
Die Datenauswahl ist eine Methode zur Auswahl einer repräsentativen Teilmenge von Daten aus einem größeren Datensatz. Das Ziel dieses Prozesses ist es, die Datenmenge zu reduzieren, ohne die Genauigkeit der Ergebnisse zu beeinträchtigen. In RATH wird empfohlen, die Datenauswahl für Datensätze zu verwenden, die 100 MB überschreiten.
Für beste Ergebnisse sollte die Anzahl der Zeilen im Datensatz unter 100.000 reduziert werden. Datensätze mit 100.000 bis 1 Million Zeilen können einige Verzögerungen verursachen, und bei Datensätzen mit mehr als 1 Million Zeilen ist die Datenauswahl erforderlich.
Sie können die Stichprobengröße folgendermaßen auswählen: Klicken Sie auf die Schaltfläche "Feste Stichprobengröße" und wählen Sie die gewünschte Stichprobengröße aus.
Alternativen zur Datenauswahl
Sie können ClickHouse verwenden, eine MPP (Massively Parallel Processing) Datenbank, die für die Verarbeitung großer Datensätze optimiert ist und im Vergleich zur Datenauswahl eine verbesserte Leistung bieten kann.
Für andere Arten von MPP-Datenbankunterstützung wenden Sie sich an das RATH Team für Unterstützung.