Grundlegende Konzepte
Datenanalyse & BI-Begriffe
Kategoriale Variablen
Bezeichnungen, die einem Datenfeld zugewiesen werden. Zum Beispiel gibt es in einem Datensatz, der eine Wahl repräsentiert, zwei kategoriale Variablen: Menschen, die gewählt haben, und solche, die nicht gewählt haben.
Vergleich
Eine Methode zur Analyse von Daten durch den Vergleich zweier unterschiedlicher Variablensets.
Kontinuierliche Variablen
Daten mit einem kontinuierlichen Wertebereich. Zum Beispiel die Gesamtmenge an Niederschlag, die im September gemessen wurde.
Feld
Im Business Intelligence werden nach dem Importieren der Daten die Spalten den verschiedenen Feldern zugeordnet.
Typ
Datentypen können als ganze Zahlen, Zeichenketten, Datumsangaben usw. definiert werden, während eine Rolle entweder Dimension oder Measure sein kann.
Datenfilterung
Eine Methode zur Analyse von Daten durch Filterung einer bestimmten Teilmeng aus den Daten.
Datensatz
Eine Sammlung von Daten, die als Grundlage für die Datenvisualisierung dient.
Datenvisualisierung
Daten, die in einer visuellen Form dargestellt werden. In der Regel werden sie mit leicht verständlichen, informativen und aufschlussreichen Inhalten für das Publikum präsentiert.
Dimension
Im Business Intelligence bedeutet eine Dimension qualitative Werte Ihrer Datenfelder wie Namen und Datum.
Verteilung
Eine Methode zur Analyse von Daten durch Darstellung der Korrelation von Informationen und Versuch, die Wechselwirkung zwischen Variablen zu erfassen.
Explorative Datenanalyse
Die erste Runde der Datenanalyse dient dazu, Muster, Anomalien und Annahmen zu entdecken. Hierzu sind statistische und Visualisierungstools erforderlich.
Feature
Die Funktionalität, die RATH dem Endbenutzer bietet. Features werden als Registerkarten im linken Bereich aufgelistet.
Measure
Im Business Intelligence bedeutet eine Measure numerische Werte Ihrer Datenfelder, die gemessen werden können, wie Zahlen.
Beziehung
Die Korrelation zwischen zwei oder mehr Datenvariablen. Zum Beispiel der Ölpreis im Vergleich zum Gesamtvolumen der weltweiten Ölproduktion.
Sortierung
Eine Methode zur Analyse von Daten durch Organisation der Daten in einer bestimmten Reihenfolge, z.B. alphabetisch oder von kleinster zu größter Größe.
Zusammenfassung
Eine Methode zur Analyse von Daten durch Erstellung einer statistischen Zusammenfassung. Zum Beispiel Anzahl
, Summe
, Durchschnitt
, Maximum
, Minimum
.
Variable
Maß oder Attribut für ein Datenfeld.
RATH-Funktionen
Diagramm
Ein Datenvisualisierungsdiagramm, das RATH generiert und mit KI empfiehlt. Ein Diagramm kann ein Linien-, Punktwolken-, Balken-, Kreisdiagramm usw. sein.
Grafischer Navigator
Ein Modul, das eine Open-Source-Alternative zu Tableau darstellt. Es ist auch in RATH als Funktion Manuelle Exploration integriert.
Manuelle Exploration
Eine Tableau-ähnliche Benutzeroberfläche, in der ein gegebenes Diagramm manuell bearbeitet werden kann. Siehe: Grafischer Navigator.
Mega-Auto-Exploration
In diesem Modus analysiert RATH Datenquellen und generiert Datenvisualisierungen, während der Benutzer praktisch nichts tun muss.
Semi-Auto-Exploration
In diesem Modus fungiert RATH als Datenexploration-Co-Pilot und unterstützt den Benutzer im Datenanalyseprozess. RATH erkennt die Absicht des Benutzers, schlägt verwandte Datencharts vor und liefert Einblicke in die Datenquelle.
Vega
Vega ist eine Visualisierungsgrammatik, eine deklarative Sprache zur Erstellung, Speicherung und gemeinsamen Nutzung interaktiver Visualisierungsdesigns. Mit Vega können Sie das visuelle Erscheinungsbild und das interaktive Verhalten einer Visualisierung in einem JSON-Format beschreiben und webbasierte Ansichten unter Verwendung von Canvas oder SVG generieren. aus Vega - Eine Visualisierungsgrammatik (opens in a new tab)
Andere Konzepte der Datenanalyse
UML-Datenflussdiagramm
Ein UML-Datenflussdiagramm ist eine grafische Darstellung eines Systems, das zeigt, wie Daten durch das System fließen. Es wird verwendet, um die Datenflüsse zwischen verschiedenen Entitäten in einem System zu modellieren.
Datenbeziehungsdiagramm (DRD)
Ein Datenbeziehungsdiagramm (DRD) ist eine grafische Darstellung der Beziehungen zwischen verschiedenen Entitäten in einem Datensatz. Es wird verwendet, um die Beziehungen zwischen verschiedenen Entitäten und deren Verbindungen zu modellieren.
Datenmodell-Schema
Ein Datenmodell-Schema ist eine Blaupause, die definiert, wie Daten in einer Datenbank organisiert und strukturiert sind. Es wird verwendet, um die Beziehungen zwischen verschiedenen Entitäten und deren Verbindungen zu definieren.
Entity-Relationship-Datenbank (ERD)
Eine Entity-Relationship-Datenbank (ERD) ist ein Datenbankmodell, das auf dem Entity-Relationship-Modell (ERM) basiert. Es wird verwendet, um eine visuelle Darstellung der Daten und der Beziehungen zwischen verschiedenen Entitäten zu erstellen.