Concepts de base
Termes d'analyse de données et de BI
Variables catégorielles
Étiquettes attribuées à un champ de données. Par exemple, en considérant l'ensemble de données qui représente une élection, il existe deux variables catégorielles : les personnes ayant voté et celles qui n'ont pas voté.
Comparaison
Une méthode d'analyse de données en comparant deux ensembles de variables différents.
Variables continues
Données avec une plage continue de valeurs. Par exemple, le total des précipitations enregistrées pour septembre.
Champ
En intelligence d'affaires, après l'importation de vos données, le logiciel de BI attribuerait les colonnes de vos données à différents champs.
Type
Les types de données peuvent être définis comme entier, chaîne de caractères, date, etc., tandis qu'un rôle peut être soit une dimension soit une mesure.
Filtrage des données
Une méthode d'analyse de données en filtrant un sous-ensemble de données spécifique.
Ensemble de données
Collection de données qui sert de source de visualisation des données.
Visualization des données
Données présentées sous forme visuelle. Généralement présentées à l'audience dans un format facile à comprendre, informatif et perspicace.
Dimension
En intelligence d'affaires, une dimension représente des valeurs qualitatives de vos champs de données, telles que les noms et les dates.
Distribution
Une méthode d'analyse des données en mettant en évidence la corrélation des informations et en essayant de comprendre l'interaction entre les variables.
Analyse exploratoire des données
La première étape de l'analyse des données consiste à découvrir des motifs, des anomalies et à tester les hypothèses. Cela nécessite généralement l'assistance d'outils statistiques et de visualisation.
Fonctionnalité
La fonctionnalité que RATH fournit à l'utilisateur final. Les fonctionnalités sont répertoriées dans les onglets du panneau de gauche.
Mesure
En intelligence d'affaires, une mesure représente des valeurs numériques de vos champs de données que vous pouvez mesurer, telles que des nombres.
Relation
La corrélation entre deux ou plusieurs variables de données. Par exemple, le prix du pétrole par rapport au volume total de production mondiale de pétrole.
Tri
Une méthode d'analyse de données en organisant les données selon un certain ordre, tel que l'ordre alphabétique ou du plus petit au plus grand.
Résumé
Une méthode d'analyse de données en produisant un résumé statistique. Par exemple count
, sum
, mean
, maximum
, minimum
.
Variable
Mesure ou attribut pour un champ.
Fonctionnalités de RATH
Graphique
Un élément de graphique de visualisation des données généré et recommandé par RATH avec l'IA. Un graphique peut être un graphique linéaire, un graphique en nuage de points, un graphique à barres, un graphique circulaire, etc.
Graphic Walker
Un module qui est une alternative open-source à Tableau. Il est également intégré à RATH en tant que fonctionnalité Exploration manuelle.
Exploration manuelle
Une interface similaire à Tableau où vous pouvez modifier manuellement un graphique donné. Voir : Graphic Walker.
Mega-auto Exploration
Dans ce mode, RATH analyse les sources de données et génère des visualisations des données pendant que l'utilisateur est entièrement mis à l'écart.
Exploration semi-automatique
Dans ce mode, RATH fonctionne comme un copilote d'exploration de données pour aider l'utilisateur dans le processus d'analyse des données. RATH comprendra l'intention de l'utilisateur, suggérera des graphiques de données liés et fournira des informations sur votre source de données.
Vega
Vega est une grammaire de visualisation, un langage déclaratif pour créer, sauvegarder et partager des conceptions de visualisation interactives. Avec Vega, vous pouvez décrire l'apparence visuelle et le comportement interactif d'une visualisation dans un format JSON, et générer des vues basées sur le web en utilisant Canvas ou SVG. traduit de Vega - A Visualization Grammar (opens in a new tab)
Autres concepts d'analyse de données
Diagramme de flux de données UML
Un diagramme de flux de données UML est une représentation graphique d'un système qui montre comment les données circulent à travers le système. Il est utilisé pour modéliser les flux de données entre différentes entités d'un système.
Diagramme de relation de données (DRD)
Un diagramme de relation de données (DRD) est une représentation graphique des relations entre différentes entités d'un ensemble de données. Il est utilisé pour modéliser les relations entre différentes entités et comment elles sont connectées.
Schéma de modèle de données
Un schéma de modèle de données est un plan qui définit comment les données sont organisées et structurées dans une base de données. Il est utilisé pour définir les relations entre différentes entités et comment elles sont connectées.
Base de données à relations (ERD)
Une base de données à relations (ERD) est un modèle de base de données basé sur le modèle Entité-Relation (ERM). Il est utilisé pour créer une représentation visuelle des données et des relations entre différentes entités.