기본 개념
데이터 분석 및 BI 용어
범주형 변수
데이터 필드에 할당된 레이블.예를 들어, 선거인단을 나타내는 데이터셋을 고려하면 두 개의 범주형 변수, 즉 투표한 사람과 투표하지 않은 사람이 있습니다.
비교
서로 다른 두 변수 집합을 비교하여 데이터를 분석하는 방법입니다.
연속 변수
연속 값 범위를 가진 데이터.9월에 기록된 총 강우량을 예로 들 수 있습니다.
필드
비즈니스 인텔리전스에서는 데이터를 가져온 후 BI 소프트웨어가 데이터의 열을 여러 필드에 할당합니다.
유형
데이터 유형은 정수, 문자열, 날짜 등으로 정의할 수 있으며 역할은차원 또는 측정일 수 있습니다.
데이터 필터링
특정 데이터 하위 집합을 필터링하여 데이터를 분석하는 방법입니다.
데이터세트
데이터 시각화를 위한 소스 역할을 하는 데이터 모음입니다.
데이터 시각화
시각적 형태로 표시되는 데이터.이해하기 쉽고 유익하며 통찰력 있는 콘텐츠를 염두에 두고 청중에게 일반적으로 제시됩니다.
치수
비즈니스 인텔리전스에서 차원은 이름 및 날짜와 같은 데이터 필드의 질적 값을 의미합니다.
배포
정보의 상관 관계를 설명하고 변수 간의 상호 작용을 파악하여 데이터를 분석하는 방법입니다.
탐색적 데이터 분석
데이터 분석의 첫 번째 단계는 패턴, 이상 현상을 발견하고 가정을 검증하는 것입니다.일반적으로 통계 및 시각화 도구의 지원이 필요합니다.
특징
RATH가 최종 사용자에게 제공하는 기능입니다.기능은 왼쪽 패널에 탭으로 나열됩니다.
측정
비즈니스 인텔리전스에서 측정값은 측정할 수 있는 데이터 필드의 숫자 값 (예: 숫자) 을 의미합니다.
관계
두 개 이상의 데이터 변수 간의 상관 관계 연결.예를 들어, 석유 가격 대비 전 세계 총 석유 생산량.
정렬
알파벳 순서 또는 가장 작은 순서에서 가장 큰 순서와 같은 특정 순서로 데이터를 구성하여 데이터를 분석하는 방법입니다.
요약
통계 요약을 생성하여 데이터를 분석하는 방법입니다.예를 들면 count
, sum
, mean
, maximum
, minimum
.
변수
필드의 측정값 또는 속성.
RATH 기능
차트
RATH가 AI로 생성하고 추천하는 데이터 시각화 차트입니다.차트는 선형 차트, 스캐터 차트, 막대 차트, 파이 차트 등일 수 있습니다.
그래픽 워커
Tableau를 대체할 수 있는 오픈 소스 모듈입니다.또한 RATH 내에수동 탐색 기능으로 통합되어 있습니다.
수동 탐색
지정된 차트를 수동으로 편집할 수 있는 Tableau와 유사한 인터페이스입니다.참조: 그래픽 워커.
메가 오토 익스플로레이션
이 모드에서 RATH는 사용자가 전혀 손을 대지 않아도 데이터 소스를 분석하고 데이터 시각화를 생성합니다.
반자동 탐험
이 모드에서 RATH는 데이터 분석 프로세스에서 사용자를 지원하는 데이터 탐색 부조종사 역할을 합니다.RATH는 사용자의 의도를 이해하고 관련 데이터 차트를 제안하며 데이터 소스에 대한 통찰력을 제공합니다.
베가
Vega는 대화형 시각화 디자인을 생성, 저장 및 공유하기 위한 선언적 언어인 시각화 문법입니다.Vega를 사용하면 시각화의 시각적 모양과 대화형 동작을 JSON 형식으로 설명하고 Canvas 또는 SVG를 사용하여 웹 기반 뷰를 생성할 수 있습니다. 베가 — 시각화 문법 (opens in a new tab) 중에서
기타 데이터 분석 개념
UML 데이터 흐름도
UML 데이터 흐름 다이어그램은 시스템을 통해 데이터가 흐르는 방식을 보여주는 시스템을 그래픽으로 표현한 것입니다.시스템에서 서로 다른 엔티티 간의 데이터 흐름을 모델링하는 데 사용됩니다.
**데이터 관계 다이어그램 (DRD) **
DRD (데이터 관계 다이어그램) 는 데이터 세트에 있는 서로 다른 엔티티 간의 관계를 그래픽으로 표현한 것입니다.서로 다른 엔티티 간의 관계와 이들이 연결되는 방식을 모델링하는 데 사용됩니다.
데이터 모델 스키마
데이터 모델 스키마는 데이터가 데이터베이스에서 구성되고 구조화되는 방식을 정의하는 청사진입니다.서로 다른 엔티티 간의 관계와 연결 방식을 정의하는 데 사용됩니다.
**엔티티 관계 데이터베이스 (ERD) **
엔티티 관계 데이터베이스 (ERD) 는 엔티티 관계 모델 (ERM) 을 기반으로 하는 데이터베이스 모델입니다.데이터를 시각적으로 표현하고 서로 다른 개체 간의 관계를 만드는 데 사용됩니다.