Skip to content
RATH
시작하기
기본 개념
Core Concepts

데이터 분석 및 비즈니스 인텔리전스 (BI)의 핵심 개념

데이터 분석 & BI 용어

데이터 분석은 유용한 정보를 추출하고 결론을 도출하고 의사 결정을 지원하기 위해 데이터를 검토, 정리, 변환 및 모델링하는 것을 말합니다. 비즈니스 인텔리전스 (BI)는 비즈니스 데이터를 분석하고 실용적인 인사이트를 제시하여 비즈니스 성과를 향상시키기 위해 사용되는 전략과 기술을 말합니다.

범주형 변수

범주형 변수는 서로 다른 범주나 그룹으로 이루어진 질적 데이터를 나타내는 변수입니다. 예를 들어, 차주 데이터세트에서 자동차 제조사(Toyota, Ford, Honda 등)는 범주형 변수입니다.

비교

비교는 데이터 분석에서 데이터 집합, 변수 또는 그룹간의 차이와 유사점을 조사하는 방법입니다. 이를 통해 데이터 간의 패턴, 추이 및 관계를 파악할 수 있습니다.

연속 변수

연속 변수는 주어진 범위 내에서 무한한 값들을 가질 수 있는 변수를 말합니다. 예를 들어, 도시의 기온은 하루 내내 어떤 값이든 가질 수 있으므로 연속 변수입니다.

필드

필드는 데이터의 특정 속성이나 특징을 나타내는 데이터 세트의 열을 말합니다. 비즈니스 인텔리전스에서는 데이터를 BI 소프트웨어로 가져온 후 필드를 데이터 열에 할당합니다.

유형

데이터 유형은 정수, 문자열, 날짜 등과 같은 변수가 보유할 수 있는 값의 종류를 정의합니다. BI에서는 데이터 유형에 역할이 할당됩니다. 이 역할은 차원(dimension) 또는 측정(measure)일 수 있습니다.

데이터 필터링

데이터 필터링은 지정된 기준에 따라 데이터 부분 집합을 추출하는 과정입니다. 이를 통해 분석가는 대형 데이터 집합에서 특정 정보에 집중할 수 있습니다.

데이터세트

데이터세트는 데이터 분석 및 시각화의 원본 데이터원으로서 여러 필드 또는 열을 포함하며 각각 다른 변수 또는 데이터 속성을 나타냅니다.## 데이터 시각화

데이터 시각화는 복잡한 정보를 빠르고 명확하게 제시하기 위해 디자인된 데이터의 그래픽적 표현입니다. 일반적인 형태로는 막대 그래프, 라인 차트, 파이 차트, 산점도 등이 있습니다.

분포

데이터 분석에서 분포는 데이터가 다양한 값 또는 범주에 걸쳐 퍼져있는 방식을 의미합니다. 분포를 분석하면 변수들간의 패턴, 추세, 관계를 파악하는 데 도움이 됩니다.

탐색적 데이터 분석

탐색적 데이터 분석(EDA)은 데이터 분석의 초기 단계로, 통계 및 시각화 도구를 사용하여 데이터의 패턴, 이상치, 관계 등을 파악하는 과정입니다.

기능

BI 도구의 문맥에서 기능은 최종 사용자가 사용할 수 있는 기능입니다. 기능은 보통 소프트웨어 인터페이스의 탭이나 메뉴를 통해 액세스할 수 있습니다.

측정치 vs 차원

비즈니스 인텔리전스에서 측정치는 매출액과 같은 수치적 데이터 필드의 수치값을 의미합니다. 반면에 차원은 제품 이름이나 날짜와 같은 데이터 필드의 질적 값입니다.

관계

데이터 분석에서 관계는 두 개 이상의 변수 간의 연결 또는 상관 관계를 의미합니다. 예를 들어, 회사 데이터에서 광고 비용과 매출액 사이의 관계입니다.

정렬

정렬은 특정한 순서(예: 알파벳순, 오름차순 또는 내림차순)로 데이터를 구성하는 방법입니다. 이를 통해 패턴을 파악하거나 데이터를 이해하기 쉽게 만들 수 있습니다.

요약

데이터 요약은 데이터셋의 통계적 요약을 만드는 것으로, "카운트", "합계", "평균", "최대값", "최소값"과 같은 지표를 포함합니다. 이는 데이터의 특징을 대략적으로 파악하는 데 도움이 됩니다.

변수

변수는 데이터셋의 필드의 측정치 또는 속성입니다. 변수는 연속적인, 범주적인 또는 둘 다의 조합일 수 있습니다.