ore Concepts in Data Analysis and Business Intelligence(BI)
データ分析とBI用語
データ分析には、有用な情報を抽出し、結論を導き、意思決定を支援するために、データを検査、クリーニング、変換、モデル化することが含まれます。ビジネスインテリジェンス(BI)は、ビジネスデータを分析し、アクションを起こすためのインサイトを提供するために使用される戦略と技術を指します。
カテゴリカル変数
カテゴリカル変数は、独立したカテゴリまたはグループで構成される定性データを表す変数です。たとえば、車の所有者のデータセットでは、車のメーカー(トヨタ、フォード、ホンダなど)はカテゴリカル変数です。
比較
比較は、2つ以上のデータセット、変数、またはグループの間の違いと類似点を調べるデータ分析の方法です。これにより、データのパターン、トレンド、関係性を特定することができます。
連続変数
連続変数は、特定の範囲内で無限の値を取ることができる変数です。たとえば、市内の気温は1日を通して連続変数であり、最低気温と最高気温の間の任意の値を取ることができます。
フィールド
フィールドは、データの特定の属性または特性を表すデータセット内の列です。ビジネスインテリジェンスでは、データをBIソフトウェアにインポートした後、フィールドがデータ列に割り当てられます。
タイプ
データ型は、変数が保持できる値の種類を定義します。たとえば、整数、文字列、日付などがあります。 BIでは、データ型に役割が割り当てられ、寸法または尺度のいずれかになります。
データフィルタリング
データフィルタリングとは、指定された基準に基づいてデータサブセットを抽出するプロセスです。これにより、分析者は大規模なデータセット内の特定の情報に焦点を合わせることができます。
データセット
データセットは、データ分析と可視化のソースとして機能するデータのコレクションです。通常、データセットは、ビジネス問題を解決するために必要な情報を提供することが目的です。## データ可視化
データ可視化とは、複雑な情報を素早く明確に表示するために設計されたデータのグラフィカルな表現です。一般的な形式には、棒グラフ、折れ線グラフ、円グラフ、散布図などがあります。
分布
データ分析における分布とは、データが異なる値やカテゴリにどのように広がっているかを指します。分布の解析により、変数間のパターン、傾向、関係性が明らかになります。
探索的データ分析
探索的データ分析(EDA)とは、データ分析の初期段階で、統計的および視覚化ツールを使用してデータ内のパターン、異常値、および関係性を特定することです。
機能
BIツールの文脈での機能とは、エンドユーザーに提供される機能です。機能はソフトウェアのインターフェースのタブやメニューを通じてアクセスできることが多いです。
測定値と寸法
ビジネスインテリジェンスにおいて、測定値とは、売上高などの数量化できるデータフィールドの数値です。一方、寸法とは、製品名や日付などのデータフィールドの質的な値です。
関係性
データ分析における関係性とは、2つ以上の変数の接続または相関関係を指します。たとえば、会社のデータにおける広告費と売上高の関係性です。
ソート
ソートとは、特定の順序(アルファベット順、昇順、降順など)でデータを整理する方法です。これにより、パターンを特定したり、データを理解しやすくしたりすることができます。
要約
データの要約には、カウント、合計、平均、最大値、最小値などのメトリクスを含むデータセットの統計的要約を作成することが含まれます。これにより、データの特性の概要を把握することができます。
変数
変数とは、データセット内のフィールドの測定値または属性です。変数は、連続型、カテゴリ型、またはその両方の組み合わせである可能性があります。