データ ペインタでデータを調べる
Data Painter は RATH の創造的かつ強力な機能であり、データ クリーニング、データ モデリング、およびデータ探索のためのペインタのようなインターフェイスとツールを提供します。
このチュートリアルでは、セミオート エクスプロレーション の章の例を引き続き使用し、「バイク シェアリング」データセットの異常を調べます。
前提条件
データ ペインタでチャートを編集するには、任意のチャートの上部にある [データ ペインタ] ボタンをクリックします。
異常を検出して調査する
「バイクシェアリング」のデータセットの場合、「カジュアル」ユーザーと「登録済み」ユーザーの関係を調べていました。
RATH によって生成されたビジュアライゼーションの中で、説明のつかない異常を含むグラフィックを簡単に特定できます。
このグラフ (「登録済み」、「カジュアル」、「平日」、「曜日」) は、平日または休日の月曜日から日曜日までのカジュアル ユーザーと登録ユーザーの関係を示しています。 ただし、このチャートには明らかな異常がいくつかあります。
これらの異常が存在する理由を調査したいと考えています。 このタスクを完了するには、グラフの上部にある [データ ペインタ] ボタンをクリックします。
[データ ペインタ] タブで、マウスをドットの上に移動して、異常ドットをオレンジ色に着色します。
次に、下にスクロールして [検索] ボタンをクリックし、ペイントしたデータを調べます。 Next ボタンと Last ボタンをクリックして、RATH によって自動的に生成されたビジュアライゼーションを調べます。
最初のグラフは、例外 (オレンジ色のドット) が、いくつかの休日に自転車共有サービスを使用している登録ユーザーであることを示しています。 (登録済み
= 1、休日
= はい)
[次へ] ボタンをクリックすると、次のグラフは異常 (オレンジ色の点) も営業日に自転車共有サービスを使用する登録ユーザーであることを示しています。 (登録済み
= 1、営業日
= はい)
これは、一部の休日が営業日であることを意味し (月曜、火曜、または金曜が休日になる場合もあります)、例外を徹底的に説明します。
きれいなデータ
データ クリーニングは、データ セット内のエラーやその他の問題を修正するプロセスです。 従来、データ クリーニングは実行が複雑でした。
Data Painter は、直感的で視覚的な方法でこのプロセスを簡素化します。
-
クリア ペインティング ボタンをクリックして、データの既存のペインティングを一掃します。
-
右上隅で [消去] を選択し、お好みのブラシ サイズを指定します。
-
チャートから消去するドットを見つけます。 カーソルを押したまま、消去する領域をドラッグします。
-
(オプション) [データの同期] ボタンをクリックして、データセットへの変更を下のビジュアライゼーションに渡すことができます。
グループデータ
データのグループ化は、さらに処理するためにデータをさまざまなグループに編成およびバンドルする一般的な機能です。 ドットをさまざまな色で色付けすることにより、Data Painter でデータを簡単にグループ化できます。
[検索] ボタンの横にある [探索] ボタンをクリックすると、データ グループを探索できます。
その後、Tableau に似たインターフェイスでデータ グループを探索できます。