Skip to content
RATH
データを探索する
Explore Data with Data Painter

データ ペインタでデータを調べる

Data Painter は RATH の創造的かつ強力な機能であり、データ クリーニング、データ モデリング、およびデータ探索のためのペインタのようなインターフェイスとツールを提供します。

このチュートリアルでは、セミオート エクスプロレーション の章の例を引き続き使用し、「バイク シェアリング」データセットの異常を調べます。

前提条件

データ ペインタでチャートを編集するには、任意のチャートの上部にある [データ ペインタ] ボタンをクリックします。

異常を検出して調査する

「バイクシェアリング」のデータセットの場合、「カジュアル」ユーザーと「登録済み」ユーザーの関係を調べていました。

RATH によって生成されたビジュアライゼーションの中で、説明のつかない異常を含むグラフィックを簡単に特定できます。

このグラフ (「登録済み」、「カジュアル」、「平日」、「曜日」) は、平日または休日の月曜日から日曜日までのカジュアル ユーザーと登録ユーザーの関係を示しています。 ただし、このチャートには明らかな異常がいくつかあります。

これらの異常が存在する理由を調査したいと考えています。 このタスクを完了するには、グラフの上部にある [データ ペインタ] ボタンをクリックします。

[データ ペインタ] タブで、マウスをドットの上に移動して、異常ドットをオレンジ色に着色します。

次に、下にスクロールして [検索] ボタンをクリックし、ペイントしたデータを調べます。 Next ボタンと Last ボタンをクリックして、RATH によって自動的に生成されたビジュアライゼーションを調べます。

最初のグラフは、例外 (オレンジ色のドット) が、いくつかの休日に自転車共有サービスを使用している登録ユーザーであることを示しています。 (登録済み = 1、休日 = はい)

[次へ] ボタンをクリックすると、次のグラフは異常 (オレンジ色の点) も営業日に自転車共有サービスを使用する登録ユーザーであることを示しています。 (登録済み = 1、営業日 = はい)

これは、一部の休日が営業日であることを意味し (月曜、火曜、または金曜が休日になる場合もあります)、例外を徹底的に説明します。

きれいなデータ

データ クリーニングは、データ セット内のエラーやその他の問題を修正するプロセスです。 従来、データ クリーニングは実行が複雑でした。

Data Painter は、直感的で視覚的な方法でこのプロセスを簡素化します。

  1. クリア ペインティング ボタンをクリックして、データの既存のペインティングを一掃します。

  2. 右上隅で [消去] を選択し、お好みのブラシ サイズを指定します。

  3. チャートから消去するドットを見つけます。 カーソルを押したまま、消去する領域をドラッグします。

  4. (オプション) [データの同期] ボタンをクリックして、データセットへの変更を下のビジュアライゼーションに渡すことができます。

グループデータ

データのグループ化は、さらに処理するためにデータをさまざまなグループに編成およびバンドルする一般的な機能です。 ドットをさまざまな色で色付けすることにより、Data Painter でデータを簡単にグループ化できます。

[検索] ボタンの横にある [探索] ボタンをクリックすると、データ グループを探索できます。

その後、Tableau に似たインターフェイスでデータ グループを探索できます。