Tableau Prep 重複行の削除・抽出|複数列処理とカウント

Tableau Prep Builder(タブロープレップ)で重複削除と重複カウント(抽出)の方法を紹介します。複数列で重複している行の削除方法も合わせて解説しています。

Tableau Prep Builder バージョン2024.1 を利用しています。

目次

重複データの削除・抽出

1つのフィールドで重複しているレコードを削除・抽出する手順を解説します。例として下図の列1の重複行を削除します。

STEP
「重複行の特定」を利用
  1. 処理フローにクリーニングステップを追加する。
  2. 重複を削除したい対象フィールドを選択する。ここではフィールド「1」を選択します。
  3. 「重複行の特定」をクリックする。
STEP
重複判別フィールドでフィルター

作成された「重複する行はありますか?」で「・・・」をクリックして「フィルター」から「選択した値」を選択する。

「重複する行はありますか?」には、選択したフィールドで重複している行には「重複」、重複していない行には「一意」という値が入っています。

STEP
重複行の削除・抽出

フィルターの保持で、「一意」にチェックを入れて完了をクリックする。※重複している行を抽出する場合には「重複」にチェックを入れる。

結果としては下図のように列「1」で一意の値の「A」「B」「C」の行が残っています。

Sponsored link

複数列の重複データの削除・抽出

複数のフィールドが重複している(同じ値)のレコードを削除・抽出する手順を解説します。例として下図の列「1」と列「2」の2つの列で重複している行を削除します。

STEP
「重複行の特定」を利用
  1. 処理フローにクリーニングステップを追加する。
  2. 重複行を削除したい複数フィールドをCtrlキー押しながら複数選択する。ここではフィールド「1」「2」を複数選択します。
  3. 「重複行の特定」をクリックする。

どのフィールドも選択せずに「重複行の特定」を利用すると全てのフィールドでの重複が特定されます。

STEP
重複判別フィールドでフィルター

作成された「重複する行はありますか?」で「・・・」をクリックして「フィルター」から「選択した値」を選択する。

「重複する行はありますか?」には、選択したフィールドで重複している行には「重複」、重複していない行には「一意」という値が入っています。

STEP
重複行の削除・抽出

フィルターの保持で、「一意」にチェックを入れて完了をクリックする。※重複している行を抽出する場合には「重複」にチェックを入れる。

結果としては下図のように列「1」と列「2」の2つの列の組み合わせで一意の値の行が残っています。

Sponsored link

重複行のカウント

重複している行数(レコード数)をカウントするを手順を解説します。例として下図の列1の重複行をカウントします。

STEP
「重複行の特定」を利用
  1. 処理フローにクリーニングステップを追加する。
  2. 重複を削除したい対象フィールドを選択する。ここではフィールド「1」を選択します。
  3. 「重複行の特定」をクリックする。
STEP
集計ステップでカウント
  1. 処理フローに集計ステップを追加する。
  2. 追加フィールドペインにある「重複する行はありますか?」をグループ化したフィールドにドロップする。
  3. 追加フィールドペインにある「行数」を集計フィールドにドロップする。集計方法はSUMとする。
STEP
重複行のカウント完了

以上で重複行のカウントは完了です。下図のように重複行は4行という結果がわかります。

Sponsored link

まとめ

今回はTableau Prepでの重複データの削除(抽出)の方法を紹介しました。Tableau Prepのステップ毎の使い方や他の処理別の対応方法なども解説していますのでご参考にしてください。

Tableau Prepのおすすめ書籍

Tableau(タブロー)の学習本についてはコチラの記事でまとめてますので参考にしてみてください。

Tableau prep おすすめ学習書

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

仕事、お金、旅行のことなどメモしてます。
仕事ではTableauを勉強中!
初心者にもわかりやすいように学んだことを発信していきます。

コメント

コメントする

コメントは日本語で入力してください。(スパム対策)

CAPTCHA

目次