Tableau Prep Builder(タブロープレップ)で重複削除と重複カウント(抽出)の方法を紹介します。複数列で重複している行の削除方法も合わせて解説しています。
重複データの削除・抽出
1つのフィールドで重複しているレコードを削除・抽出する手順を解説します。例として下図の列1の重複行を削除します。
- 処理フローにクリーニングステップを追加する。
- 重複を削除したい対象フィールドを選択する。ここではフィールド「1」を選択します。
- 「重複行の特定」をクリックする。
作成された「重複する行はありますか?」で「・・・」をクリックして「フィルター」から「選択した値」を選択する。
フィルターの保持で、「一意」にチェックを入れて完了をクリックする。※重複している行を抽出する場合には「重複」にチェックを入れる。
結果としては下図のように列「1」で一意の値の「A」「B」「C」の行が残っています。
Sponsored link
複数列の重複データの削除・抽出
複数のフィールドが重複している(同じ値)のレコードを削除・抽出する手順を解説します。例として下図の列「1」と列「2」の2つの列で重複している行を削除します。
- 処理フローにクリーニングステップを追加する。
- 重複行を削除したい複数フィールドをCtrlキー押しながら複数選択する。ここではフィールド「1」「2」を複数選択します。
- 「重複行の特定」をクリックする。
作成された「重複する行はありますか?」で「・・・」をクリックして「フィルター」から「選択した値」を選択する。
フィルターの保持で、「一意」にチェックを入れて完了をクリックする。※重複している行を抽出する場合には「重複」にチェックを入れる。
結果としては下図のように列「1」と列「2」の2つの列の組み合わせで一意の値の行が残っています。
Sponsored link
重複行のカウント
重複している行数(レコード数)をカウントするを手順を解説します。例として下図の列1の重複行をカウントします。
- 処理フローにクリーニングステップを追加する。
- 重複を削除したい対象フィールドを選択する。ここではフィールド「1」を選択します。
- 「重複行の特定」をクリックする。
- 処理フローに集計ステップを追加する。
- 追加フィールドペインにある「重複する行はありますか?」をグループ化したフィールドにドロップする。
- 追加フィールドペインにある「行数」を集計フィールドにドロップする。集計方法はSUMとする。
以上で重複行のカウントは完了です。下図のように重複行は4行という結果がわかります。
Sponsored link
まとめ
今回はTableau Prepでの重複データの削除(抽出)の方法を紹介しました。Tableau Prepのステップ毎の使い方や他の処理別の対応方法なども解説していますのでご参考にしてください。
Tableau(タブロー)の学習本についてはコチラの記事でまとめてますので参考にしてみてください。
Tableau prep おすすめ学習書
コメント