PowerQuery 重複データの削除と抽出|複数条件・順番変更

PowerQuery(パワークエリ)で重複データを削除・抽出する方法ついて紹介します。複数列での重複データの処理や重複データを上から削除する方法も合わせて解説しています。

目次

重複データの削除

重複データの削除を行うには、行の削除にある「重複の削除」を使用します。これにより、重複データのうち下側のデータが削除されます。

  1. 重複を削除したい列をクリックして選択する。
  2. ホームタブにある「行の削除」の中の「重複の削除」を選択する。
重複をチェックする列を選択する

重複をチェックしたい列をクリックして選択する。

重複データを削除する

ホームタブにある「行の削除」の中の「重複の削除」をクリックする。

重複データ削除の完了

以上で重複データの削除の完了です。重複データの内の下側にあるデータが削除されます。

複数列の重複削除

複数列で重複しているデータを削除するには、重複をチェックする全ての列を複数選択したあと「重複の削除」を使用します。

  1. 重複を確認したい全ての列をCtrlキーを押しながらクリックして複数選択する。
  2. ホームタブにある「行の削除」の中の「重複の削除」を選択する。
重複をチェックする複数列を選択する

重複をチェックしたい全ての列のヘッダーをCtrlキーを押しながらクリックして選択する。

重複データを削除する

ホームタブにある「行の削除」の中の「重複の削除」をクリックする。

複数列の重複データ削除の完了

以上で複数列の重複データ削除の完了です。列2と列3の両方が重複しているデータのみが削除されます。

Sponsored link

重複データを上から削除する(最新を残す)

重複の削除を行う場合、通常は重複したデータの下側のデータが削除されます。ここでは、上側のデータを削除して下のデータ(最新のデータ)を残す方法を紹介します。手順は以下の通りです。

  1. 変換タブの「行の反転」を選択して、行の上下を入れ替える。
  2. 重複を削除したい列を全てクリックして選択する。
  3. ホームタブにある「行の削除」の中の「重複の削除」を選択する。
テーブルの行データを上下反転させる

変換タブの「行の反転」を選択して、行の上下を入れ替える。

重複をチェックする列を選択する

重複をチェックしたい列をクリックして選択する。

重複データを削除する

ホームタブにある「行の削除」の中の「重複の削除」をクリックする。

上側の重複データ削除の完了

以上で上にある重複データ削除の完了です。下図のように重複データのうち一番下にあったデータ(最新データ)が残ります。

Sponsored link

データ並べ替え後の重複データ削除

重複の削除を行う場合に、データを並べ替えて削除するデータを変更する方法を紹介します。
単純にデータを並べ替えた後に重複削除すると並べ替える前のテーブルで重複削除されてしまい上手くいきません。そこで、下記の手順にあるようにTable.Buffer関数を用いてテーブルが変更されないようにします。

  1. データを任意の順番で行を並べ替える。
  2. 並べ替え後のテーブルの数式をTable.Buffer()で囲んで、テーブルが変更されないようにする。
  3. 重複を削除したい列をクリックして選択する。
  4. ホームタブにある「行の削除」の中の「重複の削除」を選択する。
テーブルのデータを並べ替える

データを並べ替えた後に重複を削除する例として、下図のデータを列3で並べ替えてから重複を削除します。

  1. 並べ替えを行う列をクリックして選択する。
  2. ホームタブの並べ替えのボタンをクリックしてデータを並べ替える。ここでは昇順をクリックする。
テーブルが変更されないように修正する

並べ替えを実行した後の数式バーの式「Table.Sort(変更された型,{{“列3”, Order.Ascending}})」をTable.Buffer()で囲みます。これにより重複データ削除を行うときに並べ替え後のテーブル状態を維持することができます。

重複データを削除する

重複を削除したい列を選択した後、ホームタブにある「行の削除」の中の「重複の削除」をクリックする。

並べ替え後の重複データ削除の完了

以上で並べ替え後の重複データ削除の完了です。並べ替え後に重複データで一番上にあるデータが残ります。

Sponsored link

重複データの抽出

重複データの抽出を行うには、行の保持にある「重複の保持」を使用します。これにより、重複データのみを抽出することができます。

  1. 重複を抽出したい列をクリックして選択する。
  2. ホームタブにある「行の保持」の中の「重複の保持」を選択する。
重複データを抽出する

重複を抽出したい列を選択した後、ホームタブにある「行の保持」の中の「重複の保持」をクリックする。ここでは列2で重複の保持を行います。

重複データ抽出の完了

以上で重複データの抽出の完了です。列2の中で重複しているBの行が抽出されます。

Sponsored link

まとめ

今回は重複データを削除・抽出する方法について紹介しました。複数列の重複を削除する方法や削除する重複データを変更する方法も合わせて解説しました。それぞれの基本的な手順は以下の通りです。

  1. 重複削除:対象列を選択して「重複の削除」を使用
  2. 複数列の重複削除:複数列を全て選択して「重複の削除」を使用
  3. 上から重複データを削除する:「行の反転」でテーブルを反転させた後に重複削除
  4. 並べ替えたデータで重複削除:並べ替えたテーブルの式をTable.Buffer()で囲んだ後に重複削除
  5. 重複抽出:対象列を選択して「重複の保持」を使用
Power Queryのおすすめ書籍

パーワークエリの基本的な使い方についての初心者向けの解説書です。基本を体系的に学ぶと習得も早くなりますので、気になった方はサンプルを確認してみてください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

仕事、お金、旅行のことなどメモしてます。
仕事ではTableauを勉強中!
初心者にもわかりやすいように学んだことを発信していきます。

コメント

コメントする

コメントは日本語で入力してください。(スパム対策)

CAPTCHA

目次