PowerQuery(パワークエリ)で重複データを削除・抽出する方法ついて紹介します。複数列での重複データの処理や重複データを上から削除する方法も合わせて解説しています。
重複データの削除
重複データの削除を行うには、行の削除にある「重複の削除」を使用します。これにより、重複データのうち下側のデータが削除されます。
- 重複を削除したい列をクリックして選択する。
- ホームタブにある「行の削除」の中の「重複の削除」を選択する。
重複をチェックしたい列をクリックして選択する。
ホームタブにある「行の削除」の中の「重複の削除」をクリックする。
以上で重複データの削除の完了です。重複データの内の下側にあるデータが削除されます。
複数列の重複削除
複数列で重複しているデータを削除するには、重複をチェックする全ての列を複数選択したあと「重複の削除」を使用します。
- 重複を確認したい全ての列をCtrlキーを押しながらクリックして複数選択する。
- ホームタブにある「行の削除」の中の「重複の削除」を選択する。
重複をチェックしたい全ての列のヘッダーをCtrlキーを押しながらクリックして選択する。
ホームタブにある「行の削除」の中の「重複の削除」をクリックする。
以上で複数列の重複データ削除の完了です。列2と列3の両方が重複しているデータのみが削除されます。
Sponsored link
重複データを上から削除する(最新を残す)
重複の削除を行う場合、通常は重複したデータの下側のデータが削除されます。ここでは、上側のデータを削除して下のデータ(最新のデータ)を残す方法を紹介します。手順は以下の通りです。
- 変換タブの「行の反転」を選択して、行の上下を入れ替える。
- 重複を削除したい列を全てクリックして選択する。
- ホームタブにある「行の削除」の中の「重複の削除」を選択する。
変換タブの「行の反転」を選択して、行の上下を入れ替える。
重複をチェックしたい列をクリックして選択する。
ホームタブにある「行の削除」の中の「重複の削除」をクリックする。
以上で上にある重複データ削除の完了です。下図のように重複データのうち一番下にあったデータ(最新データ)が残ります。
Sponsored link
データ並べ替え後の重複データ削除
重複の削除を行う場合に、データを並べ替えて削除するデータを変更する方法を紹介します。
単純にデータを並べ替えた後に重複削除すると並べ替える前のテーブルで重複削除されてしまい上手くいきません。そこで、下記の手順にあるようにTable.Buffer関数を用いてテーブルが変更されないようにします。
- データを任意の順番で行を並べ替える。
- 並べ替え後のテーブルの数式をTable.Buffer()で囲んで、テーブルが変更されないようにする。
- 重複を削除したい列をクリックして選択する。
- ホームタブにある「行の削除」の中の「重複の削除」を選択する。
データを並べ替えた後に重複を削除する例として、下図のデータを列3で並べ替えてから重複を削除します。
- 並べ替えを行う列をクリックして選択する。
- ホームタブの並べ替えのボタンをクリックしてデータを並べ替える。ここでは昇順をクリックする。
並べ替えを実行した後の数式バーの式「Table.Sort(変更された型,{{“列3”, Order.Ascending}})」をTable.Buffer()で囲みます。これにより重複データ削除を行うときに並べ替え後のテーブル状態を維持することができます。
重複を削除したい列を選択した後、ホームタブにある「行の削除」の中の「重複の削除」をクリックする。
以上で並べ替え後の重複データ削除の完了です。並べ替え後に重複データで一番上にあるデータが残ります。
Sponsored link
重複データの抽出
重複データの抽出を行うには、行の保持にある「重複の保持」を使用します。これにより、重複データのみを抽出することができます。
- 重複を抽出したい列をクリックして選択する。
- ホームタブにある「行の保持」の中の「重複の保持」を選択する。
重複を抽出したい列を選択した後、ホームタブにある「行の保持」の中の「重複の保持」をクリックする。ここでは列2で重複の保持を行います。
以上で重複データの抽出の完了です。列2の中で重複しているBの行が抽出されます。
Sponsored link
まとめ
今回は重複データを削除・抽出する方法について紹介しました。複数列の重複を削除する方法や削除する重複データを変更する方法も合わせて解説しました。それぞれの基本的な手順は以下の通りです。
- 重複削除:対象列を選択して「重複の削除」を使用
- 複数列の重複削除:複数列を全て選択して「重複の削除」を使用
- 上から重複データを削除する:「行の反転」でテーブルを反転させた後に重複削除
- 並べ替えたデータで重複削除:並べ替えたテーブルの式をTable.Buffer()で囲んだ後に重複削除
- 重複抽出:対象列を選択して「重複の保持」を使用
パワークエリの学習本についてはコチラの記事でまとめてますので参考にしてみてください。
・初心者向けおすすめ学習本
・初中級者向けおすすめ学習本
コメント