PowerQuery(パワークエリ)でグループ化により値を集計する方法を紹介します。基本的な使い方に合わせて複数条件での集計方法や複数列での集計方法を解説します。
テストデータを用いて使い方を解説していますので参考にしてみてください。
グループ化とは?
グループ化とは指定の列データでデータを集計する機能です。
例えば 列データ[会社] を切り口として 売上データの合計値 を集計すると下図のような結果となります。
![](https://dono-log.com/wp-content/uploads/2023/08/画像1-9.png)
同じ会社のデータが一つにまとめられて、それぞれ売上データの合計が集計されています。パワークエリではグループ化機能を利用することでこのようなデータの集計を簡単に行うことができます。
1つの条件でのグループ化 集計
1条件のデータ集計
グループ化でのデータ集計では下記の3つの項目を選択することでデータ集計を行うことができます。
- グループ化するデータ列
- 集計されるデータ列
- 集計方法(操作)
【使用手順】
- 任意の列をクリックして変換タブの「グループ化」をクリックする。
- グループ化する列と操作(集計方法)と集計されるデータ列を選択してOKをクリックする。
![](https://dono-log.com/wp-content/uploads/2023/08/画像2-7.png)
データ集計の手順
下図のデータから年度別の売上合計を集計します。
![](https://dono-log.com/wp-content/uploads/2023/08/画像3-5.png)
- 任意の列をクリックして変換タブの「グループ化」をクリックする。
- グループ化する列に[年度]、操作に[合計]、集計される列に[売上]を設定してOKをクリックする。※新しい列名は任意に設定する。
![](https://dono-log.com/wp-content/uploads/2023/08/画像4-7.png)
以上でグループ化によるデータ集計は完了です。下図のように年度別の売上合計が集計されています。
![](https://dono-log.com/wp-content/uploads/2023/08/画像5-7-1024x112.png)
Sponsored link
複数条件・複数列でのグループ化 集計
複数条件のデータ集計
複数条件のデータ集計を行う場合はグループ化設定の「詳細設定」を使用します。
詳細設定の「グループ化の追加」と「集計の追加」で集計する列と集計条件を増やすことができます。
- グループ化の追加: 集計する条件の追加
- 集計の追加: 集計する列とその集計方法の追加
【使用手順】
- 任意の列をクリックして変換タブの「グループ化」をクリックする。
- 「詳細設定」を選択する。
- 「グループ化の追加」または「集計の追加」をクリックして設定項目を追加する。
- グループ化する列と操作(集計方法)と集計される列をそれぞれ選択してOKをクリックする。
![](https://dono-log.com/wp-content/uploads/2023/08/画像6-5.png)
データ集計の手順
下図のデータから年度別かつ会社別の合計売上と合計利益を集計します。
![](https://dono-log.com/wp-content/uploads/2023/08/画像7-4-1024x246.png)
- 任意の列をクリックして変換タブの「グループ化」をクリックする。
- 「詳細設定」を選択する。
![画像に alt 属性が指定されていません。ファイル名: 8-5.png](https://dono-log.com/wp-content/uploads/2023/08/image-5.png)
- 「グループ化の追加」と「集計の追加」をクリックして設定項目を追加する。
- グループ化する列と操作(集計方法)と集計される列を以下のように選択してOKをクリックする。
- グループ化する列:[年度] [会社]
- 操作:合計
- 集計される列:[売上] [利益]
![](https://dono-log.com/wp-content/uploads/2023/08/画像9-3.png)
以上で複数条件および複数列でのデータ集計は完了です。下図のように年度別かつ会社別の売上合計と利益合計が集計されています。
![](https://dono-log.com/wp-content/uploads/2023/08/画像10-2-1024x160.png)
Sponsored link
操作・集計方法の種類
グループ化機能では下記の8つの集計方法(操作)が用意されています。
- 合計
- 平均
- 中央
- 最大
- 最小
- 行数のカウント
- 個別の行数のカウント
- すべての行
それぞれの集計結果がどのようになるのかテストデータを用いて解説します。
合計
下図の元データに対して、集計方法を「合計」・グループ化する列を[グループ]・集計される列を[データ]として集計した結果は以下の通りです。A・B・Cでグループ化されたデータの合計値が集計されます。
![](https://dono-log.com/wp-content/uploads/2023/08/画像14-2.png)
![](https://dono-log.com/wp-content/uploads/2023/08/画像15-2.png)
平均・中央
下図の元データに対して、集計方法を「平均」または「中央」・グループ化する列を[グループ]・集計される列を[データ]として集計した結果は以下の通りです。A・B・Cでグループ化されたデータの平均値・中央値が集計されます。
![](https://dono-log.com/wp-content/uploads/2023/08/画像14-3.png)
![](https://dono-log.com/wp-content/uploads/2023/08/画像16-1.png)
最小・最大
下図の元データに対して、集計方法を「最小」または「最大」・グループ化する列を[グループ]・集計される列を[データ]として集計した結果は以下の通りです。A・B・Cでグループ化されたデータの最小値・最大値が集計されます。
![](https://dono-log.com/wp-content/uploads/2023/08/画像18-1.png)
![](https://dono-log.com/wp-content/uploads/2023/08/画像19-1.png)
![](https://dono-log.com/wp-content/uploads/2023/08/画像20-1.png)
行数のカウント
下図の元データに対して、集計方法を「行数のカウント」・グループ化する列を[グループ]として集計した結果は以下の通りです。A・B・Cのそれぞれの行数が集計されます。
![](https://dono-log.com/wp-content/uploads/2023/08/画像14-4.png)
![](https://dono-log.com/wp-content/uploads/2023/08/画像21-2.png)
個別の行数のカウント
下図の元データに対して、集計方法を「個別の行数のカウント」・グループ化する列を[グループ]として集計した結果は以下の通りです。A・B・Cにおいてユニークなデータの行数をカウントします。重複している行はまとめて1行としてカウントされます。
![](https://dono-log.com/wp-content/uploads/2023/08/画像14-5.png)
![](https://dono-log.com/wp-content/uploads/2023/08/画像22-1.png)
すべての行
下図の元データに対して、集計方法を「すべての行」・グループ化する列を[グループ]として集計した結果は以下の通りです。A・B・Cにおいてそれぞれの行列データがテーブルとして集計されます。
![](https://dono-log.com/wp-content/uploads/2023/08/画像23-1.png)
集計されたテーブルの中身を確認するにはそれぞれのセルをクリックすれば下図のように確認できます。また再度テーブルを展開したい場合は赤枠のボタンをクリックすることで行えます。
![](https://dono-log.com/wp-content/uploads/2023/08/画像24-1.png)
「すべての行」で集計することで集計結果毎(グループ毎)でインデックスを振ったり、集計結果毎(グループ毎)の累計・最新データ・標準偏差・最頻値を求めたりすることができます。
Sponsored link
パワークエリの学習本についてはコチラの記事でまとめてますので参考にしてみてください。
・初心者向けおすすめ学習本
・初中級者向けおすすめ学習本
コメント