PowerQuery(パワークエリ)でグループ化により値を集計する方法を紹介します。基本的な使い方に合わせて複数条件での集計方法や複数列での集計方法を解説します。
テストデータを用いて使い方を解説していますので参考にしてみてください。
グループ化とは?
グループ化とは指定の列データでデータを集計する機能です。
例えば 列データ[会社] を切り口として 売上データの合計値 を集計すると下図のような結果となります。
同じ会社のデータが一つにまとめられて、それぞれ売上データの合計が集計されています。パワークエリではグループ化機能を利用することでこのようなデータの集計を簡単に行うことができます。
ある列の項目ごとに合計・平均・最大値・最小値・件数などを求めることができます!
グループ化による集計方法
グループ化の使い方
グループ化でのデータ集計では下記の3つの項目を選択することで値の集計を行います。
- グループ化する列 :集計するカテゴリー・項目を設定(「〇〇ごとの合計」の〇〇の部分)
- 集計方法 :合計・平均・最大・最小などの集計方法を設定
- 集計される値の列 :計算されるデータ列を設定
【使用手順】
- 任意の列をクリックして変換タブの「グループ化」をクリックする。
- グループ化する列と操作(集計方法)と集計されるデータ列を選択してOKをクリックする。
データ集計の手順
下図のデータから年度別の売上合計を集計します。
- 任意の列をクリックして変換タブの「グループ化」をクリックする。
- グループ化する列に[年度]、操作に[合計]、集計される列に[売上]を設定してOKをクリックする。※新しい列名は任意に設定する。
以上でグループ化によるデータ集計は完了です。下図のように年度別の売上合計が集計されています。
Sponsored link
複数条件・複数列でのグループ化
複数条件のデータ集計
複数条件のデータ集計を行う場合はグループ化設定の「詳細設定」を使用します。
詳細設定の「グループ化の追加」と「集計の追加」で集計する列と集計条件を増やすことができます。
- グループ化の追加: 集計する条件の追加
- 集計の追加: 集計する列とその集計方法の追加
【使用手順】
- 任意の列をクリックして変換タブの「グループ化」をクリックする。
- 「詳細設定」を選択する。
- 「グループ化の追加」または「集計の追加」をクリックして設定項目を追加する。
- グループ化する列と操作(集計方法)と集計される列をそれぞれ選択してOKをクリックする。
データ集計の手順
下図のデータから年度別かつ会社別の合計売上と合計利益を集計します。
- 任意の列をクリックして変換タブの「グループ化」をクリックする。
- 「詳細設定」を選択する。
- 「グループ化の追加」と「集計の追加」をクリックして設定項目を追加する。
- グループ化する列と操作(集計方法)と集計される列を以下のように選択してOKをクリックする。
- グループ化する列:[年度] [会社]
- 操作:合計
- 集計される列:[売上] [利益]
以上で複数条件および複数列でのデータ集計は完了です。下図のように年度別かつ会社別の売上合計と利益合計が集計されています。
Sponsored link
集計方法(操作)の種類
グループ化機能では下記の8つの集計方法(操作)が用意されています。
- 合計
- 平均
- 中央
- 最大
- 最小
- 行数のカウント
- 個別の行数のカウント
- すべての行
それぞれの集計結果がどのようになるのかテストデータを用いて解説します。
合計
下図の元データに対して、集計方法を「合計」・グループ化する列を[グループ]・集計される列を[データ]として集計した結果は以下の通りです。A・B・Cでグループ化されたデータの合計値が集計されます。
平均・中央
下図の元データに対して、集計方法を「平均」または「中央」・グループ化する列を[グループ]・集計される列を[データ]として集計した結果は以下の通りです。A・B・Cでグループ化されたデータの平均値・中央値が集計されます。
最小・最大
下図の元データに対して、集計方法を「最小」または「最大」・グループ化する列を[グループ]・集計される列を[データ]として集計した結果は以下の通りです。A・B・Cでグループ化されたデータの最小値・最大値が集計されます。
行数のカウント
下図の元データに対して、集計方法を「行数のカウント」・グループ化する列を[グループ]として集計した結果は以下の通りです。A・B・Cのそれぞれの行数が集計されます。
個別の行数のカウント
下図の元データに対して、集計方法を「個別の行数のカウント」・グループ化する列を[グループ]として集計した結果は以下の通りです。A・B・Cにおいてユニークなデータの行数をカウントします。重複している行はまとめて1行としてカウントされます。
すべての行
下図の元データに対して、集計方法を「すべての行」・グループ化する列を[グループ]として集計した結果は以下の通りです。A・B・Cにおいてそれぞれの行列データがテーブルとして集計されます。
集計されたテーブルの中身を確認するにはそれぞれのセルをクリックすれば下図のように確認できます。また再度テーブルを展開したい場合は赤枠のボタンをクリックすることで行えます。
「すべての行」で集計することで集計結果毎(グループ毎)でインデックスを振ったり、集計結果毎(グループ毎)の累計・最新データ・標準偏差・最頻値を求めたりすることができます。
Sponsored link
パワークエリの学習本についてはコチラの記事でまとめてますので参考にしてみてください。
・初心者向けおすすめ学習本
・初中級者向けおすすめ学習本
コメント