PowerQuery グループ化による値の集計|複数条件・複数列

PowerQuery(パワークエリ)でグループ化により値を集計する方法を紹介します。基本的な使い方に合わせて複数条件での集計方法や複数列での集計方法を解説します。
テストデータを用いて使い方を解説していますので参考にしてみてください。

目次

グループ化とは?

グループ化とは指定の列データでデータを集計する機能です。

例えば 列データ[会社] を切り口として 売上データの合計値 を集計すると下図のような結果となります。

同じ会社のデータが一つにまとめられて、それぞれ売上データの合計が集計されています。パワークエリではグループ化機能を利用することでこのようなデータの集計を簡単に行うことができます。

1つの条件でのグループ化 集計

1条件のデータ集計

グループ化でのデータ集計では下記の3つの項目を選択することでデータ集計を行うことができます。

  • グループ化するデータ列
  • 集計されるデータ列
  • 集計方法(操作)

【使用手順】

  1. 任意の列をクリックして変換タブの「グループ化」をクリックする。
  2. グループ化する列と操作(集計方法)と集計されるデータ列を選択してOKをクリックする。

データ集計の手順

STEP
データ準備

下図のデータから年度別の売上合計を集計します。

STEP
グループ化によるデータ集計の設定
  1. 任意の列をクリックして変換タブの「グループ化」をクリックする。
  2. グループ化する列に[年度]、操作に[合計]、集計される列に[売上]を設定してOKをクリックする。※新しい列名は任意に設定する。
STEP
データ集計完了

以上でグループ化によるデータ集計は完了です。下図のように年度別の売上合計が集計されています。

Sponsored link

複数条件・複数列でのグループ化 集計

複数条件のデータ集計

複数条件のデータ集計を行う場合はグループ化設定の「詳細設定」を使用します。詳細設定の「グループ化の追加」と「集計の追加」を使用することで設定できる条件・列を増やし複数条件での集計が行えるようになります。

  • グループ化の追加: 集計する条件の追加
  • 集計の追加: 集計されるデータ列とその集計方法の追加

【使用手順】

  1. 任意の列をクリックして変換タブの「グループ化」をクリックする。
  2. 「詳細設定」を選択する。
  3. 「グループ化の追加」または「集計の追加」をクリックして設定項目を追加する。
  4. グループ化する列と操作(集計方法)と集計される列をそれぞれ選択してOKをクリックする。

データ集計の手順

STEP
データ準備

下図のデータから年度別かつ会社別の合計売上と合計利益を集計します。

STEP
グループ化の設定を詳細設定にする
  1. 任意の列をクリックして変換タブの「グループ化」をクリックする。
  2. 「詳細設定」を選択する。
画像に alt 属性が指定されていません。ファイル名: 8-5.png
STEP
複数条件および複数の集計列の設定
  1. 「グループ化の追加」と「集計の追加」をクリックして設定項目を追加する。
  2. グループ化する列と操作(集計方法)と集計される列を以下のように選択してOKをクリックする。
    • グループ化する列:[年度] [会社]
    • 操作:合計
    • 集計される列:[売上] [利益]
STEP
データ集計完了

以上で複数条件および複数列でのデータ集計は完了です。下図のように年度別かつ会社別の売上合計と利益合計が集計されています。

Sponsored link

操作・集計方法の種類

グループ化機能では下記の8つの集計方法(操作)が用意されています。

  • 合計
  • 平均
  • 中央
  • 最大
  • 最小
  • 行数のカウント
  • 個別の行数のカウント
  • すべての行

それぞれの集計結果がどのようになるのかテストデータを用いて解説します。

合計

下図の元データに対して、集計方法を「合計」・グループ化する列を[グループ]・集計される列を[データ]として集計した結果は以下の通りです。A・B・Cでグループ化されたデータの合計値が集計されます。

元データ
集計結果「合計」

平均・中央

下図の元データに対して、集計方法を「平均」または「中央」・グループ化する列を[グループ]・集計される列を[データ]として集計した結果は以下の通りです。A・B・Cでグループ化されたデータの平均値・中央値が集計されます。

元データ
集計結果「平均」・集計結果「中央」

最小・最大

下図の元データに対して、集計方法を「最小」または「最大」・グループ化する列を[グループ]・集計される列を[データ]として集計した結果は以下の通りです。A・B・Cでグループ化されたデータの最小値・最大値が集計されます。

元データ
集計結果「最小」
集計結果「最大」

行数のカウント

下図の元データに対して、集計方法を「行数のカウント」・グループ化する列を[グループ]として集計した結果は以下の通りです。A・B・Cのそれぞれの行数が集計されます。

元データ
集計結果「行数のカウント」

個別の行数のカウント

下図の元データに対して、集計方法を「個別の行数のカウント」・グループ化する列を[グループ]として集計した結果は以下の通りです。A・B・Cにおいてユニークなデータの行数をカウントします。重複している行はまとめて1行としてカウントされます。

元データ
集計結果「個別の行数のカウント」

すべての行

下図の元データに対して、集計方法を「すべての行」・グループ化する列を[グループ]として集計した結果は以下の通りです。A・B・Cにおいてそれぞれの行列データがテーブルとして集計されます。

元データ

集計されたテーブルの中身を確認するにはそれぞれのセルをクリックすれば下図のように確認できます。また再度テーブルを展開したい場合は赤枠のボタンをクリックすることで行えます。

集計結果「個別の行数のカウント」

「すべての行」で集計することで集計結果毎(グループ毎)でインデックスを振ったり、集計結果毎(グループ毎)の累計・最新データ・標準偏差・最頻値を求めたりすることができます。

Sponsored link

Power Queryのおすすめ書籍

パワークエリの学習本についてはコチラの記事でまとめてますので参考にしてみてください。

初心者向けおすすめ学習本

初中級者向けおすすめ学習本

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

仕事、お金、旅行のことなどメモしてます。
仕事ではTableauを勉強中!
初心者にもわかりやすいように学んだことを発信していきます。

コメント

コメントする

コメントは日本語で入力してください。(スパム対策)

CAPTCHA

目次