Power BIでのヒストグラムの作り方を解説します。作成手順に合わせてグラフの編集方法や外れ値の除外などについても紹介しています。
ヒストグラムとは?特徴・使い方
ヒストグラムとはデータの個数の分布(頻度)を表したグラフです。
量的データをある区間ごとに区切り それぞれの区間にいくつデータがあるかを棒グラフの形で表現しています。データのばらつきを視覚的にわかりやすく表すことができます。
ヒストグラムを作成する際はデータを区切る幅(ビンの幅)を適切に設定する必要があります。大きすぎても小さすぎてもデータの分布の特徴がわかりずらくなってしまいますので注意してください。
ヒストグラムの作り方
ヒストグラムの作成には「集合縦棒グラフ」のビジュアルと「新しいグループ」の機能を利用します。
作成手順としては以下の4ステップです。
- 「集合縦棒グラフ」のビジュアルを追加する
- 「新しいグループ」を用いてヒストグラム用の「ビン」フィールドを作成する
- X軸とY軸にデータをセットする
- Y軸のデータの集計方法を「カウント」に変更する
ヒストグラムの作成手順
あるテストの点数データを用いて、下図のヒストグラムを作成します。
ヒストグラムの作成例として、下図の100名分のテスト点数のデータを用いてグラフを作成します。
視覚化エリアにある「集合縦棒グラフ」のアイコンをクリックしてビジュアルを追加する
- ヒストグラムで使用するデータを右クリックして「新しいグループ」をクリックする。
- グループの設定画面で任意の設定をしてOKをクリックする。ここではデフォルト設定のままとします。
グラフのX軸に作成したビンフィールド、Y軸にヒストグラムで表したいフィールドをドロップして設定する。
- X軸:点数(ビン)
- Y軸:点数
Y軸のデータの集計方法を「カウント」に変更します。以上でヒストグラムの作成は完了です。
- Y軸に設定してあるデータの下矢印のアイコンをクリックする。
- 「カウント」を選択する。
Sponsored link
ヒストグラムの設定項目・編集方法
下記の項目について紹介していますので参考にしてみてください。
- ビンの幅・サイズ
- 外れ値の処理
- 基準線(平均値・中央値)の追加
ビンの幅・サイズ
ビンの幅やサイズを変更する場合、下記の手順を行います。
- ビンのフィールドを右クリックして「グループの編集」を選択する。
- 編集画面で「ビンのサイズ」で任意の幅を入力してOKする。ビンのタイプで「ビンの数」を選択すれば数での指定も可能です。
一般的にはヒストグラムのビン数は下記のスタージェスの公式で導かれる数が目安とされています。ビンの幅は最大値から最小値の幅をkで割ることで求めます。
k = log2 N + 1 (k:ビンの数, N:データ数)
データ個数が100の場合はk=7.64となり、ビン数は7~8個が目安となります。
外れ値の除外・置換
データに異常値や外れ値が含まれていると正しくヒストグラムが作成できない場合があります。下図の例はテストの点数(0点~100点)のデータの中に500点の異常値が含まれた場合のヒストグラムです。確認したい0~100の範囲が潰れて確認できなくなっています。
このような場合は外れ値を除外したり置換するなどの処理をして対応します。処理の方法としては元データを修正するのが一番良いと思いますが、こちらでは新規フィールドの作成でデータを抽出する方法を紹介します。
新規フィールド作成による外れ値の処理
- モデリングタブの「新しい列」をクリックして新規フィールドを作成する。
- 新規フィールドの式で、IF文を用いて外れ値を除外または置換する条件式を作成する。
- 作成したフィールドを用いてヒストグラムを作り直す。
【例】
モデリングタブの「新しい列」をクリックして新規フィールドを作成する。
下記のような条件式を作成して外れ値を除外(置換)する。ここではテストの点は0~100の間なので、それ以外は外れ値として除外する式「点数(外れ値除外) = IF(‘Test'[点数] >= 0 && ‘Test'[点数] <= 100 ,’Test'[点数] ,BLANK())」を入力しています。
新規の列名 = IF ( 外れ値除外の条件式 , 利用データ , BLANK() ) ※置換する場合はBLANK()に任意の値を入れる。
作成した新規フィールドを用いてビンフィールドを作成してヒストグラムを再作成します。作成手順は上述した通りです。外れ値を除外することでヒストグラムが正しく描写できています。
基準線(縦線)の追加
ヒストグラムに平均線や中央値線などの縦の基準線を追加したい場合は下記の手順を行います。
- 分析のX軸の定数線を開いて「行の追加」をクリックする。
- 計算式のアイコンをクリックして基準線の設定をする(基準フィールドと集計方法)
- 線の書式設定・位置設定をする
【例】
- 視覚化エリアの分析アイコンをクリックする。
- X軸の定数線の中の「行の追加」をクリックする。
- 計算式のアイコンをクリックする。
- 設定画面の「基準にするフィールド」と「概要」で使用するフィールドを集計方法を選択する。
最後に基準線の書式設定を行い基準線の追加完了です。色や線のスタイルの他に網掛けの有無なども選択できますのでお好みで設定してみてください。
Sponsored link
まとめ
今回はPower BIでのヒストグラムの作り方とカスタマイズ方法を紹介しました。ヒストグラムは「集合縦棒グラフ」のビジュアルと「新しいグループ」の機能を用いて作成することができます。
ヒストグラムの編集方法として下記を紹介しましたが、それ以外にも多くの設定項目がありますのでご自身で色々いじってみて好みの見た目に編集してみてください。
- ビンの幅・サイズ
- 外れ値の処理
- 基準線(平均値・中央値)の追加
ヒストグラムとともに利用される機会が多い箱ひげ図についても作成方法を解説していますので、参考にしてみてくさだい。
コメント