Tableau Prepのフローの基本的な使い方を初心者向けに解説します。データの取り込みからデータのクリーニング、結合、出力までの全体像(概要)を説明しようと思います。
私自身が勉強中なので 初心者にもわかりやすいように気をつけてます。是非 Tableau Prepを使い始めた方は参考にしてもらえるとうれしいです。
Tableau Prep Builder とは?
Tableau Prep Builderとはデータ分析のためデータ加工・前処理をするツールです。例えば、複数のデータを組み合わせたり 不要な列データを削除したり データを集計して新たな値を準備したりできます。これにより分析用のデータを必要なデータのみを無駄なく準備することができます。
Tableau Prepのデータ処理は以下のように図で表された処理フローを使って行います。ひとつひとつのアイコンが処理ステップを表していて左から右にデータが流れていき処理が行われます。
Tableau Prep 使用方法の概要 (全5ステップ)
Tableau Prepでは大まかには以下の順番でデータ処理を進めます。
まずはTableau Prepで処理するデータを準備します。ExcelやAccessなど幅広いファイル形式が使用できます。
Tableau Prepに入力ステップを使ってデータを取り込みます。複数のデータファイルを取り込むことが可能です。
取り込んだデータに誤字脱字を含めて問題がないか確認する。
加工ステップを使って データの不要なフィールドを削除したりデータ形式を修正したり複数のデータを結合・集計したりします。
出力ステップを使って加工したデータを出力します。
Tableau Prep 基本的な使い方(実践解説)
使用データの用意
まずは分析用データを準備します。今回は以下の2つのExcelデータ(東京.xlsx,大阪.xlsx)を使ってデータの前処理を実践していきます。
データの取り込み方法
次にTableau Prepにデータを取り込みます。
接続ペイン(接続エリア)で「+」マークをクリック
接続ペインに並んでいるファイル形式から選択する。ここでは「Microsoft Excel」を選択する。
加工を行うデータファイルを選択します。ここでは下図のファイルを選択します。
ファイルの内にある複数データ(シート)がある場合は 使用するデータをフローペインにドラッグ&ドロップします。
詳しいデータ取り込みの方法はこちらの記事で紹介していますので、よかったら参考にしてみてください。
データの内容確認
次は取り込んだデータに問題や不備がないかプロファイルペインを確認します。
今回のデータを確認した結果、以下のような不備があり修正点としてメモします。
- フィールド構成が異なる(「担当者」「支店」は片方にしかない)
- フィールド名が異なる
- 値に余計な文字が含まれている
データ加工|クリーニング方法
次にデータのクリーニングをしてデータ構成を整えます。不要なフィールドの削除 と 新規フィールドの追加を行いフィールド名 と 値 と データ型の変更を行います。
入力ステップの「+」マークをクリックしてクリーニングステップを追加する。
プロファイルペインに並んでいるフィールドから不要なフィールドを右クリックして「削除」を選択する。ここでは大阪データの「担当者」フィールドを削除する。
プロファイルペインの「・・・」→「新規フィールドの作成」をクリックして フィールド名と値(ここでは「支店」「”大阪”」)を入力して保存します。
プロファイルペインのフィールド名をダブルクリックして直接編集する。ここでは東京データの「販売数」を「販売数量」に変更します。
処理するフィールドの「・・・」をクリックして「クリーニング」→「文字の削除」を選択する。
処理するフィールドのデータ型をクリックして変更するデータ型を選択する。(ここでは売上を「数値(少数」に変更する)
詳しいデータクリーニングの方法はこちらの記事で紹介していますので、よかったら参考にしてみてください。
データ加工|結合方法
複数ファイルのデータをひとつにまとめます。今回はデータ構造と内容を整えたので「ユニオンステップ」を使用してデータを結合します。
データをドラッグしてもう一方のデータ上に持ってくると「ユニオン」と表示がでるので そこにドロップする。
結合が正しくできているか確認する。「ユニオン」では同じデータ型で同じ名前のフィールド(列)が結合される。
フィールドに示されているバーの色でどのデータが含まれているか確認できる。
結合できなかった箇所を修正する。例えば フィールド名やデータ型が異なり結合できないという問題点があった場合は 結合したいフィールド同士をドラッグ&ドロップすれば結合することができる。
詳しいデータ結合の方法はこちらの記事で紹介していますので、よかったら参考にしてみてください。
データの出力方法
最後に出力ステップで処理が完了したデータを出力します。
ステップにある「+」マークをクリックして出力ステップを追加する。
プロファイルペインの「参照」ボタンを押してファイル名と保存場所を指定する。
出力ステップにある「▷」ボタンをクリックする。またはプロファイルペインの「フロー実行」をクリックする。
これでTableau Prepによるデータ入力・加工・出力が完了です。出力したデータはTableau Desktop等でデータ分析・可視化に使用してください。
まとめ
Tableau Prep入門者・初心者のために基本的な使い方をご紹介しました。大まかな使い方の流れは掴めたでしょうか?
Tableau Prepはデータ処理をステップの組み合わせで作ることができるので直観的かつ簡単にデータの前処理をすることができます。データ処理の全体像が図でわかるので 他の人が作ったフローや自分が前に作ったフローの内容も理解がしやすく 修正・変更がやりやすいです。
一度使ってみると便利さや使いやすさがわかると思いますので機会があれば是非挑戦してみてください!
Tableau(タブロー)の学習本についてはコチラの記事でまとめてますので参考にしてみてください。
Tableau prep おすすめ学習書
コメント