Tableau Prep Builder(タブロープレップ)の入力ステップの使い方、データソースへの接続方法を紹介します。複数ファイルを結合して読み込む方法やデータソースの置換方法なども合わせて解説しています。
データソースへの接続
ファイルへの接続
接続するファイルの形式を選択してデータソースへ接続する手順を解説します。ここでは例としてエクセルファイルを読み込みます。
- 「接続」をクリックする。
- 接続するファイル形式を選択する。ここではMicrosoft Excelを選択します。
ファイルを選択して「開く」をクリックする。
以上でファイルからのデータ入力は完了です。ファイルに複数のテーブルがある場合は、任意のテーブルをフローペインにドロップするとデータを追加することができます。
サーバー上のデータへの接続
サーバーにあるデータソースへ接続する手順を解説します。ファイルへの接続と同様の手順となります。
- 「接続」をクリックする。
- 接続するサーバーのデータベースへのコネクタを選択する。
※今回はTableau Serverに接続します。下にスクロールすると多数の接続可能なサーバーへのコネクタがあります。
サーバーに接続先情報(URL、IPアドレス、ポート番号など)と認証情報(ユーザ名、パスワードなど)を入力します。
サーバー内の使用するデータソースをフローペインにドロップすればサーバー上へのデータソース接続は完了です。
Sponsored link
複数ファイル・シートの読み込み(ワイルドカードユニオン)
ワイルドカードを用いて複数ファイルや複数シートをユニオンして読み込む手順を解説します。
ファルダから複数ファイルを読み込む
- 「接続」をクリックする。
- 接続するファイル形式を選択する。
- 読み込むファイルを選択して「開く」をクリックする。ここでは売上データ202404を選択します。最終的にはフォルダ内にある「売上データ2024」、「売上データ202405」、「売上データ202406」の3つのファイルをユニオンして読み込みます。
- 追加された入力ステップをクリックする。
- テーブルタブにある「複数のテーブルをユニオン」を選択する。
- 複数ファイルが格納してある場所(フォルダ)を設定する。
- 読み込む複数ファイルをフィルタする条件を設定する。ここではファイル名が「売上データ******.xlsx」と一致するという条件にしています。「*」はワイルドカードであり、どんな文字でも良い1文字を表しています。
ファイル名以外にも下記のようなファイルフィルタの条件が設定できます。新たなフィルタを追加する場合は「ファイル フィルターを追加」をクリックすればOK。
- ファイル名
- ファイルサイズ
- 作成日
- 更新日
- 「含まれるテーブル」に読み込みたい複数ファイルのみが選択されていることを確認する。※そうでなければフィルタ設定をやり直す。また、複数のワークシートを読み込みたい場合はワークシートフィルターも設定する。
- 「適用」をクリックする。
以上で複数ファイルの読み込みは完了です。下図のように1ファイルのみの読み込みだと3行のデータが3ファイルを読み込み9行となっています。
ファイルから複数シートを読み込む
- 「接続」をクリックする。
- 接続するファイル形式を選択する。
- 読み込むファイルを選択して「開く」をクリックする。ここでは売上データファイル内の「4月」、「5月」、「6月」の3つのシートをユニオンして読み込みます。
- 任意のシートをフローペインにドロップする。
- テーブルタブにある「複数のテーブルをユニオン」を選択する。
- 「ワークシート フィルターを追加」をクリックして「ワークシート名」を選択する。※ワークシート フィルターを設定しない場合は全てのワークシートが読み込まれます。
- 読み込むシートをフィルタする条件をシート名で設定する。ここではシート名が「*月」と一致するという条件にしています。「*」はワイルドカードであり、どんな文字でも良い1文字を表しています。
- 読み込みたいシートが「含まれるテーブル」に表示されていれば「適用」をクリックする。
以上で複数シートの読み込みは完了です。下図のように1シートの読み込みだと3行のデータが3つのシートが読み込まれ9行となっています。
Sponsored link
読み込みデータのフィルター・選択
読み込んだデータから不要なデータを除外して必要なデータのみを抽出する方法を解説します。読み込むデータ量を小さくすることで処理の時間を短縮することができるため、なるべくデータ量を小さくすることをおススメします。
フィールドを抽出・削除・非表示する
不要なフィールドを削除・非表示するには以下の手順で行います。
- 入力ステップを選択して「フィールドのリスト」をクリックする。
- 削除したいフィールドの上にマウスカーソルを移動させると3つのアイコンが表示され、真ん中の「✕」ボタンをクリックするとフィールドを削除することができます。
※削除済みのフィールドは横線が入り変更フィールドに履歴が残ります。
フィールドの非表示は下図のアイコンをクリックすると行うことができます。フィールドを非表示にするとデータ自体は読み込まれませんが、出力ファイルにはフィールドは引き続き含まれるといった状態になります。
Tableau Prepで特に処理を行わないフィールドに適用できると思います。
条件式で行データ(レコード)をフィルターする
不要なレコードはフィールドを選択してフィルターを設定することで除外することができます。行データのフィルターは以下の手順で行います。
- 入力ステップを選択して「フィールドのリスト」をクリックする。
- 削除したいフィールドの上にマウスカーソルを移動させると表示される「・・・」をクリックしてフィルターの「計算」を選択する。
- フィルターの式を入力して「保存」をクリックする。ここでは売上が10000以上のレコードのみを抽出しています。
日付データのフィルターには「相対日付」フィルターが下図のように用意されています。
Sponsored link
データソースの更新・置換
フロー作成後にデータソースが更新された場合のフローへの反映手順 およびフローに使用しているデータソース ファイルを別ファイルに置き換える方法を解説します。
データソースの更新
データソースがファイルの場合
更新したい入力ステップを右クリックして「更新」を選択します。これでファイルのデータ更新は完了です。
データソースがサーバーの場合
接続ペインにおいて更新したいデータソースの右側にある「▼」マークをクリックして「編集」を選択します。ユーザ名やパスワードなどの認証作業を行いサーバーに接続完了しましたらデータが更新されます。
データソース ファイルの置換
接続ペインにおいて別のファイルに置き換えたいデータソース の右側にある「▼」マークをクリックして、「編集」を選択します。置換したいファイルを選択して「開く」をクリックすればデータソースファイルの置換の完了です。
データソースの増分更新
データソースを更新する際にすべてのデータを読み込まずに追加された行データのみを読み込み処理することも可能です。こちらの記事で増分更新の仕組みや設定手順について解説していますので参考にしてみてください。
Sponsored link
まとめ
今回はTableau Prepの入力ステップの下記の使い方を紹介しました。
- データソースへの接続方法
- 複数ファイル・シートの読み込み方法
- フィールド・レコードの抽出・削除方法
- データソースの更新および置換
Tableau(タブロー)の学習本についてはコチラの記事でまとめてますので参考にしてみてください。
Tableau prep おすすめ学習書
コメント