Tableau Prep Builder(タブロープレップ)においてデータソースの増分更新・差分更新の設定方法を解説します。データソースの行データのみが増加する場合に利用できます。
Tableau Prep 増分更新の仕組み
Tableau Prepの増分更新では、下図のように「入力データの指定フィールド」と「前回出力データの指定フィールド」のそれぞれの最大値を比較して、前回データソースの最大値よりも大きい値のレコードが出力データに新たに追加されます
更新レコード判断のために利用される指定フィールドには下記の3つのデータ型の列のみ指定することができます。レコードを一意に特定できるID列などを指定するのがオススメです。
- 数値(整数)
- 日付
- 日付と時刻
増分更新の設定・実行
- 処理フローに出力ステップをセットする。
- 出力ステップにおいて保存先の設定をする。今回は出力データタイプを「Tableau データ抽出(.hyper)」とします。
- 「フローの実行」をクリックして出力データを作成する。
下図のフローではわかりやすいように、中間の処理ステップを省いていますが実際には様々なステップが入力ステップと出力ステップの間に入ります。
- 入力ステップにある「増分更新の有効化」をONにする。
- 入力フィールド、出力フィールド、出力に比較用のフィールド名と対象の出力ステップ名を設定する。ここでは、「ID」と「出力」を設定します。
書き込みオプションの増分更新で「テーブルに追加」を選択します。これにより前回の出力データに新たなレコードが追加されます。
記事作成時(Tableau Prep Builder 2024.1.0)においては出力タイプによってサポート状況が異なります。
- Microsoft Excel:増分更新は未サポート
- CRM AnalyticsExcel:増分更新は未サポート
- CSV:書き込みオプションで「テーブルに追加」は設定不可。
- まず、増分更新を実行する前に入力データ用のデータソースを更新する。
- 出力ステップ内にある「フローの実行」の横にある「▼」をクリックして、「増分更新ーテーブルに追加」をクリックして更新を実行する。
以上で、増分更新の設定・実行は完了です。
Sponsored link
出力ステップの書き込みオプション設定
増分更新の出力ステップでは「テーブルの作成」、「テーブルの追加」、「データの置換」を選ぶことができます。それぞれの設定により作成される出力データと処理が異なります。
増分更新+テーブルの作成
新しい行データのみのテーブルが作成されます(または既存テーブルが上書きされます)。下図のように更新対象となったレコードのみで出力データが作成されます。
増分更新+テーブルの追加
既存テーブルに新しい行データが追加されます。下図のように過去のレコードが維持されたまま更新対象となったレコードがテーブルに追加されます。
Sponsored link
まとめ
今回はデータソースが更新された際に増えた行データ(レコード)のみを更新する増分更新の設定方法を紹介しました。
大容量のデータを扱う場合はTableau Prepのフローを実行に多くの時間がかかってしまいます。そのような際は増分更新を利用することで大幅に処理時間を短縮することができます。
入力ステップの使い方はこちらの記事を紹介していますので覗いてみてください。
Tableau(タブロー)の学習本についてはコチラの記事でまとめてますので参考にしてみてください。
Tableau prep おすすめ学習書
コメント