メインコンテンツまでスキップ

Google アナリティクス生データ コネクタ

LakeFlow Connectのマネージド Google アナリティクス生データ コネクタを使用すると、 BigQueryエクスポートを使用して、Google アナリティクス 4 (GA4) からDatabricksにイベントレベルのデータを取り込むことができます。

始める前に知っておくべきこと

トピック

なぜそれが重要なのか

Databricksのユーザーペルソナ

ワークフローは、Databricksのユーザーペルソナによって異なります。

  • シングルユーザー: 管理者ユーザーは、 Unity Catalog接続と取り込みパイプラインを作成します。
  • マルチユーザー:管理者ユーザーが、管理者以外のユーザーがパイプラインを作成するための接続を作成します。

認証方法

接続を確立するための手順は、選択した認証方法によって異なります。

インタフェース

パイプラインを作成するステップはインターフェースによって異なります。

摂取頻度

パイプラインのスケジュールは、お客様のレイテンシとコスト要件によって異なります。

一般的なパターン

取り込みのニーズに応じて、パイプラインは履歴追跡、列選択、行フィルタリングなどの設定を使用する場合があります。対応構成はコネクタによって異なります。機能の利用可否については、こちらをご覧ください。

Google アナリティクスからの取り込みを開始する

次の表は、ユーザー タイプに基づいたエンドツーエンドの Google アナリティクス Raw データ取り込みフローの概要を示しています。

ユーザー

ステップ

管理

  1. GA4のデータをBigQueryにエクスポートします。Databricks取り込み用の Google アナリティクス 4 と Google BigQueryのセットアップ」を参照してください。
  2. どちらか:

非管理者

サポートされている任意のインターフェースを使用して、既存の接続からパイプラインを作成します。「Google アナリティクス 4 からのデータの取り込み」を参照してください。

機能の利用可能性

機能

可用性

UIベースのパイプライン作成

緑色のチェックマークサポート対象

APIベースのパイプライン作成

緑色のチェックマークサポート対象

宣言型オートメーションバンドル

緑色のチェックマークサポート対象

増分取り込み

緑色のチェックマークサポート対象

Unity Catalogガバナンス

緑色のチェックマークサポート対象

Databricks Workflowsを使用したオーケストレーション

緑色のチェックマークサポート対象

SCDタイプ2

緑色のチェックマークサポート対象

API ベースの列選択と選択解除

緑色のチェックマークサポート対象

APIベースの行フィルタリング

緑色のチェックマークサポート対象

自動スキーマ進化:新規列と削除列

緑色のチェックマークサポート対象

自動スキーマ進化: データ型の変更

赤い×印のアイコンサポートされていません

自動スキーマ進化:列名の変更

緑色のチェックマークサポート対象

新しい列(新しい名前)として扱われ、削除された列(古い名前)としても扱われます。

自動スキーマ進化: 新しいテーブル

緑色のチェックマークサポート対象

スキーマ全体を取り込む場合。パイプラインあたりのテーブル数の制限事項を参照してください。

パイプラインあたりの最大テーブル数

250

認証方法

認証方法

可用性

OAuth U2M

緑色のチェックマークサポート対象

OAuth M2M

赤い×印のアイコンサポートされていません

OAuth (マニュアル更新)

赤い×印のアイコンサポートされていません

基本認証(ユーザー名/パスワード)

赤い×印のアイコンサポートされていません

基本認証(APIキー)

緑色のチェックマークサポート対象(APIのみ)

Basic認証(サービスアカウントJSONキー)

赤い×印のアイコンサポートされていません