メインコンテンツまでスキップ

Google Drive コネクタ

備考

ベータ版

この機能はベータ版です。ワークスペース管理者は、 プレビュー ページからこの機能へのアクセスを制御できます。Databricksのプレビューを管理するを参照してください。

LakeFlow Connect のマネージド Google ドライブ コネクタを使用すると、Google Drive から Databricks にファイルを取り込むことができます。非構造化ファイルをバイナリデータとして取り込み、構造化形式(CSVJSONXMLEXCEL など)をDeltaテーブルに解析し、または、ファイルの内容をロードせずにファイルメタデータをキャプチャします。

SparkリーダーAPIs(read_filesspark.read、Auto Loader)を使用する標準的なGoogle Driveコネクタについては、Google Driveからファイルをインジェストするを参照してください。

開始する前に知っておくこと

トピック

それが重要な理由

Databricksのユーザーペルソナ

ワークフローはDatabricksのユーザーペルソナに依存します:

  • シングル ユーザー: 管理者ユーザーは Unity Catalog 接続と取り込みパイプラインを作成します。
  • マルチユーザー:管理者は、管理者以外のユーザーがパイプラインを作成できるように、接続を作成します。

認証方法

接続を作成するためのステップは、選択する認証方法によって異なります。

インターフェース

パイプラインを作成するステップは、インターフェースによって異なります。

データ取り込み頻度

パイプラインのスケジュールは、レイテンシーとコストの要件によって異なります。

一般的なパターン

取り込みのニーズに応じて、パイプラインは履歴追跡、列選択、行フィルタリングなどの設定を使用する場合があります。対応構成はコネクタによって異なります。「機能の利用可能性」を参照してください。

Google Drive から取り込みを開始する

次の表では、ユーザータイプ別のエンドツーエンドの Google ドライブ取り込みフローの概要について説明します。

ユーザー

ステップ

管理者

  1. OAuth 2.0 を構成し、Unity Catalog 接続を作成します。「管理対象の取り込み用 Google ドライブをセットアップする」をご覧ください。
  2. カタログエクスプローラを使用して Google ドライブへの接続を作成し、管理者以外のユーザーがパイプラインを作成できるようにします。「管理対象取り込みソースへの接続」を参照してください。

非管理者

サポートされている任意のインターフェイスを使用して、既存の接続からパイプラインを作成します。「Google Drive からのデータの取り込み」を参照してください。

機能の利用可能状況

機能

可用性

UI ベースのパイプライン オーサリング

緑色のチェックマーク サポートされています

API ベースのパイプライン オーサリング

緑色のチェックマーク サポートされています

宣言型オートメーションバンドル

緑色のチェックマーク サポートされています

増分取り込み

緑色のチェックマーク サポートされています

Unity Catalog ガバナンス

緑色のチェックマーク サポートされています

Databricks Workflowsによるオーケストレーション

緑色のチェックマーク サポートされています

SCDタイプ2

赤色のXアイコン サポートされていません。

スキーマの展開

緑色のチェックマーク サポートされています

schema_evolution_modeで構成可能です。「Google Drive コネクタのリファレンス」を参照してください。

APIベースの列選択および選択解除

赤色のXアイコン サポートされていません。

APIベースの行フィルタリング

赤色のXアイコン サポートされていません。

認証方法

認証方法

可用性

OAuth U2M

緑色のチェックマーク サポートされています

OAuth M2M

赤色のXアイコン サポートされていません。

OAuth(手動更新トークン)

赤色のXアイコン サポートされていません。

基本認証(ユーザー名/パスワード)

赤色のXアイコン サポートされていません。

基本認証(API キー)

赤色のXアイコン サポートされていません。

基本認証 (サービスアカウント JSON キー)

赤色のXアイコン サポートされていません。