メインコンテンツまでスキップ

管理されたインジェスト ソースに接続する

この記事では、カタログ エクスプローラーで、Lakeflowコネクトが管理するインジェスト ソースの認証の詳細を格納する接続を作成する方法について説明します。 接続に対する USE CONNECTION 権限または ALL PRIVILEGES を持つユーザーは、Salesforce や SQL Server などのソースから管理されたインジェスト パイプラインを作成できます。

管理者ユーザーは、パイプラインを作成するユーザーが次の場合に、この記事の手順を完了する必要があります。

  • 管理者以外のユーザーです。
  • Databricks API、Databricks SDK、Databricks CLI、または Databricks アセットバンドルを使用します。

これらのインターフェイスでは、ユーザーがパイプラインを作成するときに既存の接続を指定する必要があります。

または、管理者ユーザーは、データ取り込み UI で接続とパイプラインを同時に作成できます。 Lakeflowコネクトの管理対象コネクタを参照してください。

Lakeflowコネクト vs. レイクハウスフェデレーション

レイクハウスフェデレーションを使用すると、データを移動せずに外部データソースをクエリできます。 Lakeflowコネクト とレイクハウスフェデレーションのどちらかを選択できる場合は、ETL パイプラインのアドホック レポートまたは概念実証作業にレイクハウスフェデレーションを選択します。「レイクハウスフェデレーションとは」を参照してください。

特権の要件

管理されたインジェストソースに接続するために必要なユーザー権限は、選択したインターフェースによって異なります。

  • データ取り込み UI

    管理者ユーザーは、接続とパイプラインを同時に作成できます。このエンドツーエンドの取り込みウィザードは、UI でのみ使用できます。すべてのマネージド インジェスト コネクタが UI ベースのパイプラインオーサリングをサポートしているわけではありません。

  • カタログエクスプローラー

    カタログエクスプローラ を使用すると、接続の作成とパイプラインの作成が分離されます。これにより、管理者は、管理者以外のユーザーがパイプラインを作成するための接続を作成できます。

    パイプラインを作成するユーザーが管理者以外のユーザーである場合、または Databricks APISDK、 Databricks SDK、 Databricks CLI、または Databricks アセット バンドルを使用する予定の場合、管理者はまずカタログ エクスプローラーで接続を作成する必要があります。 これらのインターフェイスでは、ユーザーがパイプラインを作成するときに既存の接続を指定する必要があります。

シナリオ

サポートされているインターフェイス

必要なユーザー権限

管理者ユーザーは、接続とインジェスト パイプラインを同時に作成します。

データ取り込み UI

  • CREATE CONNECTION メタストア上
  • USE CATALOG ターゲットカタログ上
  • (SaaS アプリ) ターゲット カタログ上の既存のスキーマまたはCREATE SCHEMAUSE SCHEMAおよびCREATE TABLE
  • (データベース) USE SCHEMACREATE TABLE、およびターゲットカタログ上の既存のスキーマまたはCREATE SCHEMA``CREATE VOLUME

管理者ユーザーは、管理者以外のユーザーがパイプラインを作成するための接続を作成します。

管理者:

  • カタログエクスプローラー

管理者以外:

  • データ取り込み UI
  • Databricks API
  • Databricks SDK
  • Databricks CLI
  • Databricksアセットバンドル

管理者:

  • CREATE CONNECTION メタストア上

管理者以外:

  • USE CONNECTION または、既存の接続で ALL PRIVILEGES します。
  • USE CATALOG ターゲットカタログ上
  • (SaaS アプリ) ターゲット カタログ上の既存のスキーマまたはCREATE SCHEMAUSE SCHEMAおよびCREATE TABLE
  • (データベース) USE SCHEMACREATE TABLE、およびターゲットカタログ上の既存のスキーマまたはCREATE SCHEMA``CREATE VOLUME

Google アナリティクス 生データ

カタログ エクスプローラーで Google アナリティクス 生データ 接続を作成するには、次の操作を行います。

  1. Databricksワークスペースで、 カタログ > 外部ロケーション > 接続 > 接続の作成 をクリックします。
  2. 接続の設定 ウィザードの 接続の基本 ページで、一意の 接続名 を指定します。
  3. 接続タイプ プルダウン メニューで Google アナリティクス 生データ を選択します。
  4. (オプション)コメントを追加します。
  5. 次へ をクリックします。
  6. [ service_account_json ] フィールドに、BigQuery からダウンロードしたサービス アカウントの JSON の詳細を ソース設定に貼り付けます。
  7. 接続の作成 をクリックします。

セールスフォース

Lakeflowコネクト は、Salesforce Platform からのデータの取り込みをサポートしています。 Databricks は、Salesforce Data Cloud でフェデレーション クエリを実行するための ゼロコピー コネクタ もレイクハウスフェデレーションに提供しています。

カタログエクスプローラーで Salesforce インジェスト接続を作成するには、次の操作を行います。

  1. Databricksワークスペースで、 カタログ > 外部ロケーション > 接続 > 接続の作成 をクリックします。

  2. 接続の設定 ウィザードの 接続の基本 ページで、一意の 接続名 を指定します。

  3. 接続の種類 ドロップダウン メニューで、 Salesforce を選択します。

  4. (オプション)コメントを追加します。

  5. 次へ をクリックします。

  6. Salesforce サンドボックス アカウントから取り込む場合は、 サンドボックスであるtrueに設定します。

  7. [ Salesforce でサインイン ] をクリックします。

    Salesforce にリダイレクトされます。

  8. Salesforce サンドボックスから取り込む場合は、[ カスタムドメインを使用 ] をクリックし、サンドボックスの URL を入力して、[ 続行 ] をクリックします。

    カスタムドメインボタンを使用する

    サンドボックスのURLを入力

  9. Salesforce の資格情報を入力し、[ ログイン ] をクリックします。Databricks では、Databricks への取り込み専用の Salesforce ユーザーとしてログインすることをお勧めします。

important

セキュリティ上の理由から、Databricks UI で OAuth 2.0 リンクをクリックした場合にのみ認証してください。

  1. インジェスト ウィザードに戻ったら、[ 接続の作成 ] をクリックします。

ServiceNow

  1. OAuth を構成します。手順については、「 Databricks インジェスト用に ServiceNow を構成する」を参照してください。

  2. Databricksワークスペースで、 カタログ > 外部ロケーション > 接続 > 接続の作成 をクリックします。

  3. 接続の設定 ウィザードの 接続の基本 ページで、一意の 接続名 を指定します。

  4. [ 接続の種類 ] ドロップダウン メニューで、[ ServiceNow ] を選択します。

  5. (オプション)コメントを追加します。

  6. 次へ をクリックします。

  7. 認証 ページで、次のように入力します。

    • インスタンス ID: ServiceNow インスタンス ID。
    • OAuth スコープ: デフォルト値を useraccountのままにします。
    • クライアントシークレット: ソース設定で取得したクライアントシークレット。
    • クライアント ID: ソース設定で取得したクライアント ID。
  8. [ ServiceNow でサインイン ] をクリックします。

  9. ServiceNow の資格情報を使用してサインインします。

    Databricks ワークスペースにリダイレクトされます。

  10. 接続の作成 をクリックします。

SharePoint

Catalog Explorer で SharePoint 接続を作成する手順は、選択した OAuth メソッドによって異なります。次の方法がサポートされています。

  • ユーザーツーマシン (U2M) 認証
  • 手動トークン更新認証

Databricks では、更新トークンを自分で計算する必要がないため、U2M の使用をお勧めします。これは自動的に処理されます。また、Entra ID クライアントに SharePoint ファイルへのアクセスを許可するプロセスが簡素化され、セキュリティが向上します。

U2M (推奨)

  1. ソースの設定を完了します。取得した認証の詳細を使用して、接続を作成します。

  2. Databricks ワークスペースで、 カタログ > 外部データ > 接続 > 接続の作成 をクリックします。

  3. 接続の設定 ウィザードの 接続の基本 ページで、一意の 接続名 を指定します。

  4. 接続の種類 ドロップダウン メニューで、 Microsoft SharePoint を選択します。

  5. 認証タイプ ドロップダウンメニューで、 OAuth を選択します。

  6. (オプション)コメントを追加します。

  7. 次へ をクリックします。

  8. [ 認証 ] ページで、Microsoft Entra ID アプリの次の資格情報を入力します。

    • OAuth スコープ : OAuth スコープは、事前に入力された値に設定したままにします。
    • クライアントシークレット : ソース設定で取得したクライアントシークレット。
    • クライアント ID : ソース設定で取得したクライアント ID。
    • ドメイン : 次の形式の SharePoint インスタンス URL。 https://MYINSTANCE.sharepoint.com
    • テナント ID : ソース セットアップで取得したテナント ID。

    SharePoint 認証の詳細を格納する Unity Catalog 接続の必須フィールド

  9. [ Microsoft SharePoint でサインイン ] をクリックします。

    新しいウィンドウが開きます。SharePoint 資格情報でサインインすると、Entra ID アプリに付与しているアクセス許可が表示されます。

  10. [同意する] をクリックします。

    [正常に承認されました] メッセージが表示され、Databricks ワークスペースにリダイレクトされます。

  11. 接続の作成 をクリックします。

手動更新トークン

  1. ソースの設定を完了します。取得した認証の詳細を使用して、接続を作成します。

  2. Databricks ワークスペースで、 カタログ > 外部データ > 接続 > 接続の作成 をクリックします。

  3. 接続の設定 ウィザードの 接続の基本 ページで、一意の 接続名 を指定します。

  4. 接続の種類 ドロップダウン メニューで、 Microsoft SharePoint を選択します。

  5. 認証タイプ ドロップダウン メニューで、 OAuth 更新トークン を選択します。

  6. (オプション)コメントを追加します。

  7. 次へ をクリックします。

  8. [ 認証 ] ページで、Microsoft Entra ID アプリの次の資格情報を入力します。

    • テナント ID : ソース セットアップで取得したテナント ID。
    • クライアント ID : ソース設定で取得したクライアント ID。
    • クライアントシークレット : ソース設定で取得したクライアントシークレット。
    • 更新 トークン : ソース セットアップで取得した更新 トークン。

    手動更新トークンを使用して SharePoint 認証の詳細を格納する Unity Catalog 接続の必須フィールド

  9. 接続の作成 をクリックします。

SQL Server

カタログエクスプローラで Microsoft SQL Server 接続を作成するには、次の手順を実行します。

  1. Databricks ワークスペースで、 カタログ > 外部データ > 接続 をクリックします。
  2. 接続の作成 をクリックします。
  3. 一意の 接続名 を入力します。
  4. 接続の種類SQL Server を選択します。
  5. ホスト で、SQL Server ドメイン名を指定します。
  6. ユーザーパスワード に、SQL Server のログイン資格情報を入力します。
  7. 作成 をクリックします。

Workday レポート

カタログ エクスプローラで Workday Reports 接続を作成するには、次の手順を実行します。

  1. Workday アクセス資格情報を作成します。手順については、「 インジェスト用の Workday レポートを構成する」を参照してください。
  2. Databricksワークスペースで、 カタログ > 外部ロケーション > 接続 > 接続の作成 をクリックします。
  3. 接続名 に、Workday 接続の一意の名前を入力します。
  4. 接続の種類Workday レポート を選択します。
  5. 認証タイプ で、 OAuth 更新トークン を選択します。
  6. ソース設定で取得した クライアント IDクライアントシークレットおよび更新トークン を入力します。
  7. [ 接続の作成 ] ページで、[ 作成 ] をクリックします。

次のステップ

カタログエクスプローラ で管理対象インジェストソースへの接続を作成した後、その接続に対する USE CONNECTION 権限または ALL PRIVILEGES を持つユーザーは、次の方法でインジェストパイプラインを作成できます。

  • インジェスト ウィザード (サポートされているコネクタのみ)
  • Databricksアセットバンドル
  • Databricks API
  • Databricks SDK
  • Databricks CLI

パイプラインを作成する手順については、 マネージド コネクタのドキュメントを参照してください。