メインコンテンツまでスキップ

SharePoint取り込み設定の概要

Lakeflow Connect のマネージド SharePoint コネクタでサポートされている認証方法について学習します。マネージド SharePoint コネクタは、非構造化ファイル(PDF や DOCX など)だけでなく、構造化形式(CSV、JSON、Excel など)も Delta テーブルに取り込むことができます。Spark および SQL APIs を使用して解析と変換を完全に制御できるカスタムパイプラインについては、SharePoint からファイルをインジェストするを参照してください。

備考

ベータ版

この機能はベータ版です。ワークスペース管理者は、 プレビュー ページからこの機能へのアクセスを制御できます。「Databricks プレビューの管理」を参照してください。

SharePointコネクタを選択する

LakeFlow Connectは2つのSharePointコネクタを提供しています。これらはいずれも SharePoint のデータにアクセスしますが、管理レベルは異なります。

コネクター

説明

管理された SharePoint コネクタ

フルマネージド コネクタ。Deltaテーブルにデータを取り込み、ソースと同期させる、エンタープライズアプリケーション向けのシンプルでメンテナンスが容易なコネクタです。

標準 SharePoint コネクタ

SQL、PySpark、またはLakeflow Spark宣言型パイプラインを使用して、read_filesspark.readCOPY INTO、およびAuto LoaderなどのバッチおよびストリーミングAPIsでカスタムの取り込みパイプラインを構築します。取り込み時に複雑な変換を実行できる柔軟性を提供しますが、パイプラインの管理と保守において、より大きな責任を負うことになります。

ヒント

Databricksでは、ほとんどのユースケースでマネージド SharePoint コネクタを使用することをお勧めします。

どの認証方法を選択すればよいですか?

マネージド SharePoint コネクタは、次の認証方法をサポートしています。

  • OAuth U2M:Databricks 管理(推奨)

    • Databricks は OAuth アプリとトークン更新を管理しています。Azureアプリ登録は必要ありません。ほとんどのユーザーに推奨されます。
  • OAuth U2M: カスタム管理

    • 独自の Azure アプリ登録を持ち込みます。組織がアプリの所有権またはAPIレート制限の制御を必要とする場合に使用します。
  • OAuth M2M

    • ユーザーの操作なしで実行される、完全に自動化された本番運用パイプライン向け。
  • 手動トークン更新による OAuth

    • レガシーメソッドです。新しい実装には推奨されません。

Databricks 管理の OAuth U2M 認証を設定する(推奨)

この方法では Azure アプリ登録は必要ありません。Databricks は OAuth 設定とトークン更新を自動的に管理します。完全な設定ステップについては、OAuth U2M を構成する: Databricks 管理の Microsoft SharePoint インジェストを参照してください。