Microsoft SharePoint コネクタの制限事項
このページでは、Databricks Lakeflowコネクトを使用したMicrosoft SharePoint からの取り込みに関する制限事項と考慮事項を示します。
コネクタ固有の制限
-
非構造化データ(
BINARYFILE)の取り込みの場合、コネクタは100MB以下のファイルのみをサポートします。100 MB を超えるファイルのメタデータは取り込まれますが、ファイルコンテンツはダウンロードされません。構造化ファイル形式にはファイルサイズの制限はありません。 -
非構造化(
BINARYFILE)取り込みは、SCD_TYPE_1ストレージ モードのみをサポートしています。構造化取り込み(CSV、JSON、XML、EXCEL、その他形式)は、APPEND_ONLYストレージモードにのみ対応しています。SCDタイプ2はサポートされていません。ストレージモード設定時、storage_modeをtable_configurationで設定します。scd_typeフィールドを設定すると、エラーがスローされます。 -
コネクタは個別ファイル選択をサポートしていません。構成されたフォルダー、ドライブ、サブサイト、またはサイト内のすべてのファイルを取り込みます。
-
コネクタは、SharePoint からのファイルレベルのアクセス制御リスト(ACL)の取り込みをサポートしていません。
-
コネクタは、別のSharePointドキュメントライブラリにリンクされているファイルの取り込みをサポートしていません。
-
Databricks では、1 時間に 1 回しか取り込むことをおすすめしません。
-
ダウンストリームでの使用のために提供されるユーティリティは、シングルユーザー クラスターに限定されます。ただし、シングルユーザー クラスターは、他のユーザーによって作成されたストリーミングテーブルにアクセスできません。各ダウンストリームユーザーは、独自の取り込みパイプラインを作成する必要があります。ユーティリティを修正し、サーバレスおよび共有クラスターで動作させることは可能ですが、これによりパフォーマンスに影響が出る可能性があります。ファイルのアクセス例を参照してください。
-
一部のフィールド(例:
quick_xor_hash、mime_type)は、すべてのファイル形式でサポートされていません。ファイルのダウンロードやその他のメタデータ取り込みは、このような場合でも機能し続けます。