Confluence コネクタに関するよくある質問
プレビュー
Confluence コネクタはベータ版です。
このページでは、 Databricks LakeFlow Connectの Confluence コネクタに関するよくある質問に回答します。
一般的なマネージドコネクタに関する FAQ
すべてのLakeFlow Connectマネージド コネクタに適用される FAQ については、 「マネージド コネクタの FAQ」を参照してください。 以下は Confluence に固有のものです。
コネクタ固有のFAQ
このセクションの回答は Confluence コネクタに固有のものです。
コネクタはどのようにして Confluence からデータを取得するのでしょうか?
Confluence コネクタは、Confluence REST APIを使用して、Confluence スペースからページ コンテンツ、メタデータ、添付ファイルを取得します。
特定のページまたはスペース全体を取り込むことはできますか?
いいえ。
コネクタはページ階層をどのように処理しますか?
コネクタは、スペース内のページの階層構造を維持します。ページ間の親子関係は取り込まれたデータ内に保持されます。
コネクタは増分取り込みをサポートしていますか?
コネクタは現在、次のテーブルをサポートしています。
- ページ、ブログ投稿、添付ファイルを段階的に取り込みます。
- ただし、スナップショットを使用してスペース、ラベル、分類レベルを取り込みます。つまり、パイプラインの実行ごとにデータが上書きされます。
結果のスキーマについては、 「 スキーマ 」を参照してください。
Confluence の添付ファイルはどのように処理されますか?
添付ファイルのメタデータ (ファイル名、サイズ、コンテンツ タイプ、アップロード日) が取り込まれます。実際の添付ファイルはデフォルトでは取り込まれません。添付ファイルのコンテンツを取り込む必要がある場合は、Databricks サポートにお問い合わせください。
Confluence でページが削除されるとどうなりますか?
SCD タイプ 2 を使用すると、削除されたページが追跡され、宛先テーブルに削除タイムスタンプが付けられます。SCD タイプ 1 の場合、ページは宛先テーブルから削除されます。
アーカイブされたスペースを取り込むことはできますか?
コネクタはアクティブなスペースのみを取り込みます。アーカイブされたスペースは取り込みパイプラインに含まれません。
コネクタにはどのような権限が必要ですか?
Confluence ユーザー アカウントには、取り込むスペースとページに対する読み取りアクセス権が必要です。Databricks では、適切な権限を持つ専用のサービス アカウントを使用することをお勧めします。詳細については、 「Confluence 取り込み用のOAuth U2M の構成」を参照してください。
コネクタはページの書式設定をどのように処理しますか?
ページ コンテンツは、XHTML ベースの形式である Confluence ストレージ形式で取り込まれます。このコンテンツを下流処理で解析して、プレーンテキストを抽出したり、他の形式に変換したりできます。Confluence ドキュメントの「Confluence ストレージ形式」を参照してください。
ページコメントは取り込まれますか?
コネクタはページコメントを取り込みません。
ラベルやタグでページをフィルタリングできますか?
いいえ、コネクタはすべてのページを取り込みます。