Veeva Vault コネクタの制限事項
ベータ版
この機能はベータ版です。ワークスペース管理者は、 プレビュー ページからこの機能へのアクセスを制御できます。Databricksのプレビューを管理するを参照してください。
Veeva Vaultコネクタには以下の制限があります。
一般的な制限事項
- スケジュールされたパイプラインを実行すると、アラートはすぐにトリガーされません。その代わりに、次の更新が実行されるときにトリガーされます。
- ソース テーブルを削除しても、宛先テーブルは自動的に削除されません。宛先テーブルを手動で削除する必要があります。この動作は、 Lakeflow Spark宣言型パイプラインの動作と一致しません。
- ソースのメンテナンス期間中、Databricksはお客様のデータにアクセスできない場合があります。
- ソーステーブル名が既存の宛先テーブル名と競合する場合、パイプラインの更新は失敗します。
- 複数の送信先パイプラインのサポートは、APIのみです。
- オプションで、取り込んだテーブルの名前を変更できます。パイプライン内のテーブルの名前を変更すると、API 専用パイプラインになり、UI でパイプラインを編集できなくなります。
- パイプラインがすでに開始された後に列を選択しても、コネクタは新しい列のデータを自動的にバックフィルしません。ヒストリカルデータを取り込むには、テーブルで完全な更新を手動で実行します。
- Databricksでは、異なるソーススキーマから来ていても、同じパイプライン内で同じ名前の2つ以上のテーブルを取り込むことはできません。
- ソースシステムでは、カーソル列が単調に増加すると想定しています。
- このコネクタは、変換なしで生データを取り込みます。変形には、ダウンストリームのLakeFlow Spark宣言型パイプラインを使用します。
認証
外部 OIDC アイデンティティ プロバイダー (Microsoft Entra ID) を介した OAuth 2.0 マシン間(M2M)認証のみがサポートされています。ユーザー名とパスワード認証はサポートされていません。
パイプラインのスケジューリング
Veeva は 15 分ごとにインクリメンタルアーカイブを生成します。15 分よりも頻繁にスケジュールされたパイプラインの実行では、新しいデータが認識されません。
アーカイブ保持
Veevaは、増分アーカイブを10日間、完全アーカイブを2日間保持します。パイプラインが10日以上遅延した場合、増分アーカイブチェーンが破損し、完全更新が必要です。
完全更新の動作
完全な更新がトリガーされると、プロセスは2つのパイプライン更新にわたります。最初の更新では Unity Catalog ボリュームからステージングされたアーカイブ状態がクリアされ、その後の更新で実際の完全なデータ再ロードが行われます。
ID フィールドのデータ型
id フィールドは、Veeva で宣言された型に関わらず、Databricks で常に STRING 型として保存されます。これは、LakeFlow Spark宣言型パイプラインの主キー機能が正しく機能するために必要です。
スキーマの変更
Databricksでは、Veevaでのスキーマ変更後に完全な更新を実行して、変更が宛先テーブルに表示されるようにすることをお勧めします。
コネクタはスキーマの変更を次のように処理します。
- フィールド削除 :列は宛先テーブルに残りますが、すべての値は
nullに設定され、クエリできなくなります。 - フィールド名の変更: 既存のレコードは、古いフィールド名の下で検出可能です。名前変更後に作成された新しいレコードは、新しいフィールド名の下に表示されます。
- オブジェクトの削除 :削除されたオブジェクトはスキーマ内で検出可能です。
- オブジェクトの名前変更:古いオブジェクト名はスキーマに残ります。新しいオブジェクト名で追加された新しいレコードは、新しいテーブル名の下に表示されます。
システムテーブルのサポート
最初のリリースでは、固定された__sys個のテーブルからの取り込みをサポートしています:
DOCUMENT_VERSIONDOCUMENT_RELATIONSHIPPICKLISTWORKFLOWWORKFLOW_ITEMWORKFLOW_TASKWORKFLOW_TASK_ITEMACTIVE_LEGACY_WORKFLOWACTIVE_LEGACY_WORKFLOW_TASKINACTIVE_LEGACY_WORKFLOWINACTIVE_LEGACY_WORKFLOW_TASK
その他の __sys テーブルは、このリリースでは取り込まれません。次期リリースでサポートが拡張され、Vault で利用可能なすべてのシステムテーブルに対応します。そのリリース後、新しくサポートされるテーブルを取り込むには、完全な更新が必要になります。