Salesforce インジェスト接続の制限

プレビュー

LakeFlow Connect はゲート付きパブリック プレビュー段階です。 プレビューに参加するには、Databricks アカウント チームにお問い合わせください。

この記事では、LakeFlow Connect を使用して Salesforce に接続し、そこからデータを取り込む場合の制限と考慮事項について説明します。

  • スケジュールされたパイプラインを実行しても、アラートはすぐにはトリガーされません。 代わりに、次の更新が実行されたときにトリガーされます。

  • ソース テーブルが削除されても、宛先テーブルは自動的に削除されません。 コピー先テーブルは手動で削除する必要があります。 この動作は Delta Live Tables の動作と一致しません

  • スキーマを選択すると、 CURRENT テーブルだけでなく、スキーマに追加される FUTURE テーブルも選択されます。

  • メンテナンス期間中、Databricks はデータにアクセスできない可能性があります。

  • ソース テーブル名が既存の宛先テーブル名と競合する場合、フローは失敗します。

  • パイプラインあたりのオブジェクトの最大数は 250 です。 ただし、これらのオブジェクト内でサポートされる行または列の数に制限はありません。

  • base64addresslocationcomplexValue タイプはサポートされていません。 これらの列は、インジェスト中に自動的に削除されます。

  • 次のオブジェクトはサポートされていません。

    • WHERE句またはLIMIT制限があるオブジェクト:

      • Announcement

      • AppTabMember

      • CollaborationGroupRecord

      • ColorDefinition

      • ContentDocumentLink

      • ContentFolderItem

      • ContentFolderMember

      • DataStatistics

      • DatacloudDandBCompany

      • EntityParticle

      • FieldDefinition

      • FieldHistoryArchive

      • FlexQueueItem

      • FlowVariableView

      • FlowVersionView

      • IconDefinition

      • IdeaComment

      • NetworkUserHistoryRecent

      • OwnerChangeOptionInfo

      • PicklistValueInfo

      • PlatformAction

      • RelationshipDomain

      • RelationshipInfo

      • SearchLayout

      • SiteDetail

      • UserEntityAccess

      • UserFieldAccess

      • Vote

    • リアルタイム・イベント・モニタリング用のオブジェクト:

      • ApiEvent

      • BulkApiResultEventStore

      • EmbeddedServiceDetail

      • EmbeddedServiceLabel

      • FormulaFunction

      • FormulaFunctionAllowedType

      • FormulaFunctionCategory

      • IdentityProviderEventStore

      • IdentityVerificationEvent

      • LightningUriEvent

      • ListViewEvent

      • LoginAsEvent

      • LoginEvent

      • LogoutEvent

      • Publisher

      • RecordActionHistory

      • ReportEvent

      • TabDefinition

      • UriEvent

    • __b__x、または __hd

    • ActivityMetric

    • ActivityMetricRollup

    • Site

  • パイプラインごとに 1 つの宛先のみがサポートされます。 すべてのテーブルは、同じカタログとスキーマを持つ必要があります。

  • Databricks は、カーソル列を選択して、同じ主キーを共有するデータの増分読み取りとシーケンスの変更を追跡します。 Databricks は、次のリストから優先順位に従ってカーソル列を選択します: SystemModstampLastModifiedDateCreatedDateLoginTime

    たとえば、 SystemModstampが利用できない場合、Databricks はLastModifiedDateを検索します。 オブジェクトにこれらのカーソルがない場合、Databricks はテーブルのスナップショットを取得します。

  • Databricks は、Salesforce データ型を Delta 互換データ型に自動的に変換します。 変換のおおよそのリストについては、 自動データ変換を参照してください。

  • Databricks は数式フィールドを取り込むことができます。 ただし現時点では、Databricks ではこれらのフィールドの完全なスナップショットが必要です。 つまり、パイプラインの待ち時間は、Salesforce データに数式フィールドが含まれているかどうかと、Salesforce データの更新量によって異なります。

  • Databricks は、パイプラインの残りの部分と同じ頻度で数式フィールドを実行します。 ただし、パイプラインの更新の頻度によっては、数式以外のフィールドが数式フィールドよりも早く更新される可能性があります。

  • Databricks は、削除を挿入や更新と同じように扱います。 行が Salesforce から削除されると、次回のデータの同期時にブロンズテーブルから削除されます。 たとえば、パイプラインが毎時実行されているとします。 午後 12:00 に同期し、午後 12:30 にレコードを削除した場合、午後 1:00 の同期が発生するまで削除は反映されません。

    例外的なケースが 1 つあります。レコードが削除された後、Salesforce のごみ箱から消去される前にパイプラインが実行されなかった場合、Databricks はそれらの削除を見逃します。 この状態から回復する唯一の方法は、完全な更新を行うことです。

  • Salesforce には、接続されたアプリケーションごとにユーザーあたり 4 つの接続の制限があります。 4 つ以上の接続を作成する必要がある場合は、新しいユーザーを作成します。

  • セキュリティ上の理由から、Databricks UI で OAuth リンクをクリックした場合にのみ認証を行ってください。

  • Salesforce では、更新をローテーションできます。 コネクタはこれをサポートしていません。

削除

  • テーブルで論理的な削除が有効になっている場合:

    • 削除は次回の同期に反映されます。

  • テーブルがソフト削除をサポートしていない場合:

    • コネクタは自動的にスナップショットをバッチ処理して取り込みます

    • 例外: これは履歴オブジェクトでは機能しません。 コネクタは、これらが増分的に読み取られ、削除は行われないと想定します。

  • テーブルが論理的な削除をサポートしており、ユーザーが手動で物理的に削除した場合、コネクタは削除をキャプチャできません。 完全更新を実行しない限り、レコードはブロンズ テーブルに残ります。