SQL Server コネクタに関する FAQ

このページでは、SQL Server のDatabricks Lakeflowコネクトコネクタに関してよく寄せられる質問に回答します。

一般的なマネージドコネクタに関する FAQ

Managed Connector の FAQ の回答は、Lakeflowコネクトのすべてのマネージドコネクタに適用されます。コネクタ固有の FAQ については、引き続きお読みください。

パイプラインが失敗した場合、インジェストはデータ損失なしに再開されますか?

はい。Databricks は、コネクタがソースから抽出し、宛先に適用した内容を追跡します。何かが起こった場合、Databricksは、ログがソースデータベースに残っている限り、その時点で再開できます。これは、ログ保持期間によってログが削除される前にパイプラインが実行されず、ターゲットテーブルの完全な更新が必要な場合に影響を受ける可能性があります。

コネクタは、日付と時刻の列のタイムゾーンをキャプチャしますか?

いいえ。日付と時刻は UTC 形式で取り込まれます。

インジェストゲートウェイのスケジュールをカスタマイズできますか?

いいえ、インジェストゲートウェイは、ログの保持によって変更が削除されるのを避けるために、連続モードで実行する必要があります。変更が削除された場合は、すべてのテーブルに対して完全な更新が必要です。

コネクタは、主キーのないテーブルをどのように処理しますか?

コネクタは、大きなオブジェクトを除くすべての列をバンドルされた主キーとして扱います。ソーステーブルに重複する行がある場合、これらの行は宛先テーブルの 1 つの行として取り込まれます。

インジェストパイプラインの実行はどのくらいの頻度でスケジュールできますか?

インジェストパイプラインの実行をスケジュールできる頻度に制限はありません。ただし、サーバレスコンピュートの起動には時間がかかるため、インターバルの間には少なくとも 5 分 Databricks ことをおすすめします。 Databricks では、連続モードでのインジェストパイプラインの実行はサポートされていません。

最初のパイプライン実行でデータベースのすべての行が表示されないのはなぜですか?

インジェストゲートウェイは、実行が開始されるとすぐに履歴データと CDC データを抽出します。インジェストパイプラインは、このすべてのデータが抽出される前に実行される可能性があり、その結果、データがターゲットテーブルに部分的に適用されます。インジェストパイプラインを数回実行するだけで、すべてのデータが抽出され、ターゲットテーブルに適用される場合があります。

私のデータ取り込みゲートウェイは起動に時間がかかります。どうすれば直せますか？

Gateways はクラシックコンピュート上で実行され、起動するたびに仮想マシン (VM) をプロビジョニングします。起動に数分以上かかる場合は、以下の点を検討してください。

現在のパイプラインチャンネルに切り替えます。これは最も一般的な解決策です。プレビューチャンネルのビルドは起動時間が長くなります。これは、UI (チャンネルのパイプ ライン の詳細設定)、バンドルリソースファイル、またはパイプライン仕様で変更できます。
取り込み実行の間にゲートウェイを再起動しないでください。ゲートウェイは継続的に実行するように設計されています。停止して再起動すると、再起動のたびにVMが再プロビジョニングされ、ゲートウェイが停止している間にソースが変更ログを切り捨てた場合、変更ログが欠落するリスクがあります。

ゲートウェイが起動状態のまま15分以上経過する場合は、サポートチケットを作成してください。

これはゲートウェイにのみ適用されます。サーバレスコンピュート上で取り込みパイプラインを実行し、素早く起動します。

リードレプリカまたはセカンダリインスタンスから取り込むことはできますか?

いいえ。サポートはプライマリ SQL Server インスタンスに限定されます。これは、変更の追跡とチェンジデータキャプチャがリードレプリカまたはセカンダリインスタンスでサポートされていないためです。

一般的なマネージド コネクタに関する FAQ​

パイプラインが失敗した場合、インジェストはデータ損失なしに再開されますか?​

コネクタは、日付と時刻の列のタイムゾーンをキャプチャしますか?​

インジェストゲートウェイのスケジュールをカスタマイズできますか?​

コネクタは、主キーのないテーブルをどのように処理しますか?​

インジェスト パイプラインの実行はどのくらいの頻度でスケジュールできますか?​

最初のパイプライン実行でデータベースのすべての行が表示されないのはなぜですか?​

私のデータ取り込みゲートウェイは起動に時間がかかります。どうすれば直せますか？​

リードレプリカまたはセカンダリインスタンスから取り込むことはできますか?​