マネージド取り込みパイプラインの一般的なパターン
LakeFlow Connect管理された取り込みパイプラインを最適化するためのパターンとテクニックを提供します。 これらのパターンを使用して、取り込まれるデータの制御、パイプラインの更新の管理、高度な動作の構成を行います。
すべてのコネクタがこのセクションの共通パターンをサポートしているわけではありません。
トピック | 説明 |
|---|---|
取り込み中に特定の列を選択または除外して、データ量を削減し、パフォーマンスを向上させます。 | |
ソース システムからデータを完全に強制的に再ロードします。 | |
緩やかに変化するディメンション ( SCD ) タイプ 2 を使用して、データの履歴的な変更を追跡します。 | |
単一のソースから複数の宛先テーブルまたはカタログにデータを取り込みます。 | |
パイプラインの更新、停止する、ワークフローのトラブルシューティングを管理します。 | |
SQL のような条件を使用して、取り込み中に行をフィルタリングします。 | |
宛先テーブルに名前を付けます。デフォルトでは、宛先テーブルには対応するソース テーブルの名前が付けられます。ただし、同じスキーマ内に同じソース オブジェクトを 2 回取り込む場合は、宛先テーブルに名前を付けると便利です。マネージド コネクタは、同じ宛先スキーマ内の重複するテーブル名をサポートしません。宛先テーブルに名前を付けると、組織の命名規則に従ってテーブルを調整することもできます。 |