メインコンテンツまでスキップ

取り込む列を選択する

適用対象 : API ベースのパイプライン作成はいにチェックマークが付けられました

デフォルトでは、 LakeFlow Connect のマネージド コネクタは、指定されたテーブル内の現在および将来のすべての列を取り込みます。 必要に応じて、パイプライン定義で次のいずれかのテーブル構成プロパティを使用して、取り込みする特定の列を選択または選択解除します。

属性

説明

include_columns

オプションで、取り込みに含める列のリストを指定します。このオプションを使用して列を明示的に含めると、パイプラインは、今後ソースに追加される列を自動的に除外します。将来の列を取り込むには、それらをリストに追加する必要があります。

exclude_columns

必要に応じて、取り込みから除外する列のリストを指定します。このオプションを使用して列を明示的に除外すると、パイプラインには、将来ソースに追加される列が自動的に含まれます。

このページのパイプライン定義の例は、パイプライン作成インターフェイスに応じて、取り込み用の 3 つの特定の列を選択する方法を示しています。代わりに特定の列の選択を解除するには、テーブル構成で exclude_columns を指定します。

例: Google アナリティクス

YAML
resources:
pipelines:
pipeline_ga4:
name: <pipeline>
catalog: <target-catalog>
schema: <target-schema>
ingestion_definition:
connection_name: <connection>
objects:
- table:
source_url: <project-id>
source_schema: <property-name>
destination_catalog: <destination-catalog>
destination_schema: <destination-schema>
table_configuration:
include_columns:
- <column_a>
- <column_b>
- <column_c>

例: Salesforce

YAML
resources:
pipelines:
pipeline_sfdc:
name: <pipeline>
catalog: <target-catalog>
schema: <target-schema>
ingestion_definition:
connection_name: <connection>
objects:
- table:
source_schema: <source-schema>
source_table: <source-table>
destination_catalog: <destination-catalog>
destination_schema: <destination-schema>
table_configuration:
include_columns:
- <column_a>
- <column_b>
- <column_c>

例: Workday

YAML
resources:
pipelines:
pipeline_workday:
name: <pipeline>
catalog: <target-catalog>
schema: <target-schema>
ingestion_definition:
connection_name: <connection>
objects:
- report:
source_url: <report-url>
destination_catalog: <destination-catalog>
destination_schema: <destination-schema>
table_configuration:
include_columns:
- <column_a>
- <column_b>
- <column_c>