Pular para o conteúdo principal

Selecione colunas a serem ingeridas

Aplica-se a : cheque marcado sim Criação de pipeline baseado em API

Em default, os conectores gerenciar em LakeFlow Connect ingerem todas as colunas atuais e futuras nas tabelas especificadas. Opcionalmente, use uma das seguintes propriedades de configuração de tabela em sua definição de pipeline para selecionar ou desmarcar colunas específicas para ingestão:

Propriedade

Descrição

include_columns

Opcionalmente, especifique uma lista de colunas a serem incluídas para ingestão. Se o senhor usar essa opção para incluir colunas explicitamente, o pipeline excluirá automaticamente as colunas que forem adicionadas à origem no futuro. Para ingerir as colunas futuras, você deve adicioná-las à lista.

exclude_columns

Opcionalmente, especifique uma lista de colunas a serem excluídas da ingestão. Se o senhor usar essa opção para excluir explicitamente as colunas, o pipeline incluirá automaticamente as colunas que forem adicionadas à origem no futuro.

Os exemplos de definições de pipeline nesta página mostram como selecionar três colunas específicas para ingestão, dependendo da interface de criação do pipeline. Em vez disso, para desmarcar colunas específicas, especifique exclude_columns na configuração da tabela.

Exemplo: Google analítica

YAML
resources:
pipelines:
pipeline_ga4:
name: <pipeline>
catalog: <target-catalog>
schema: <target-schema>
ingestion_definition:
connection_name: <connection>
objects:
- table:
source_url: <project-id>
source_schema: <property-name>
destination_catalog: <destination-catalog>
destination_schema: <destination-schema>
table_configuration:
include_columns:
- <column_a>
- <column_b>
- <column_c>

Exemplo: Salesforce

YAML
resources:
pipelines:
pipeline_sfdc:
name: <pipeline>
catalog: <target-catalog>
schema: <target-schema>
ingestion_definition:
connection_name: <connection>
objects:
- table:
source_schema: <source-schema>
source_table: <source-table>
destination_catalog: <destination-catalog>
destination_schema: <destination-schema>
table_configuration:
include_columns:
- <column_a>
- <column_b>
- <column_c>

Exemplo: Dia de trabalho

YAML
resources:
pipelines:
pipeline_workday:
name: <pipeline>
catalog: <target-catalog>
schema: <target-schema>
ingestion_definition:
connection_name: <connection>
objects:
- report:
source_url: <report-url>
destination_catalog: <destination-catalog>
destination_schema: <destination-schema>
table_configuration:
include_columns:
- <column_a>
- <column_b>
- <column_c>