Pular para o conteúdo principal

Construir pipelines

Crie pipelines declarativos do LakeFlow Spark carregando e transformando dados, aplicando verificações de qualidade de dados e escrevendo os resultados nas suas tabelas de destino. Os tópicos a seguir abordam as tarefas envolvidas na criação e execução de pipelines.

Para aprender os conceitos declarativos por trás de pipeline — datasets, fluxos e o gráfico do pipeline — consulte O que é o Lakeflow Spark Declarative Pipelines. Para um passo a passo, consulte Tutorial: criar um pipeline ETL usando captura de dados de alterações (CDC).

tópico

Descrição

Desenvolver no Editor de Lakeflow Pipelines

Criar, executar e depurar pipelines no editor, com um gráfico de pipeline, pré-visualizações de dados e execução seletiva.

Use o Genie Code para o desenvolvimento de pipelines

Gerar, editar e depurar código de pipeline a partir de um único prompt com o modo Agente do Genie Code no editor.

Carregar dados

Faça a ingestão de dados em seu pipeline de armazenamento de objetos em cloud e barramentos de mensagens de transmissão.

Transformar dados

Aplique transformações, join e agregações para construir dataset derivados.

Refresh completo para tabelas de transmissão

Reprocessar todos os dados de origem para reconstruir uma tabela de transmissão.

Qualidade dos dados

Validar registros com expectativas e controlar o que acontece quando um registro falha.

Escreva conjuntos de dados

Grave os resultados de pipeline em coletores, como Apache Kafka e Hubs de Eventos do Azure, e use fluxos para gravar em destinos de transmissão.

Recursos adicionais

Nesta página