Pular para o conteúdo principal

Engenharia de dados com Databricks

Databricks fornece um rico conjunto de recursos de engenharia de dados que inclui um ambiente robusto para colaboração entre data scientists, engenheiros e analistas. No centro dele estão os pipelines que ingerem e transformam os dados. Para facilitar a engenharia do pipeline mais eficiente, o site Databricks oferece transmissão estruturada e DLT. Consulte a transmissão em Databricks e What is DLT?

Para obter uma visão geral de por que o processamento de transmissão incremental de dados fornecido pela transmissão estruturada e pela DLT é a melhor opção para o pipeline de dados, consulte Como criar um pipeline de dados simples, eficiente e de baixa latência.

Dados adicionais engenharia recurso

Databricks fornece recurso para engenharia de dados tarefa para muitos cenários adicionais:

nota

Se o senhor trabalha principalmente com consultas SQL e ferramentas de BI, consulte Databricks SQL.

Para obter um tutorial do Getting Come e informações introdutórias, consulte Get Come with Databricks e What is Databricks?

Nome

Use isso quando quiser...

DLT

Saiba como criar um pipeline de dados para ingestão e transformações com o Databricks DLT.

Transmissão estruturada

Saiba mais sobre cargas de trabalho de streaming, incrementais e em tempo real impulsionadas pelo Structured Streaming no Databricks.