Configurar um pipeline Delta Live Tables sem servidor

Este artigo descreve as configurações do pipeline serverless Delta Live Tables .

Databricks recomenda o desenvolvimento de um novo pipeline usando o site serverless. Algumas cargas de trabalho podem exigir a configuração do compute clássico ou o trabalho com o Hive metastore legado. Consulte Configurar compute para um Delta Live Tables pipelinee Usar o pipeline Delta Live Tables com o legado Hive metastore.

Observação

  • O pipeline sem servidor sempre usa Unity Catalog. O Unity Catalog para Delta Live Tables está em visualização pública e tem algumas limitações. Consulte Usar Unity Catalog com seu pipeline Delta Live Tables .

  • O senhor não pode adicionar manualmente as configurações de compute em um objeto clusters na configuração de JSON para um serverless pipeline. Tentar fazer isso resulta em um erro.

  • Para obter informações sobre elegibilidade e habilitação para o pipeline serverless DLT, consulte Enable serverless compute .

  • Se o senhor precisar usar uma conexão AWS PrivateLink com o pipeline serverless DLT, entre em contato com o representante Databricks.

Requisitos

  • Seu workspace deve ter o Unity Catalog ativado para usar o pipeline serverless.

Outras considerações de configuração

As seguintes opções de configuração também estão disponíveis para o pipeline serverless:

Política orçamentária

Visualização

Esse recurso está em Prévia Pública.

As políticas de orçamento permitem que sua organização aplique tags personalizadas no uso do serverless para atribuição de faturamento granular. Depois de marcar a caixa de seleção sem servidor, a configuração da política de orçamento é exibida, onde o senhor pode selecionar a política que deseja aplicar ao pipeline. O tags é herdado da política orçamentária e só pode ser editado pelos administradores do workspace.

Observação

Após a atribuição de uma política de orçamento ao senhor, seus pipelines existentes não são automaticamente marcados com a política. O senhor deve atualizar manualmente os pipelines existentes se quiser anexar uma política a eles.

Para obter mais informações sobre políticas orçamentárias, consulte Atributo serverless uso com políticas orçamentárias.

sem servidor pipeline recurso

Além de simplificar a configuração, o pipeline serverless tem o seguinte recurso:

  • Incremental refresh para visualização materializada: As atualizações da visualização materializada são atualizadas de forma incremental sempre que possível. O Incremental refresh tem os mesmos resultados que a recomputação completa. A atualização usa um refresh completo se os resultados não puderem ser computados de forma incremental. Consulte Incremental refresh para visualização materializada.

  • pipeline de transmissão: Para melhorar a utilização, a taxa de transferência e a latência das cargas de trabalho de transmissão de dados, como a ingestão de dados, os microbatches são um pipeline. Em outras palavras, em vez de executar microbatches sequencialmente como o padrão Spark transmissão estructurada, o pipeline serverless DLT executa microbatches simultaneamente, melhorando a utilização do recurso compute. O pipeline de transmissão é ativado por default em serverless pipeline DLT.

  • Escala automática vertical: serverless O pipeline DLT acrescenta à autoescala horizontal fornecida pela autoescala aprimorada Databricks alocando automaticamente os tipos de instância mais econômicos que podem executar seu Delta Live Tables pipeline sem falhar devido a erros de falta de memória. Consulte O que é a escala automática vertical?

O que é a escala automática vertical?

serverless A autoescala vertical do pipeline DLT aloca automaticamente os tipos de instância disponíveis mais econômicos para executar suas atualizações Delta Live Tables pipeline sem falhar devido a erros de falta de memória. A escala automática vertical aumenta quando são necessários tipos de instância maiores para executar uma atualização do pipeline e também diminui quando determina que a atualização pode ser executada com tipos de instância menores. A escala automática vertical determina se os nós do driver, os nós do worker ou os nós do driver e do worker devem ser dimensionados para cima ou para baixo.

A autoescala vertical é usada em todo o pipeline DLT do site serverless, incluindo o pipeline usado pela visualização materializada e pelas tabelas de transmissão do site Databricks SQL.

A autoescala vertical funciona detectando atualizações do pipeline que falharam devido a erros de falta de memória. A autoescala vertical aloca tipos de instância maiores quando essas falhas são detectadas com base nos dados fora da memória coletados da atualização com falha. No modo de produção, uma nova atualização que usa o novo compute recurso é iniciada automaticamente. No modo de desenvolvimento, o novo recurso compute é usado quando o senhor começa manualmente uma nova atualização.

Se a autoescala vertical detectar que a memória das instâncias alocadas está sendo subutilizada de forma consistente, ela reduzirá os tipos de instância a serem usados na próxima atualização do site pipeline.

Converta um pipeline existente para usar o serverless

O senhor pode converter o pipeline existente configurado com Unity Catalog para o pipeline serverless. Complete os seguintes passos:

  1. Clique em Delta Live Tables na barra lateral.

  2. Clique no nome do pipeline desejado na lista.

  3. Clique em Configurações.

  4. Marque a caixa ao lado de sem servidor.

  5. Clique em Save and Começar.

Importante

Quando o senhor habilita o serverless, todas as configurações do compute que tiver configurado para um pipeline são removidas. Se o senhor mudar um pipeline de volta para atualizações que não sejam doserverless, deverá reconfigurar as configurações desejadas do compute para a configuração do pipeline.

Como posso encontrar o uso de DBU de um pipeline sem servidor?

O senhor pode encontrar o uso DBU do pipeline serverless DLT consultando a tabela de uso faturável, parte das tabelas do sistema Databricks. Consulte Qual é o consumo de DBU de um pipeline DLT sem servidor?