Referência de propriedades do Delta Live Tables
Este artigo fornece uma referência para a especificação de configuração JSON do Delta Live Tables e propriedades da tabela no Databricks. Para obter mais detalhes sobre como usar essas várias propriedades e configurações, consulte os seguintes artigos:
Configurações de pipeline do Delta Live Tables
Campos |
---|
Tipo: Um identificador globalmente exclusivo para este pipeline. O identificador é atribuído pelo sistema e não pode ser alterado. |
Tipo: Um nome amigável para este pipeline. O nome pode ser usado para identificar Job do pipeline na interface do usuário. |
Tipo: Um local no DBFS ou armazenamento cloud onde os dados de saída e os metadados necessários para a execução do pipeline são armazenados. Tabelas e metadados são armazenados em subdiretórios deste local. Quando a configuração A configuração |
Tipo: Uma lista opcional de configurações para adicionar à configuração do Spark dos clusters que executarão o pipeline. Essas configurações são lidas pelo Delta Live Tables Runtime e disponíveis para query de pipeline por meio da configuração do Spark. Os elementos devem ser formatados como pares |
Tipo: Uma matriz de Notebook contendo o código do pipeline e os artefatos necessários. |
Tipo: Uma matriz de especificações para os clusters para execução do pipeline. Se isso não for especificado, os pipelines selecionarão automaticamente uma configuração clusters default para o pipeline. |
Tipo: Um sinalizador que indica se o pipeline deve ser executado no modo O valor default é |
Tipo: Uma matriz opcional de especificações para notificações por email quando uma atualização de pipeline é concluída, falha com um erro que pode ser repetido, falha com um erro que não pode ser repetido ou um fluxo falha. |
Tipo: Um sinalizador que indica se o pipeline deve ser executado continuamente. O valor default é |
Tipo: O nome de um banco de dados para dados de saída de pipeline persistentes. Definir a configuração |
Tipo: A versão do Delta Live Tables Runtime a ser usada. Os valores suportados são:
O campo |
Tipo A edição do produto Delta Live Tables para execução do pipeline. Essa configuração permite escolher a melhor edição do produto com base nos requisitos do seu pipeline:
O campo |
Tipo: Um sinalizador indicando se deve ser usado What is Photon? para executar o pipeline. Photon é o mecanismo Spark de alto desempenho do Databricks. pipeline habilitados para Photon são cobrados a uma taxa diferente dos pipeline não-Photon. O campo |
Tipo: Se ocorrer uma falha tentável durante uma atualização do pipeline, esse é o número máximo de vezes para tentar novamente um fluxo antes de falhar na atualização do pipeline padrão: Duas tentativas de repetição. Quando ocorre uma falha de repetição, o tempo de execução do Delta Live Tables tenta executar o fluxo três vezes, incluindo a tentativa original. |
Tipo: Se ocorrer uma falha que pode ser repetida durante uma atualização, esse é o número máximo de vezes para tentar novamente a atualização antes de falhar permanentemente na atualização. A nova tentativa é executada como uma atualização completa. Esse parâmetro se aplica somente ao pipeline em execução no modo de produção. Não há tentativas de novas tentativas se o site pipeline for executado no modo de desenvolvimento ou quando o senhor executar uma atualização default:
|
Propriedades da tabela Delta Live Tables
Além das propriedades da tabela suportadas pelo Delta Lake, você pode definir as seguintes propriedades da tabela.
Propriedades da tabela |
---|
default: Ativa ou desativa a otimização agendada automaticamente desta tabela. |
default: nenhum Uma strings opcional contendo uma lista separada por vírgulas de nomes de coluna para esta tabela em Z-order. Por exemplo, |
default: Controla se uma refresh completa é permitida para esta tabela. |
Intervalo de acionamento de pipelines
O senhor pode especificar um intervalo de acionamento pipeline para todo o Delta Live Tables pipeline ou como parte de uma declaração dataset. Consulte Definir intervalo de acionamento para pipelines contínuos.
|
---|
O default é baseado no tipo de fluxo:
O valor é um número mais a unidade de tempo. A seguir estão as unidades de tempo válidas:
Você pode usar a unidade singular ou plural ao definir o valor, por exemplo:
|
atributos clusters que não são configuráveis pelo usuário
Como o Delta Live Tables gerencia os ciclos de vida dos clusters, muitas configurações de clusters são definidas pelo Delta Live Tables e não podem ser configuradas manualmente pelos usuários, seja em uma configuração de pipeline ou em uma política de cluster usada por um pipeline. A tabela a seguir lista essas configurações e por que elas não podem ser definidas manualmente.
Campos |
---|
Delta Live Tables define os nomes dos clusters usados para atualizações de pipeline de execução. Esses nomes não podem ser substituídos. |
Esses valores são definidos automaticamente pelo sistema. |
Execução de clusters Delta Live Tables em uma versão personalizada do Databricks Runtime que é continuamente atualizada para incluir os recursos mais recentes. A versão do Spark é fornecida com a versão do Databricks Runtime e não pode ser substituída. |
Como o Delta Live Tables gerencia a lógica de reutilização e encerramento automático clusters , o tempo de encerramento automático clusters não pode ser substituído. |
Embora você possa controlar esse campo habilitando Photon para seu pipeline, não é possível definir esse valor diretamente. |
Este valor é definido automaticamente pelo sistema. |
Este campo é definido pelo sistema e é somente leitura. |
Como o Delta Live Tables gerencia o ciclo de vida do cluster, você não pode usar um contêiner personalizado com clusters de pipeline. |
Este valor é definido pelo sistema e não pode ser substituído. |