imposição de esquema

A Databricks valida a qualidade dos dados impondo o esquema na gravação.

Observação

Este artigo descreve o comportamento de default para tabelas em Databricks, que são apoiadas por Delta Lake. A imposição de esquema não se aplica a tabelas apoiadas por dados externos.

imposição de esquema para operações de inserção

O Databricks aplica as seguintes regras ao inserir dados em uma tabela:

  • Todas as colunas inseridas devem existir na tabela de destino.

  • Todos os tipos de dados de coluna devem corresponder aos tipos de dados de coluna na tabela de destino.

Observação

O Databricks tenta converter com segurança os tipos de dados da coluna para que correspondam à tabela de destino.

Validação do esquema durante as operações MERGE

Databricks aplica as seguintes regras ao inserir ou atualizar dados como parte de uma operação MERGE:

  • Se o tipo de dados na instrução de origem não corresponder à coluna de destino, MERGE tentará converter com segurança os tipos de dados da coluna para que correspondam à tabela de destino.

  • As colunas que são o alvo de uma ação UPDATE ou INSERT devem existir na tabela de destino.

  • Ao usar a sintaxe INSERT * ou UPDATE SET *:

    • As colunas na fonte dataset que não estão presentes na tabela de destino são ignoradas.

    • A fonte dataset deve ter todas as colunas presentes na tabela de destino.

Modificar um esquema de tabela

O senhor pode atualizar o esquema de uma tabela usando instruções ALTER TABLE explícitas ou a evolução automática do esquema. Consulte Atualizar o esquema da tabela Delta Lake.

A evolução do esquema tem uma semântica especial para operações MERGE. Consulte Evolução automática do esquema para Delta Lake merge .