Pular para o conteúdo principal

imposição de esquema

A Databricks valida a qualidade dos dados impondo o esquema na gravação.

nota

Este artigo descreve o comportamento de default para tabelas em Databricks, que são apoiadas por Delta Lake. A imposição de esquema não se aplica a tabelas apoiadas por dados externos.

imposição de esquema para operações de inserção

O Databricks aplica as seguintes regras ao inserir dados em uma tabela:

  • Todas as colunas inseridas devem existir na tabela de destino.
  • Todos os tipos de dados da coluna devem corresponder aos tipos de dados da coluna na tabela de destino.
nota

O Databricks tenta converter com segurança os tipos de dados da coluna para que correspondam à tabela de destino.

Validação de esquema durante as operações do site MERGE

Databricks aplica as seguintes regras ao inserir ou atualizar dados como parte de uma operação MERGE:

  • Se o tipo de dados na instrução de origem não corresponder à coluna de destino, o site MERGE tentará converter com segurança os tipos de dados da coluna para que correspondam à tabela de destino.
  • As colunas que são o destino de uma ação UPDATE ou INSERT devem existir na tabela de destino.
  • Ao usar a sintaxe INSERT * ou UPDATE SET *:
    • As colunas na fonte dataset que não estão presentes na tabela de destino são ignoradas.
    • A fonte dataset deve ter todas as colunas presentes na tabela de destino.

Modificar um esquema de tabela

O senhor pode atualizar o esquema de uma tabela usando as instruções explícitas do site ALTER TABLE ou a evolução automática do esquema. Consulte Atualizar o esquema da tabela Delta Lake.

A evolução do esquema tem uma semântica especial para as operações do site MERGE. Consulte Evolução automática do esquema para Delta Lake merge .