Suporte a variantes no Delta Lake

Visualização

Esse recurso está em Prévia Pública.

O senhor pode usar o tipo de dados VARIANT para armazenar dados semiestruturados no Delta Lake. Para obter exemplos de como trabalhar com VARIANT, consulte Consultar dados de variantes.

O senhor deve usar o site Databricks Runtime 15.3 ou o acima para ler e gravar tabelas com o suporte a variantes ativado.

Ativar variante em uma tabela Delta

Para ativar a variante, crie uma nova tabela com uma coluna do tipo VARIANT, por exemplo:

CREATE TABLE table_name (variant_column VARIANT)

O senhor também pode habilitar o suporte para VARIANT em uma tabela existente usando a seguinte sintaxe:

ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')

Aviso

Quando o senhor ativa a variante, o protocolo da tabela é atualizado. Após a atualização, a tabela não poderá ser lida por clientes Delta Lake que não suportam a variante. Consulte Como Databricks o Delta Lake senhor pode gerenciar a compatibilidade do recurso ?

Limitações

Existem as seguintes limitações:

  • O senhor não pode usar colunas de variantes para particionar uma tabela.

  • Uma coluna de variante não pode ser uma clustering key para uma tabela.

  • Você não pode usar colunas variantes com cláusulas GROUP BY ou ORDER BY.

  • Você não pode chamar DISTINCT em uma coluna variante.

  • O senhor não pode usar operadores de conjunto SQL (INTERSECT, UNION, EXCEPT) com colunas variantes.

  • O senhor não pode usar a geração de colunas para criar uma coluna de variantes.

  • O Delta não coleta estatísticas minValues ou maxValues para colunas de variantes.