Suporte a variantes no Delta Lake
Visualização
Esse recurso está em Prévia Pública.
O senhor pode usar o tipo de dados VARIANT
para armazenar dados semiestruturados no Delta Lake. Para obter exemplos de como trabalhar com VARIANT
, consulte Consultar dados de variantes.
O senhor deve usar o site Databricks Runtime 15.3 ou o acima para ler e gravar tabelas com o suporte a variantes ativado.
Ativar variante em uma tabela Delta
Para ativar a variante, crie uma nova tabela com uma coluna do tipo VARIANT
, por exemplo:
CREATE TABLE table_name (variant_column VARIANT)
O senhor também pode habilitar o suporte para VARIANT
em uma tabela existente usando a seguinte sintaxe:
ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')
Aviso
Quando o senhor ativa a variante, o protocolo da tabela é atualizado. Após a atualização, a tabela não poderá ser lida por clientes Delta Lake que não suportam a variante. Consulte Como Databricks o Delta Lake senhor pode gerenciar a compatibilidade do recurso ?
Limitações
Existem as seguintes limitações:
O senhor não pode usar colunas de variantes para particionar uma tabela.
Uma coluna de variante não pode ser uma clustering key para uma tabela.
Você não pode usar colunas variantes com cláusulas
GROUP BY
ouORDER BY
.Você não pode chamar
DISTINCT
em uma coluna variante.O senhor não pode usar operadores de conjunto SQL (
INTERSECT
,UNION
,EXCEPT
) com colunas variantes.O senhor não pode usar a geração de colunas para criar uma coluna de variantes.
O Delta não coleta estatísticas
minValues
oumaxValues
para colunas de variantes.