Suporte a variantes no Delta Lake
Visualização
Esse recurso está em Public Preview.
O senhor pode usar o tipo de dados VARIANT
para armazenar dados semiestruturados no Delta Lake. Para ver exemplos de como trabalhar com VARIANT
, consulte Dados de variantes de consulta.
O senhor deve usar o site Databricks Runtime 15.3 ou o acima para ler e gravar tabelas com o suporte a variantes ativado.
Ativar variante em uma tabela Delta
Para ativar a variante, crie uma nova tabela com uma coluna do tipo VARIANT
, por exemplo:
CREATE TABLE table_name (variant_column VARIANT)
Você também pode ativar o suporte para VARIANT
em uma tabela existente usando a seguinte sintaxe:
ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')
Quando você ativa a variante, o protocolo da tabela é atualizado. Após a atualização, a tabela não poderá ser lida por clientes Delta Lake que não suportam a variante. Consulte Como Databricks o Delta Lake senhor pode gerenciar a compatibilidade do recurso?
Limitações
Aplicam-se as seguintes limitações:
- Você não pode usar colunas variantes para particionar uma tabela.
- Uma coluna de variante não pode ser uma clustering key para uma tabela.
- Você não pode usar colunas variantes com cláusulas
GROUP BY
ouORDER BY
. - Você não pode chamar
DISTINCT
em uma coluna variante. - O senhor não pode usar operadores de conjunto SQL (
INTERSECT
,UNION
,EXCEPT
) com colunas variantes. - Você não pode usar a geração de colunas para criar uma coluna variante.
- A Delta não coleta estatísticas
minValues
oumaxValues
para colunas de variantes.