Pular para o conteúdo principal

O que são tabelas na Databricks?

No Databricks, uma tabela é uma coleção estruturada de dados armazenados em um esquema. As tabelas são usadas para armazenar, consultar e gerenciar o uso de dados SQL ou Spark. O tipo de tabela default é uma tabela gerenciar Unity Catalog (UC), que usa Delta Lake para armazenamento confiável de dados.

Databricks suporta três tipos principais de tabelas, cada uma com características diferentes de propriedade e gerenciamento de dados:

Tipo de mesa

Descrição

Gerenciado por

Suporte de escrita

Gerenciadas

Databricks gerenciar arquivos de metadados e de dados.

Unity Catalog

Sim

Externo

Os metadados estão no Databricks, os dados são armazenados externamente.

Nenhum ou Unity Catalog

Sim

Externo

Faz referência a dados somente para leitura em sistemas externos por meio de federação.

Sistema externo

Não

Para a maioria dos casos de uso, o site Databricks recomenda o uso de tabelas gerenciais.