Pular para o conteúdo principal

O que são tabelas na Databricks?

No Databricks, uma tabela é uma coleção estruturada de dados armazenados dentro de um esquema. As tabelas são usadas para armazenar, consultar e gerenciar dados SQL ou Spark. O tipo de tabela default é uma tabela gerencial Unity Catalog , que utiliza Delta Lake para armazenamento confiável de dados.

Databricks suporta três tipos principais de tabelas, cada uma com características diferentes de propriedade e gerenciamento de dados:

Tipo de mesa

Descrição

Gerenciado por

Suporte de escrita

Gerenciadas

Databricks gerenciar arquivos de metadados e de dados.

Unity Catalog

Sim

Externo

Os metadados estão no Databricks, os dados são armazenados externamente.

Nenhum ou Unity Catalog

Sim

Externo

Faz referência a dados somente para leitura em sistemas externos por meio de federação.

Sistema externo

Não

Temporário

Tabelas com escopo de sessão para armazenamento de dados intermediários.

Nenhum (com escopo de sessão)

Sim

Para a maioria dos casos de uso, o site Databricks recomenda o uso de tabelas gerenciais.