O que são tabelas na Databricks?
No Databricks, uma tabela é uma coleção estruturada de dados armazenados em um esquema. As tabelas são usadas para armazenar, consultar e gerenciar o uso de dados SQL ou Spark. O tipo de tabela default é uma tabela gerenciar Unity Catalog (UC), que usa Delta Lake para armazenamento confiável de dados.
Databricks suporta três tipos principais de tabelas, cada uma com características diferentes de propriedade e gerenciamento de dados:
Tipo de mesa | Descrição | Gerenciado por | Suporte de escrita |
---|---|---|---|
Databricks gerenciar arquivos de metadados e de dados. | Unity Catalog | Sim | |
Os metadados estão no Databricks, os dados são armazenados externamente. | Nenhum ou Unity Catalog | Sim | |
Faz referência a dados somente para leitura em sistemas externos por meio de federação. | Sistema externo | Não |
Para a maioria dos casos de uso, o site Databricks recomenda o uso de tabelas gerenciais.