Tabelas do Databricks
Databricks oferece vários tipos de tabelas e formatos de armazenamento para atender a diferentes necessidades de gerenciamento de dados. Esta seção aborda as tabelas gerenciar, externas e estrangeiras, juntamente com os formatos de armazenamento Delta Lake e Apache Iceberg que potencializam recursos avançados como atomicidade, consistência, isolamento e durabilidade (transações ACID e viagem do tempo).
Conceitos fundamentais
Aprenda os fundamentos dos tipos de tabela, formatos de armazenamento e integração com o Unity Catalog.
tópico | Descrição |
---|---|
Conceitos básicos e informações fundamentais sobre tipos de tabelas, formatos de armazenamento e integração do site Unity Catalog. |
Tipos de mesa
Explore diferentes tipos de tabelas e seus recursos para vários cenários de gerenciamento de dados.
Tipo de mesa | Descrição |
---|---|
Tabelas em que Databricks gerenciar tanto os metadados quanto os arquivos de dados. Recomendado para novas tabelas com desempenho e armazenamento otimizados. | |
Tabelas que fazem referência a dados armazenados em sistemas de armazenamento externo enquanto gerenciam metadados no Unity Catalog. | |
Tabelas somente de leitura que representam dados em sistemas externos conectados por meio da Lakehouse Federation. |
Formatos de armazenamento
Trabalhar com formatos de tabela abertos que oferecem recursos avançados de gerenciamento de dados.
Formato | Descrição |
---|---|
formato de armazenamento padrão que fornece transações ACID, viagem do tempo e imposição de esquema para gerenciar e tabelas externas. | |
Formato de tabela aberto para integração com o ecossistema Iceberg, com suporte ao gerenciamento avançado de metadados. |
Gerenciamento de tabelas
Configurar e otimizar o comportamento, a estrutura e o desempenho da tabela.
Recurso | Descrição |
---|---|
Defina e aplique regras de qualidade de dados com restrições de verificação e não com restrições nulas. | |
Controle como o Databricks lida com alterações de esquema e aplicação de tipo de dados durante as gravações. | |
Organizar os dados por chave de partição para melhorar o desempenho da consulta e o gerenciamento de dados. | |
Monitore e analise o uso do armazenamento de tabelas e os padrões de crescimento. | |
Migrar tabelas externas para gerenciar tabelas para melhorar o desempenho e o gerenciamento. | |
Descobrir e registrar automaticamente partições em tabelas externas armazenadas no storage cloud. |