Pular para o conteúdo principal

Tabelas do Databricks

Databricks oferece vários tipos de tabelas e formatos de armazenamento para atender a diferentes necessidades de gerenciamento de dados. Esta seção aborda as tabelas gerenciar, externas e estrangeiras, juntamente com os formatos de armazenamento Delta Lake e Apache Iceberg que potencializam recursos avançados como atomicidade, consistência, isolamento e durabilidade (transações ACID e viagem do tempo).

Conceitos fundamentais

Aprenda os fundamentos dos tipos de tabela, formatos de armazenamento e integração com o Unity Catalog.

tópico

Descrição

Conceitos de tabelas

Conceitos básicos e informações fundamentais sobre tipos de tabelas, formatos de armazenamento e integração do site Unity Catalog.

Tipos de mesa

Explore diferentes tipos de tabelas e seus recursos para vários cenários de gerenciamento de dados.

Tipo de mesa

Descrição

Tabelas gerenciadas

Tabelas em que Databricks gerenciar tanto os metadados quanto os arquivos de dados. Recomendado para novas tabelas com desempenho e armazenamento otimizados.

Tabelas externas

Tabelas que fazem referência a dados armazenados em sistemas de armazenamento externo enquanto gerenciam metadados no Unity Catalog.

Tabelas estrangeiras

Tabelas somente de leitura que representam dados em sistemas externos conectados por meio da Lakehouse Federation.

Formatos de armazenamento

Trabalhar com formatos de tabela abertos que oferecem recursos avançados de gerenciamento de dados.

Formato

Descrição

Delta Lake

formato de armazenamento padrão que fornece transações ACID, viagem do tempo e imposição de esquema para gerenciar e tabelas externas.

Iceberg Apache

Formato de tabela aberto para integração com o ecossistema Iceberg, com suporte ao gerenciamento avançado de metadados.

Gerenciamento de tabelas

Configurar e otimizar o comportamento, a estrutura e o desempenho da tabela.

Recurso

Descrição

Restrições de tabela

Defina e aplique regras de qualidade de dados com restrições de verificação e não com restrições nulas.

Imposição de esquema

Controle como o Databricks lida com alterações de esquema e aplicação de tipo de dados durante as gravações.

Particionamento de tabelas

Organizar os dados por chave de partição para melhorar o desempenho da consulta e o gerenciamento de dados.

Monitoramento do tamanho da tabela

Monitore e analise o uso do armazenamento de tabelas e os padrões de crescimento.

Converter externo para gerenciar

Migrar tabelas externas para gerenciar tabelas para melhorar o desempenho e o gerenciamento.

Descoberta de partições externas

Descobrir e registrar automaticamente partições em tabelas externas armazenadas no storage cloud.