Trabalhar com tabelas gerenciais
Databricks gerenciar o ciclo de vida e a disposição de arquivos para uma tabela gerenciar. As tabelas gerenciar são a maneira default de criar tabelas.
Databricks recomenda que o senhor use tabelas gerenciar para todos os dados tabulares gerenciar em Databricks. A otimização preditiva é ativada em todas as tabelas gerenciais do site Unity Catalog pelo endereço default. A otimização preditiva otimiza automaticamente as tabelas ao realizar operações de manutenção de dados, coletar estatísticas e, opcionalmente, escolher a chave clustering para suas tabelas. Consulte Otimização preditiva para Unity Catalog gerenciar tabelas.
Os arquivos de dados das tabelas gerenciar são armazenados no local de armazenamento gerenciar associado ao esquema que os contém. Consulte Especificar um local de armazenamento gerenciar em Unity Catalog.
O senhor pode trabalhar com tabelas gerenciáveis em todos os idiomas e produtos suportados no site Databricks. O senhor precisa de determinados privilégios para criar, atualizar, excluir ou consultar tabelas gerenciais. Consulte gerenciar privilégios em Unity Catalog.
Todas as leituras e gravações em tabelas gerenciais devem passar por Unity Catalog e usar o nome da tabela. Para obter informações sobre o uso de clientes externos com Unity Catalog gerenciar tabelas, consulte Access Databricks uso de dados de sistemas externos.
Este artigo se concentra em Unity Catalog gerenciar tables. gerenciar tabelas no site legado Hive metastore têm comportamentos diferentes. Consulte Objetos de banco de dados no site legado Hive metastore.
Criar uma tabela gerenciadora
Em default, sempre que o senhor criar uma tabela usando SQL comando, Spark, ou outras ferramentas em Databricks, a tabela será gerenciada.
A sintaxe SQL a seguir demonstra como criar uma tabela gerenciar vazia usando SQL. Substitua os valores do espaço reservado:
<catalog-name>
: nome do catálogo que conterá a tabela.<schema-name>
: nome do esquema que conterá a tabela.<table-name>
: Um nome para a tabela.<column-specification>
: o nome e o tipo de dados de cada coluna.
CREATE TABLE <catalog-name>.<schema-name>.<table-name>
(
<column-specification>
);
Muitos usuários criam tabelas gerenciar a partir de resultados de consultas ou DataFrame escrevem operações. Os artigos a seguir demonstram alguns dos muitos padrões que o senhor pode usar para criar uma mesa de gerenciar em Databricks:
Permissões necessárias
Para criar uma tabela gerenciar, o senhor deve ter:
- A permissão
USE SCHEMA
no esquema principal da tabela. - A permissão
USE CATALOG
no catálogo principal da tabela. - A permissão
CREATE TABLE
no esquema principal da tabela.
Soltar uma tabela gerenciar
Você deve ser o proprietário da tabela ou ter o privilégio MANAGE
na mesa para descartar uma tabela. Para eliminar uma tabela de gerenciar, execute o seguinte comando SQL:
DROP TABLE IF EXISTS catalog_name.schema_name.table_name;
Unity Catalog suporta o comando UNDROP TABLE
para recuperar tabelas de gerenciar descartadas por 7 dias. Após 7 dias, os dados subjacentes são marcados para serem excluídos de sua nuvem tenant durante as operações regulares de manutenção da tabela. Veja UNDROP.