Trabalhar com tabelas gerenciais
Databricks gerenciar o ciclo de vida e a disposição de arquivos para uma tabela gerenciar. As tabelas gerenciar são a maneira default de criar tabelas.
Databricks recomenda que o senhor use tabelas gerenciar para todos os dados tabulares gerenciar em Databricks.
Observação
Este artigo se concentra em Unity Catalog gerenciar tables. gerenciar tabelas no site legado Hive metastore têm comportamentos diferentes. Consulte Objetos de banco de dados no site legado Hive metastore.
Trabalhar com tabelas gerenciais
O senhor pode trabalhar com tabelas gerenciáveis em todos os idiomas e produtos suportados no site Databricks. O senhor precisa de determinados privilégios para criar, atualizar, excluir ou consultar tabelas gerenciais. Consulte gerenciar privilégios em Unity Catalog.
O senhor não deve usar ferramentas fora do site Databricks para manipular diretamente os arquivos nas tabelas gerenciais.
O senhor só deve interagir com arquivos de dados em uma tabela gerenciar usando o nome da tabela.
Os arquivos de dados das tabelas gerenciar são armazenados no local de armazenamento gerenciar associado ao esquema que os contém. Consulte Especificar um local de armazenamento gerenciar em Unity Catalog.
Criar uma tabela gerenciadora
Em default, sempre que o senhor criar uma tabela usando SQL comando, Spark, ou outras ferramentas em Databricks, a tabela será gerenciada.
A sintaxe SQL a seguir demonstra como criar uma tabela gerenciar vazia usando SQL. Substitua os valores do espaço reservado:
<catalog-name>
: nome do catálogo que conterá a tabela.<schema-name>
: nome do esquema que conterá a tabela.<table-name>
: Um nome para a tabela.<column-specification>
: o nome e o tipo de dados de cada coluna.
CREATE TABLE <catalog-name>.<schema-name>.<table-name>
(
<column-specification>
);
Muitos usuários criam tabelas gerenciar a partir de resultados de consultas ou DataFrame escrevem operações. Os artigos a seguir demonstram alguns dos muitos padrões que o senhor pode usar para criar uma mesa de gerenciar em Databricks:
Soltar uma tabela de gerenciar
Você deve ser o proprietário da tabela para descartá-la. Para descartar uma tabela gerenciada, execute o seguinte comando SQL:
DROP TABLE IF EXISTS catalog_name.schema_name.table_name;
Quando uma tabela gerenciada é descartada, seus dados subjacentes são excluídos de seu locatário de nuvem em 30 dias.