Pular para o conteúdo principal

Explorar e criar tabelas no DBFS

important

Essa documentação foi descontinuada e pode não estar atualizada. O produto, serviço ou tecnologia mencionados neste conteúdo não são mais suportados. Veja upload de arquivos para Databricks, Criar ou modificar uma tabela usando o arquivo upload e O que é o Catalog Explorer?

Acessar o upload de arquivos DBFS herdados e a interface de criação de tabelas por meio da interface de adição de dados. Clique em Novo ícone New > Data > DBFS .

O senhor também pode acessar a UI do Notebook clicando em File (Arquivo) > Add data (Adicionar dados ).

A Databricks recomenda o uso do Catalog Explorer para uma experiência aprimorada de visualização de objetos de dados e gerenciamento de ACLs e a página Criar ou modificar tabela a partir de upload de arquivo para ingerir facilmente pequenos arquivos no Delta Lake.

nota

A disponibilidade de alguns elementos descritos neste artigo varia de acordo com as configurações do site workspace. Entre em contato com o administrador do workspace ou com a equipe do Databricks account .

Importar dados

Se tiver pequenos arquivos de dados em sua máquina local que deseja analisar com o Databricks, o senhor pode importá-los para o DBFS usando a interface do usuário.

nota

Os administradores do workspace podem desativar esse recurso. Para obter mais informações, consulte gerenciar dados upload.

Crie uma tabela

O senhor pode iniciar a interface de usuário de criação de tabela do DBFS clicando em Novo ícone New na barra lateral ou no botão DBFS na interface de usuário de adição de dados. O senhor pode preencher uma tabela a partir de arquivos no DBFS ou fazer upload de arquivos.

Com a interface do usuário, você só pode criar tabelas externas.

  1. Escolha uma fonte de dados e siga as etapas da seção correspondente para configurar a tabela.

    Se o administrador do Databricks workspace tiver desativado a opção de upload de arquivo, o senhor não terá a opção de upload arquivos; poderá criar tabelas usando uma das outras fontes de dados.

    Instruções para upload de arquivos

    1. Arraste os arquivos para a zona suspensa Arquivos ou clique na zona suspensa para navegar e escolher os arquivos. Após o upload, é exibido um caminho para cada arquivo. O caminho será algo como /FileStore/tables/<filename>-<integer>.<file-type>. O senhor pode usar esse caminho em um Notebook para ler dados.
    2. Clique em Criar tabela com interface do usuário .
    3. No menu suspenso de clustering, escolha um clustering.

    Instruções para DBFS

    1. Selecione um arquivo.
    2. Clique em Criar tabela com interface do usuário .
    3. No menu suspenso de clustering, escolha um clustering.
  2. Clique em Preview Table (Visualizar tabela ) para view a tabela.

  3. No campo Table Name (Nome da tabela ), substitua opcionalmente o nome da tabela default. Um nome de tabela pode conter apenas caracteres alfanuméricos minúsculos e sublinhados e deve começar com uma letra minúscula ou sublinhado.

  4. No campo Criar no banco de dados , opcionalmente, substitua o banco de dados default selecionado.

  5. No campo Tipo de arquivo , opcionalmente, substitua o tipo de arquivo inferido.

  6. Se o tipo de arquivo for CSV:

    1. No campo Delimitador de coluna , selecione se deseja substituir o delimitador inferido.
    2. Indique se deseja usar a primeira linha como títulos das colunas.
    3. Indique se deseja inferir o esquema.
  7. Se o tipo de arquivo for JSON, indique se o arquivo tem várias linhas.

  8. Clique em Criar tabela .

visualizar bancos de dados e tabelas

nota

com o Catalog Explorer ativado não têm acesso ao comportamento herdado descrito abaixo.

Clique em Ícone de catálogo Catálogo na barra lateral. Databricks seleciona os clusters em execução aos quais o senhor tem acesso. A pasta Bancos de dados exibe a lista de bancos de dados com o banco de dados default selecionado. A pasta Tables exibe a lista de tabelas no banco de dados default.

Criar lista de tabelas

O senhor pode alterar o clustering no menu Databases (Bancos de dados), criar tabela UI ou view table UI. Por exemplo, no menu Bancos de dados:

  1. Clique na seta Abaixo do cursor para baixo na parte superior da pasta Bancos de dados.

  2. Selecione um clustering.

    Selecionar clustering

ver detalhes da tabela

Os detalhes da tabela view mostram o esquema da tabela e os dados de amostra.

  1. Clique em Ícone de catálogo Catálogo na barra lateral.

  2. Na pasta Bancos de dados, clique em um banco de dados.

  3. Na pasta Tabelas, clique no nome da tabela.

  4. No menu suspenso de clustering, selecione opcionalmente outro clustering para renderizar a visualização da tabela.

    Detalhes da tabela

nota

Para exibir a visualização da tabela, uma execução da consulta Spark SQL no clustering selecionado no menu suspenso de clustering . Se o clustering já tiver uma carga de trabalho em execução, a visualização da tabela poderá demorar mais para carregar.

Excluir uma tabela usando a interface

  1. Clique em Ícone de catálogo Catálogo na barra lateral.
  2. Clique ao Menu suspenso lado do nome da tabela e selecione Excluir .