Pular para o conteúdo principal

Edição básica no Databricks Notebook

O Databricks Notebook é um editor de código baseado na Web que permite escrever código e view resultados para análise interativa de dados. Esta página aborda as noções básicas de uso do Notebook em Databricks, incluindo como navegar pela barra de ferramentas e executar várias ações nas células.

Criar um notebook

O senhor pode criar um novo Notebook de várias maneiras:

Abrir um Notebook

Para abrir um Notebook, use a workspace função Search ou use o workspace navegador para navegar até o Notebook e clique no nome ou ícone do Notebook.

Se a guia para Notebook e arquivos estiver ativada, o senhor poderá abrir um Notebook em um novo tab.

Notebook células

O Notebook contém uma coleção de dois tipos de células: células de código e células Markdown. As células de código contêm código executável. As células Markdown contêm código Markdown que é renderizado como texto e gráficos. Use o Markdown para documentar ou ilustrar seu código. O senhor pode adicionar ou remover células de qualquer tipo no Notebook para estruturar seu trabalho.

O senhor pode executar uma única célula, um grupo de células ou todo o Notebook. Uma célula de Notebook pode conter no máximo 6 MB e sua saída é limitada a 20 MB.

Notebook ícones e botões da barra de ferramentas

A barra de ferramentas inclui menus e ícones que o senhor pode usar para gerenciar e editar o Notebook.

Barra de ferramentas do Notebook

Ao lado do nome do Notebook há botões para alterar o default idioma do Notebook e, se o Notebook estiver incluído em uma pasta Databricks Git , abrir a caixa de diálogo Git.

Para view versões anteriores do Notebook, clique na mensagem "Last edit..." (Última edição...) à direita dos menus.

Os ícones e botões à direita da barra de ferramentas são descritos na tabela a seguir:

Ícone

Descrição

Botão Executar tudo Botão de interrupção de execução

Executar todas as células ou interromper a execução. O nome desse botão muda de acordo com o estado do Notebook.

Seletor de computação do cabeçalho do Notebook

Abra o seletorcompute. Quando o Notebook está conectado a um agrupamento ou SQL warehouse, esse botão mostra o nome do recurso compute.

Programador de tarefas de cabeçalho de notebook

Programa de emprego aberto.

Seletor DLT do cabeçalho do Notebook

Abra o DLT. Esse botão aparece somente se o Notebook fizer parte de um DLT pipeline.

Botão de compartilhamento de cabeçalho de notebook

Abra a caixa de diálogo de permissões.

Ações da barra lateral direita

Várias ações estão disponíveis na barra lateral direita do notebook, conforme descrito na tabela a seguir:

Ícone

Descrição

Ícone de comentários no cabeçalho do notebook

Comentários do Open Notebook.

Ícone de experiência no cabeçalho do notebook

Abra o experimentoMLflow Notebook.

Ícone Histórico de versões do Notebook

História da versão Open Notebook.

Explorador de variáveis do Notebook

Abra o explorador de variáveis. (Disponível para variáveis Python com Databricks Runtime 12.2 LTS e acima.)

Ambiente de notebook

Abra o painel de ambiente do Python. Este painel mostra todas as bibliotecas disponíveis no Python para o notebook, incluindo bibliotecas com escopo de notebook, bibliotecas de cluster e bibliotecas incluídas no Databricks Runtime. Disponível somente quando o notebook estiver anexado a um agrupamento.

Crie células

O Notebook tem dois tipos de células: código e Markdown. O conteúdo das células Markdown é renderizado em HTML. Por exemplo, esse trecho contém marcação para um título de nível um:

Markdown
%md ### Libraries
Import the necessary libraries.

Renderiza conforme mostrado:

exemplo de Markdown renderizado

Para criar uma nova célula, passe o mouse sobre uma célula na parte superior ou inferior. Clique em Código ou Texto para criar um código ou uma célula Markdown, respectivamente.

botões para criar uma nova célula

Ações celulares

O menu de ações da célula permite que o senhor execute, corte e copie células, mova células no Notebook e oculte códigos ou resultados.

execução a cell

Para executar células de código, clique na seta para baixo no canto superior esquerdo da célula de código.

Menu de execução de células

Depois que uma célula é executada, um aviso aparece à direita do menu de execução da célula, mostrando a última vez que a célula foi executada e sua duração. Passe o cursor sobre o aviso para obter mais detalhes.

Para exibir informações detalhadas de execução em default, clique na imagem de seu perfil no canto superior direito. Em seguida, clique em Settings > Developer > Show detailed comando execution information .

imagem da última execução

Se o senhor tiver uma saída de resultado tabular, também poderá acessar essas informações passando o mouse sobre a seção "Last refreshed" (Última atualização) da UI.

execução células selecionadas

O senhor pode executar uma única célula ou um conjunto de células. Para selecionar uma única célula, clique em qualquer lugar dentro da célula. Para selecionar várias células, mantenha pressionado o botão Command key no MacOS ou o Ctrl key no Windows e clique na célula fora da área de texto, conforme mostrado na captura de tela.

como selecionar várias células

Para executar as células selecionadas, clique em execução > executar e depurar > executar célula(s) selecionada(s) ou use o atalho de teclado Command + Enter no MacOS ou Crtl + Enter em Windows. O comportamento desse comando depende do recurso compute ao qual o Notebook está vinculado.

  • Em um recurso compute em execução Databricks Runtime 13.3 LTS ou abaixo, as células selecionadas são executadas individualmente. Se ocorrer um erro em uma célula, a execução continuará com as células subsequentes.
  • Em um compute recurso executando Databricks Runtime 14.0 ou acima, ou em um SQL warehouse, as células selecionadas são executadas como um lote. Qualquer erro interrompe a execução e você não pode cancelar a execução de células individuais. Você pode usar o botão Interromper para interromper a execução de todas as células.

execução texto selecionado

O senhor pode destacar o código ou as declarações do SQL em uma célula do Notebook e executar somente o código destacado. Isso é útil quando você deseja iterar rapidamente o código e as consultas.

  1. Destaque as linhas que você deseja executar.

  2. Selecione Executar > Executar o texto selecionado ou use o atalho de teclado Ctrl+Shift+Enter. Se nenhum texto estiver destacado, Executar texto selecionado executa a linha atual.

    executar as linhas selecionadas

Se você estiver usando idiomas mistos em uma célula, deverá incluir a linha %<language> na seleção.

Executar o texto selecionado também executa o código recolhido, se houver algum na seleção destacada.

Comandos de célula especiais como %run, %pip e %sh são suportados.

Não é possível usar Executar texto selecionado em células que tenham várias guias de saída (ou seja, células nas quais você definiu um perfil de dados ou visualização).

Ícones de células

A captura de tela a seguir descreve os ícones que aparecem no canto superior direito de uma célula do Notebook:

ícones de células no canto superior direito

Seletor de idioma: selecione o idioma da célula.

Databricks Assistant: Ative ou desative o Databricks Assistant para sugestões de código na célula.

Foco na célula: amplie a célula para facilitar a edição.

Exibir menu de ações da célula: Abra o menu de ações da célula. As opções nesse menu são um pouco diferentes para células de código e Markdown.

Menu Ações da célula

Excluir uma célula

Para excluir uma célula, clique no ícone da lixeira à direita da célula. Esse ícone só aparece quando você passa o cursor sobre a célula.

ícone de lixo celular

Mover uma célula

Para mover uma célula para cima ou para baixo, clique e segure o ícone da alça de arrasto ícone de movimento da célula à esquerda da célula.

arrastar célula para cima ou para baixo

Você também pode selecionar Mover para cima ou Mover para baixo no menu de ações da célula.

Recortar, copiar e colar células

Existem várias opções para cortar e copiar células. No entanto, se você estiver usando o navegador Safari, somente os atalhos do teclado estarão disponíveis.

  • No menu de ações da célula, selecione Cortar célula ou Copiar célula .
  • Use atalhos de teclado: Command-X ou Ctrl-X para recortar e Command-C ou Ctrl-C para copiar.
  • Use o menu Editar na parte superior do notebook. Selecione Recortar ou Copiar .

Depois de cortar ou copiar células, é possível colar essas células em outro local do Notebook, em outro Notebook ou em um Notebook em outro navegador tab ou janela. Para colar células, use o atalho de teclado Command-V ou Ctrl-V. As células são coladas abaixo da célula atual.

Para desfazer ações de recortar ou colar, você pode usar o atalho de teclado Command-Z ou Ctrl-Z ou as opções de menu Editar > Desfazer células recortadas ou Editar > Desfazer células coladas.

Para selecionar células adjacentes, clique em uma célula Markdown e, em seguida, use Shift + Cima ou Baixo para selecionar as células acima ou abaixo dela. Utilize o menu editar para copiar, recortar, colar ou excluir as células selecionadas como um grupo. Para selecionar todas as células, selecione Editar > Selecionar Todas as Células ou use o atalho do modo de comando Cmd+A .

Adicionar comentários de código

Para adicionar um comentário ao código em uma célula, destaque o código. À direita da célula, aparece um ícone de comentário. Clique no ícone para abrir a caixa de comentários.

ícone de comentário

Adicionar uma célula a um painel

Para adicionar uma célula Markdown ou uma célula que tenha resultados tabulares a um painel, selecione Adicionar ao painel no menu de ações da célula. Para obter mais informações, consulte Dashboards no Notebook.

Para obter um link de URL para um comando específico em seu Notebook, clique em ícone de foco de célula para abrir o modo de foco e copie o URL da barra de endereços do navegador. Para sair do modo de foco, clique em ícone de foco da célula de saída.

Aberto Databricks Assistant

Para abrir uma caixa de texto do Databricks Assistant em uma célula, clique no ícone do Databricks Assistant Ícone do assistente do Databricks no canto superior direito da célula.

Você pode usá-lo em uma célula de código para obter ajuda ou sugestões para seu código. Databricks Assistant deve estar ativado em seu site workspace.