Notebook produtos e resultados
Depois que o senhor anexar um Notebook a um cluster e executar uma ou mais células, o Notebook terá estado e exibirá saídas. Esta seção descreve como gerenciar o estado e as saídas do Notebook.
Limpar o estado e as saídas do Notebook
Para limpar o estado e as saídas do Notebook, selecione uma das opções Limpar na parte inferior do menu de execução .
Opção de menu | Descrição |
---|---|
Limpar todas as saídas das células | Limpa as saídas da célula. Isso é útil se o senhor compartilhar o Notebook e quiser evitar a inclusão de resultados. |
Limpar o estado | Limpa o estado do Notebook, incluindo definições de funções e variáveis, dados e biblioteca importada. |
Limpar estado e saídas | Limpa as saídas de célula e o estado do Notebook. |
Limpar o estado e executar tudo | Limpa o estado do Notebook e inicia uma nova execução. |
Tabela de resultados
Quando uma célula é executada, os resultados são mostrados em uma tabela de resultados. Com a tabela de resultados, você pode fazer o seguinte:
- Copie uma coluna ou outro subconjunto de dados de resultados tabulares para a área de transferência.
- Faça uma pesquisa de texto na tabela de resultados.
- Classifique e filtre dados.
- Navegue entre as células da tabela usando a tecla de seta do teclado.
- Selecione parte do nome de uma coluna ou valor de célula clicando duas vezes e arrastando para selecionar o texto desejado.
Para view limites na tabela de resultados, consulte Notebook limites da tabela de resultados.
Selecionar dados
Para selecionar dados na tabela de resultados, siga um destes procedimentos.
- Copie os dados ou um subconjunto dos dados para a área de transferência.
- Clique no cabeçalho de uma coluna ou linha.
- Clique na célula superior esquerda da tabela para selecionar a tabela inteira.
- Arraste o cursor por qualquer conjunto de células para selecioná-las.
Para abrir um painel lateral que exibe informações de seleção, clique no ícone do painel no canto superior direito, ao lado da caixa Search (Pesquisar ).
Copiar dados para a prancheta
Para copiar a tabela de resultados no formato CSV para a área de transferência, clique na seta para baixo ao lado do título da tabela tab e, em seguida, clique em Copy results to clipboard (Copiar resultados para a área de transferência ).
Como alternativa, clique na caixa no canto superior esquerdo da tabela para selecionar a tabela completa e, em seguida, clique com o botão direito do mouse e selecione Copiar no menu suspenso.
Há várias maneiras de copiar os dados selecionados:
- Pressione
Cmd + C
no MacOS ouCtrl + C
no Windows para copiar os resultados para a área de transferência no formato CSV. - Clique com o botão direito do mouse e selecione Copiar para copiar os resultados para a área de transferência no formato CSV.
- Clique com o botão direito do mouse e selecione Copiar como para copiar os dados selecionados no formato CSV, TSV ou Markdown.
Classificar resultados
Para classificar a tabela de resultados pelos valores em uma coluna, passe o cursor sobre o nome da coluna. Um ícone contendo o nome da coluna aparece à direita da célula. Clique na seta para classificar a coluna.
Para classificar por várias colunas, mantenha pressionada a tecla Shift key enquanto clica na seta de classificação das colunas.
A classificação segue a ordem de classificação natural por default. Para impor uma ordem de classificação lexicográfica, use ORDER BY
no SQL ou as respectivas funções SORT
disponíveis em seu ambiente.
Filtrar resultados
Há várias maneiras de criar um filtro:
-
Clique
no canto superior direito dos resultados da célula. Na caixa de diálogo exibida, selecione a coluna a ser filtrada e a regra e o valor do filtro a serem aplicados. Por exemplo:
-
Para adicionar outro filtro, clique em
.
-
Para ativar ou desativar temporariamente um filtro, alterne o botão Ativado/Desativado na caixa de diálogo. Para excluir um filtro, clique no X ao lado do nome do filtro
.
-
Para filtrar por um valor específico, clique com o botão direito do mouse em uma célula com esse valor e selecione Filtrar por esse valor no menu suspenso.
-
Para filtrar em uma coluna específica, use o menu kebab no nome da coluna:
Em default, os filtros são aplicados somente aos resultados mostrados na tabela de resultados. Se os dados retornados forem truncados (por exemplo, quando uma consulta retornar mais de 10.000 linhas ou o site dataset for maior que 2 MB), o filtro será aplicado somente às linhas retornadas. Uma nota no canto superior direito da tabela indica que o filtro foi aplicado aos dados truncados.
Em vez disso, o senhor pode optar por filtrar o site dataset completo. Clique em Truncated data (Dados truncados ) e, em seguida, selecione Full dataset (Conjunto de dados completo ). Dependendo do tamanho do site dataset, pode levar muito tempo para o filtro ser aplicado.
Formatar colunas
Os cabeçalhos das colunas indicam o tipo de dados da coluna. Por exemplo, indica o tipo de dados inteiro. Passe o mouse sobre o indicador para ver o tipo de dados.
Você pode formatar colunas nas tabelas de resultados como tipos como Moeda , Porcentagem , URL e muito mais, com controle sobre casas decimais para obter tabelas mais claras.
Formate as colunas do menu kebab no nome da coluna.
Resultados do download
Em default, os resultados de downloads são ativados. Para alternar essa configuração, consulte gerenciar a capacidade de download resultados do Notebook.
O senhor pode fazer download de um resultado de célula que contenha saída tabular para seu computador local. Clique na seta apontando para baixo ao lado do título tab. As opções de menu dependem do número de linhas no resultado e da versão do Databricks Runtime. Os resultados dos downloads são salvos no computador local como um arquivo CSV com um nome correspondente ao nome do Notebook.
Para o Notebook conectado ao armazém SQL, o senhor também pode download os resultados como um arquivo Excel.
Explorar os resultados da célula SQL
Em um Databricks Notebook, os resultados de uma célula de linguagem SQL estão automaticamente disponíveis como um DataFrame atribuído à variável _sqldf
. O senhor pode usar a variável _sqldf
para fazer referência à saída SQL anterior nas células Python e SQL subsequentes. Para obter detalhes, consulte Explorar resultados de células SQL.
visualizar várias saídas por célula
Python Notebook e %python
células emPython Notebook não suportam várias saídas por célula. Por exemplo, a saída do código a seguir inclui tanto o gráfico quanto a tabela:
import pandas as pd
from sklearn.datasets import load_iris
data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)
Redimensionar saídas
Redimensione as saídas das células arrastando o canto inferior direito da tabela ou visualização.
Enviar os resultados do Notebook para as pastas Databricks Git
Para saber mais sobre o commit .ipynb Saídas do Notebook, consulte Permitir saída do Notebook do commit .ipynb.
- O Notebook deve ser um .ipynb arquivo
- As configurações de administração do espaço de trabalho devem permitir que as saídas do Notebook sejam confirmadas