Análise de dados com o Notebook
No SAP Databricks, os usuários podem usar o Databricks Notebook para realizar ciência de dados e tarefa analítica. Uso do notebook Databricks' recursos robustos de plataforma para que o senhor possa trabalhar com dados SAP e externos.
Notebooks são uma ferramenta comum em ciência de dados e aprendizado de máquina para desenvolver código e apresentar resultados. No Databricks, os notebooks são a principal ferramenta para criar fluxos de trabalho de ciência de dados e aprendizado de máquina e colaborar com colegas. Os notebooks do Databricks fornecem coautoria em tempo real em vários idiomas, controle de versão automático e visualizações de dados integradas.
Databricks O Notebook no SAP Databricks suporta Python e SQL, e permite que os usuários incorporem visualizações juntamente com links, imagens e comentários escritos em markdown.
Esta página apresenta orientações específicas para o uso do Notebook no SAP Databricks.
recurso
Os seguintes recursos relacionados ao Notebook estão incluídos no SAP Databricks:
- Notebooks do Databricks
- computação sem servidor
- Visualizações no Notebook Databricks
- Depurador interativo de Python
- Bloco de notas programado
- Pastas Git
- Databricks Assistant
- Terminal web
Criar e editar um Notebook
O Databricks Notebook é um editor de código baseado na Web que permite escrever código e view resultados para análise interativa de dados.
Para criar um novo Notebook em sua pasta default, clique em + New (Novo ) na barra lateral esquerda e selecione Notebook no menu.
O Databricks cria e abre um novo notebook em branco na pasta padrão. A linguagem padrão é a linguagem usada mais recentemente, e o notebook é anexado automaticamente ao recurso de computação usado mais recentemente.
Conecte-se ao site serverless compute recurso
No SAP Databricks, serverless compute permite que o senhor conecte rapidamente seu Notebook a um recurso de computação sob demanda.
Para anexar ao site serverless compute, clique no menu suspenso Connect (Conectar ) no Notebook e selecione serverless (sem servidor ). O senhor também pode se conectar a qualquer armazém serverless SQL ao qual tenha acesso. Para saber mais sobre os tipos de serverless compute no SAP Databricks, consulte serverless compute.
Importar dados do SAP para um Notebook
Um produto de dados SAP ativo pode ser analisado em um Notebook depois de ser montado em um catálogo em Unity Catalog. Para analisar esses dados, o senhor precisa de acesso READ ao catálogo e ao esquema que contêm o destino dataset.
abaixo é um exemplo de consulta:
- SQL
- Python
select * from sap_data.cashflow.cashflowforecast
display(spark.read.table("sap_data.cashflow.cashflowforecast"))
Crie visualizações
Databricks tem suporte integrado para gráficos e visualizações em Databricks SQL e no Notebook. Use a ferramenta de visualização integrada em um Databricks Notebook para analisar rapidamente seus dados e gerar visualizações.
Para criar uma visualização:
- Depois de executar uma célula do Notebook com resultados de dados tabulares, clique + acima de um resultado e selecione Visualization (Visualização ). O editor de visualização é exibido.
- Insira um nome de visualização como o novo título no editor de visualização.
- No menu suspenso Tipo de visualização , selecione seu tipo de gráfico.
- Personalize e revise as propriedades da visualização. Selecione as colunas que o senhor gostaria de graficar e como agrupar os dados. Personalize sua aparência conforme desejado. Os campos disponíveis dependem do tipo selecionado.
- Clique em Salvar .
Caderno de depuração
Se estiver trabalhando em Python, poderá usar o depurador interativo integrado no Notebook Databricks para ajudá-lo a depurar seu código. O depurador interativo oferece pontos de interrupção, execução passo a passo, inspeção de variáveis e outras ferramentas para ajudá-lo a desenvolver códigos no Notebook com mais eficiência.
Use as etapas a seguir para ativar o depurador:
- Clique no seu nome de usuário no canto superior direito do site workspace e selecione Settings (Configurações ) na lista dropdown.
- Na barra lateral Configurações , selecione Desenvolvedor .
- Na seção Editor settings (Configurações do editor ), ative a opção Python Notebook Interactive Debugger (Depurador interativo do notebook Python ).
Programar um Notebook
O senhor pode criar e gerenciar o Job do Notebook diretamente na UI do Notebook. Se um Notebook já estiver atribuído a um ou mais trabalhos, o senhor pode criar e gerenciar programar para esses trabalhos. Se um Notebook não estiver atribuído a um Job, o senhor pode criar um Job e programar a execução do Notebook. Consulte Programar um Notebook.
Pastas do Git
As pastas Git do Databricks são um cliente Git visual e uma API no Databricks. Ele oferece suporte a operações comuns do Git, como clonagem de um repositório, commit e push, pull, gerenciamento de ramificações e comparação visual de diferenças ao fazer o commit.
Nas pastas Git, o senhor pode desenvolver código no Notebook ou em outros arquivos e seguir as práticas recomendadas de desenvolvimento de código de ciência de dados e engenharia usando Git para controle de versão, colaboração e CI/CD.
Databricks Assistant
Databricks Assistant é um assistente AI sensível ao contexto que pode ajudá-lo com dados e códigos. O senhor pode acessar o assistente no editor SQL e no Notebook. O assistente oferece:
- AI-based autocomplete.
- Filtragem de dados com solicitações de linguagem natural.
- Código de depuração com Diagnose Error .
- Quick Fix, que apresenta recomendações automáticas para corrigir erros de código que o senhor pode aceitar e executar .
Terminal web
O terminal da Web Databricks oferece uma maneira conveniente e altamente interativa de executar o shell comando. É especialmente útil para casos de uso avançados, como lotes de operações em vários arquivos, que as interfaces de usuário (UIs) existentes podem não suportar totalmente.
Se o terminal da Web tiver sido ativado por um administrador do account, o senhor poderá iniciar o terminal da Web a partir do Notebook executando o serverless compute environment versão 2.
Para iniciar o terminal da Web em um notebook:
- Conecte o notebook ao site compute.
- Na parte inferior da barra lateral direita do Notebook, clique no ícone Abrir painel inferior
.
- Como alternativa, clique no menu suspenso compute anexado, passe o mouse sobre o compute anexado e clique em Web Terminal .
O terminal web é aberto em um painel na parte inferior da tela. Os botões no canto superior direito do painel permitem que você:
- Abra uma nova sessão de terminal em um novo tab
.
- Recarregue uma sessão
de terminal.
- Feche o painel inferior
. Para reabrir o painel, clique
na parte inferior da barra lateral direita.