Gerenciar o formato do Notebook

Este artigo descreve o formato do Notebook default em Databricks, como alterar o formato do Notebook e como gerenciar o commit se o Notebook estiver em uma pasta controlada pelo código-fonte.

Em default, o Notebook em Databricks é criado no formato .ipynb (IPython ou Jupyter). Você também pode optar por usar o formato de origem em vez disso.

O senhor ainda pode importar e exportar o Notebook em vários formatos. Consulte Exportar e importar Databricks Notebook.

Notebook formatos

Databricks suporta a criação e a edição do Notebook em dois formatos: ipynb (default) e fonte.

O senhor pode gerenciar arquivos de origem, incluindo o Notebook, usando as pastasGit . Somente determinados tipos deDatabricks ativo são compatíveis com as pastas Git. O formato do Notebook tem implicações sobre quais saídas são confirmadas no repositório remoto, conforme descrito na tabela abaixo.

Notebook formato da fonte

Detalhes

Origem

Um formato básico que captura apenas o código-fonte, com um sufixo que sinaliza a linguagem do código, como .py, .scala, .r e .sql.

ipynb (Jupyter)

Um formato avançado que captura o código-fonte, o ambiente do Notebook, as definições de visualização, os widgets do Notebook e os resultados opcionais. Um ipynb Notebook pode conter código em qualquer linguagem compatível com o Databricks Notebook (apesar da parte py de .ipynb). O formato ipynb (Jupyter) permite que o usuário opte por commit outputs. ipynb também oferece suporte a uma melhor experiência de visualização do Databricks Notebook em repositórios remotos do Git.

Para distinguir o Databricks Notebook dos arquivos normais Python, Scala e SQL, o Databricks adiciona o comentário "Databricks notebook source" à parte superior dos arquivos Python, Scala e SQL Notebook. Esse comentário garante que o site Databricks analise corretamente o arquivo como um Notebook em vez de um arquivo de script.

Observação

O que são “saídas”?

Outputs são os resultados da execução de um Notebook na plataforma Databricks, incluindo exibições de tabelas e visualizações.

Alterar a configuração do formato do notebook default

ipynb Notebook é o formato default ao criar um novo Notebook em Databricks.

Para alterar o formato de origem de default para Databricks, log em seu Databricks workspace, clique em seu perfil no canto superior direito da página, clique em Settings (Configurações ) e navegue até Developer (Desenvolvedor). Altere o formato do Notebook default no cabeçalho de configurações do Editor.

Altere o formato do default Notebook nas configurações de desenvolvedor de seu perfil

Converter o formato do Notebook

O senhor pode converter um Notebook existente em outro formato por meio da UI Databricks.

Para converter um Notebook existente em outro formato:

  1. Abra o Notebook em seu site workspace.

  2. Selecione File (Arquivo ) n o menu workspace , depois selecioneNotebook format (Formato) e escolha o formato desejado. O senhor pode escolher entre Jupyter (.ipynb) (recomendado) ou Source (Scala, .py, .sql, R). O formato atual do Notebook está acinzentado e tem uma marca de seleção ao lado.

    O menu de arquivo workspace, expandido, mostra a opção de formato Notebook.

Para obter mais informações sobre os tipos de Notebook compatíveis com Databricks, leia Exportar e importar Databricks Notebook.

gerenciar ipynb Compromisso de saída do notebook

Para o ipynb Notebook em pastas com controle de origem, o senhor pode gerenciar como os resultados do Notebook são confirmados no repositório remoto.

Permitir a saída do notebook do commit .ipynb

As saídas podem ser confirmadas somente se o administrador do site workspace tiver habilitado esse recurso. Em default, a configuração administrativa das pastas Git não permite que a saída .ipynb do Notebook seja confirmada. Se o senhor tiver privilégios de administrador no site workspace, poderá alterar essa configuração:

  1. Vá para Configurações administrativas > Configurações do espaço de trabalho no console do administrador do Databricks.

  2. Em Git folders, selecione Allow Git folders to Export ipynb outputs e, em seguida, selecione Allow: ipynb outputs can be toggled on.

    Console do administrador: Permitir que as pastas Git exportem saídas ipynb.

Importante

Quando as saídas são incluídas, as configurações de visualização e painel são incluídas no`.ipynb` Notebook criado pelo senhor.

Controle ipynb Confirmação do artefato de saída do notebook

Quando o senhor commit um arquivo .ipynb, o Databricks cria um arquivo de configuração que permite controlar a forma de saída do commit: .databricks/commit_outputs.

  1. Se o senhor tiver um arquivo .ipynb Notebook, mas nenhum arquivo de configuração no repositório remoto, acesse a caixa de diálogo Git Status.

  2. Na caixa de diálogo de notificação, selecione Criar arquivo de confirmação.

    Notebook commit INTERFACE DO USUÁRIO: Botão Criar arquivo de confirmação.

Você também pode gerar arquivos de configuração no menu Arquivo. O menu File (Arquivo ) tem um controle para atualizar automaticamente o arquivo de configuração, no qual é possível especificar a inclusão ou exclusão de saídas para um notebook ipynb específico.

  1. No menu File, selecione commit Notebook outputs.

    Notebook editor: commit Notebook outputs status and control.
  2. Na caixa de diálogo, confirme sua escolha em commit Notebook outputs.

    caixa de diálogo Commit Notebook outputs.