Pular para o conteúdo principal

Exportar e importar Databricks Notebook

Esta página descreve como importar e exportar o Notebook em Databricks e os formatos de Notebook compatíveis com Databricks.

Formatos de notebook suportados

Databricks pode importar e exportar o Notebook nos seguintes formatos:

  • Arquivo de origem: um arquivo contendo somente declarações de código-fonte com a extensão .scala, .py, .sql ou .r.
  • HTML: A Databricks Notebook com a extensão .html.
  • Databricks .dbc archive.
  • IPython Notebook: Um Jupyter Notebook com a extensão .ipynb.
  • rmarkdown: Um documento R Markdown com a extensão .Rmd.

Importar um Notebook

O senhor pode importar um Notebook externo de um URL ou de um arquivo. O senhor também pode importar um arquivo ZIP do Notebook exportado em massa de um site Databricks workspace.

  1. Clique em ícone do workspace workspace na barra lateral. Execute uma das seguintes ações:

    • Clique com o botão direito do mouse em uma pasta e selecione Importar .
    • Para importar um Notebook no nível superior da pasta workspace atual, clique no menu kebab no canto superior direito e selecione Import (Importar ).
  2. Especifique o URL ou navegue até um arquivo que contenha um formato externo compatível ou um arquivo ZIP do Notebook exportado de um Databricks workspace.

  3. Clique em Importar .

    • Se o senhor escolher um único Notebook, ele será exportado para a pasta atual.
    • Se o senhor escolher um arquivo DBC ou ZIP, sua estrutura de pastas será recriada na pasta atual e cada Notebook será importado.

Converter um arquivo em um Notebook

Um ativo no site workspace é identificado como um Notebook se tiver uma extensão .ipynb ou se contiver as cadeias de caracteres Databricks notebook source em um comentário na primeira linha e tiver uma das seguintes extensões: .py, .r, .scala, .sql. Qualquer gravação ou renomeação de um Notebook ou arquivo que altere essas condições também altera o tipo do Notebook ou arquivo. Por exemplo, se o senhor tiver um arquivo myfile.txt que tenha # Databricks notebook source como primeira linha, renomear esse arquivo para myfile.py o transformará em um Notebook.

nota

A conversão entre os tipos de arquivo e de Notebook pode ter resultados inesperados, pois o Notebook tem um formato específico ipynb ou de origem. Consulte Notebook formats.

Para converter os scripts Python, SQL, Scala e R para o Notebook de célula única, adicione um comentário à primeira célula do arquivo:

Python
# Databricks notebook source

Para definir células em um script, use o comentário especial mostrado abaixo. Quando o senhor importa o script para o Databricks, as células são criadas conforme marcado pelas linhas COMMAND mostradas.

Python
# COMMAND ----------

Caderno de exportação

nota

Quando o usuário exporta um Notebook como HTML, IPython Notebook (.ipynb) ou arquivo (DBC) e não limpa as saídas do comando, as saídas são incluídas na exportação.

Para exportar um Notebook, selecione File > Export na barra de ferramentas do Notebook e selecione o formato de exportação.

Para exportar todas as pastas em uma pasta workspace como um arquivo ZIP:

  1. Clique em ícone do workspace workspace na barra lateral.

  2. Clique com o botão direito na pasta e selecione Exportar .

  3. Selecione o formato de exportação:

    • Arquivo DBC : Exporte um arquivo Databricks, um formato binário que inclui metadados e saídas de comando do Notebook.

    • Arquivo de origem : Exporte um arquivo ZIP de arquivos de origem do Notebook, que pode ser importado para um Databricks workspace, usado em um CI/CD pipeline, ou visualizado como arquivos de origem no idioma default de cada Notebook. Notebook As saídas de comando não estão incluídas.

    • Arquivo HTML : exporte um arquivo ZIP de arquivos HTML. O arquivo HTML de cada Notebook pode ser importado para o site Databricks workspace ou visualizado como HTML. Notebook estão incluídas as saídas de comando.

nota

O arquivo HTML não é compatível com o espaço de trabalho AWS GovCloud .