Importar e exportar Databricks Notebook
Esta página descreve como importar e exportar o Notebook em Databricks e os formatos de Notebook compatíveis com Databricks.
Formatos de notebook suportados
Databricks pode importar e exportar o Notebook nos seguintes formatos:
- Arquivo de origem: um arquivo contendo somente declarações de código-fonte com a extensão
.scala
,.py
,.sql
ou.r
. - HTML: A Databricks Notebook com a extensão
.html
. - Databricks
.dbc
archive. - IPython Notebook: Um Jupyter Notebook com a extensão
.ipynb
. - rmarkdown: Um documento R Markdown com a extensão
.Rmd
.
Importar um Notebook
O senhor pode importar um Notebook externo de um URL ou de um arquivo. O senhor também pode importar um arquivo ZIP do Notebook exportado em massa de um site Databricks workspace.
-
Clique em
workspace na barra lateral. Execute uma das seguintes ações:
- Clique com o botão direito do mouse em uma pasta e selecione Importar .
- Para importar um Notebook no nível superior da pasta workspace atual, clique no menu kebab no canto superior direito e selecione Import (Importar ).
-
Especifique o URL ou navegue até um arquivo que contenha um formato externo compatível ou um arquivo ZIP do Notebook exportado de um Databricks workspace.
-
Clique em Importar .
- Se o senhor escolher um único Notebook, ele será exportado para a pasta atual.
- Se o senhor escolher um arquivo DBC ou ZIP, sua estrutura de pastas será recriada na pasta atual e cada Notebook será importado.
Converter um arquivo em um Notebook
Um ativo no site workspace é identificado como um Notebook se tiver uma extensão .ipynb
ou se contiver as cadeias de caracteres Databricks notebook source
em um comentário na primeira linha e tiver uma das seguintes extensões: .py
, .r
, .scala
, .sql
. Qualquer gravação ou renomeação de um Notebook ou arquivo que altere essas condições também altera o tipo do Notebook ou arquivo. Por exemplo, se o senhor tiver um arquivo myfile.txt
que tenha # Databricks notebook source
como primeira linha, renomear esse arquivo para myfile.py
o transformará em um Notebook.
A conversão entre os tipos de arquivo e de Notebook pode ter resultados inesperados, pois o Notebook tem um formato específico ipynb ou de origem. Consulte Notebook formats.
Para converter os scripts Python, SQL, Scala e R para o Notebook de célula única, adicione um comentário à primeira célula do arquivo:
- Python
- SQL
- Scala
- R
# Databricks notebook source
-- Databricks notebook source
// Databricks notebook source
# Databricks notebook source
Para definir células em um script, use o comentário especial mostrado abaixo. Quando o senhor importa o script para o Databricks, as células são criadas conforme marcado pelas linhas COMMAND
mostradas.
- Python
- SQL
- Scala
- R
# COMMAND ----------
-- COMMAND ----------
// COMMAND ----------
# COMMAND ----------
Caderno de exportação
Quando o usuário exporta um Notebook como HTML, IPython Notebook (.ipynb) ou arquivo (DBC) e não limpa as saídas do comando, as saídas são incluídas na exportação.
Para exportar um Notebook:
- Com o Notebook aberto, clique em Arquivo na barra de ferramentas do Notebook e depois clique em Exportar... .
- Selecione o tipo de arquivo de exportação no menu dropdown .
- Se você selecionou o arquivo IPython Notebook, HTML ou DBC como o tipo de arquivo de exportação, você pode escolher incluir ou não saídas de células marcando/desmarcando Incluir saídas .
- Clique em Exportar .
Para exportar todo o Notebook em uma pasta de workspace como um arquivo ZIP:
-
Clique em
workspace na barra lateral.
-
Clique com o botão direito do mouse na pasta e selecione baixar como .
-
Selecione o formato de download:
- Arquivo DBC (somente Notebook) : exporte um arquivo Databricks , um formato binário que inclui metadados e saídas de comandos do Notebook.
- Zip - Origem (somente Notebook + arquivos) : exporte um arquivo ZIP de arquivos de origem do Notebook, que podem ser importados para um workspace Databricks , usados em um pipeline CI/CD ou visualizados como arquivos de origem no idioma default de cada Notebook. Saídas de comandos Notebook não estão incluídas.
- Zip - HTML (somente Notebook) : exporte um arquivo ZIP do Notebook em formato HTML. O arquivo HTML de cada Notebook pode ser importado para um workspace Databricks ou visualizado como HTML. Saídas de comandos Notebook estão incluídas.