Databricks ノートブックのエクスポートとインポート
このページでは、 Databricks でノートブックをインポートおよびエクスポートする方法と、 Databricks がサポートするノートブック形式について説明します。
サポートされているノートブック形式
Databricks では、次の形式でノートブックをインポートおよびエクスポートできます。
- ソース ファイル: 拡張子が
.scala
、.py
、.sql
、または.r
のソース コード ステートメントのみを含むファイル。 - HTML: 拡張子が
.html
の Databricks ノートブック。 - Databricks
.dbc
アーカイブ。 - IPython ノートブック: 拡張子が
.ipynb
の Jupyter ノートブックです。 - rmarkdown: 拡張子が
.Rmd
の R Markdown ドキュメント 。
ノートブックのインポート
外部ノートブックは、URL またはファイルからインポートできます。 Databricks ワークスペースから 一括でエクスポート されたノートブックの ZIP アーカイブをインポートすることもできます。
-
サイドバーの「 ワークスペース 」をクリックします。 次のいずれかの操作を行います。
- フォルダを右クリックして、[ インポート] を選択します。
- 現在のワークスペースフォルダの最上位にあるノートブックをインポートするには、右上のケバブメニューをクリックし、[ インポート] を選択します。
-
URL を指定するか、サポートされている外部形式または Databricks ワークスペースからエクスポートされたノートブックの ZIP アーカイブを含むファイルを参照します。
-
「 インポート 」をクリックします。
- 1 つのノートブックを選択した場合は、現在のフォルダにエクスポートされます。
- DBC アーカイブまたは ZIP アーカイブを選択すると、そのフォルダー構造が現在のフォルダーに再作成され、各ノートブックがインポートされます。
ノートブックへのファイルの変換
ワークスペース内のアセットは、拡張子が .ipynb
の場合、または最初の行のコメントに文字列 Databricks notebook source
が含まれ、拡張子が .py
、 .r
、 .scala
、 .sql
のいずれかである場合にノートブックとして識別されます。これらの条件を変更するノートブックまたはファイルの書き込みまたは名前変更を行うと、ノートブックまたはファイルの種類も変更されます。たとえば、最初の行が # Databricks notebook source
であるファイル myfile.txt
がある場合、そのファイルの名前を myfile.py
に変更すると、ノートブックに変換されます。
ファイルタイプとノートブックタイプ間の変換は、ノートブックには特定の ipynb またはソース形式があるため、予期しない結果が生じる可能性があります。 ノートブックの形式を参照してください。
Python、SQL、Scala、R スクリプトをシングルセルのノートブックに変換するには、ファイルの最初のセルにコメントを追加します。
- Python
- SQL
- Scala
- R
# Databricks notebook source
-- Databricks notebook source
// Databricks notebook source
# Databricks notebook source
スクリプト内のセルを定義するには、以下に示す特別なコメントを使用します。 スクリプトを Databricks にインポートすると、表示されている COMMAND
行でマークされているようにセルが作成されます。
- Python
- SQL
- Scala
- R
# COMMAND ----------
-- COMMAND ----------
// COMMAND ----------
# COMMAND ----------
ノートブックのエクスポート
ノートブックを HTML、IPython ノートブック (.ipynb)、またはアーカイブ (DBC) としてエクスポートし、 コマンド出力をクリアしていない場合、出力はエクスポートに含まれます。
ノートブックをエクスポートするには、ノートブック ツールバーで [ファイル] > [エクスポート ] を選択し、エクスポート形式を選択します。
ワークスペースフォルダ内のすべてのフォルダをZIPアーカイブとしてエクスポートするには:
-
サイドバーの「 ワークスペース 」をクリックします。
-
フォルダを右クリックし、[ エクスポート] を選択します。
-
エクスポート形式を選択します。
- DBC アーカイブ : Databricks アーカイブ (メタデータとノートブック コマンド出力を含むバイナリ形式) をエクスポートします。
- ソース ファイル : ノートブック ソース ファイルの ZIP アーカイブをエクスポートし、 Databricks ワークスペースにインポートしたり、 CI/CD パイプラインで使用したり、各ノートブックのデフォルト言語でソース ファイルとして表示したりできます。 ノートブックのコマンド出力は含まれません。
- HTMLアーカイブ :HTMLファイルのZIPアーカイブをエクスポートします。各ノートブックの HTML ファイルは、Databricks ワークスペースにインポートしたり、HTML として表示したりできます。ノートブックのコマンド出力が含まれています。