Databricks ノートブックの概要
ノートブックは、データサイエンスと機械学習において、コードを開発して結果を提示するための一般的なツールです。Databricksにおいて、ノートブックはデータサイエンスと機械学習のワークフローを作成し、同僚とコラボレーションするための主要なツールです。Databricksノートブックは、複数言語でのリアルタイムの共同編集、自動バージョン管理、組み込みのデータビジュアライゼーションを提供します。
Databricksノートブックを使用すると、以下のことが可能です。
- Python、SQL、Scala、R を使用してコードを開発します。
- お好みのライブラリで環境をカスタマイズします。
- 定期的にスケジュールされたジョブを作成して、マルチノートブックワークフローなどのタスクを自動的に実行します。
- テーブルとボリュームを閲覧してアクセスします。
- 探索的データ分析 (EDA) を実行します。
- 結果とノートブックを
.html
形式または.ipynb
形式でエクスポートします。 - Git ベースのリポジトリを使用して、ノートブックを関連するファイルや依存関係と共に格納します。
- ダッシュボードを作成して共有します。
- ノートブックで DLT パイプラインを開発およびデバッグします。
- (実験的) 高度な編集機能を使用してください。
ノートブックは、 探索的データ分析 (EDA) にも役立ちます。
サンプル ノートブックをインポートして実行する方法
Databricksドキュメントには、Databricksの機能の使用方法を説明することを目的とした多くのサンプルノートブックがあります。これらのノートブックのいずれかをDatabricksワークスペースにインポートするには、以下を実行します。
- ページに表示されたノートブックプレビューの右上にある「 インポート用のリンクをコピー 」をクリックします。
MLflow 自動ログ記録のクイックスタート Python ノートブック
-
ワークスペース ブラウザーで、 ノートブックをインポートする場所に移動します。
-
フォルダを右クリックし、メニューから「 インポート 」を選択します。
-
「 URL 」ラジオボタンをクリックし、コピーしたリンクをフィールドに貼り付けます。
-
「インポート」 をクリックします。ノートブックがインポートされ、ワークスペースで自動的に開きます。 ノートブックに加えた変更は、自動的に保存されます。 ワークスペースでのノートブックの編集に関する情報については、「Databricks ノートブックでコードを開発する」を参照してください。
-
ノートブックを実行するには、ノートブックの上部にある [
] をクリックします。 ノートブック セルと個々のノートブック セルの実行の詳細については、「 Databricks ノートブックの実行」を参照してください。
ワークスペースに新しい空のノートブックを作成するには、「 ノートブックを作成する」を参照してください。
ノートブックの向き
ノートブックのインターフェイスとコントロールについて説明します。
Databricks ノートブックの使用を開始する
- 基本的な編集: ノートブックを効果的に使用および編集する方法の基本を学びます。
- ノートブックの管理:作成、名前の変更、削除、ノートブックパスの取得、エディター設定の構成。
- ノートブックでコードを開発および編集します。
- AI 支援によるコーディングのヘルプをご覧ください。
- EDA手法でデータを探索し、視覚化します。
- 対話型デバッガーを使用します。
- セル出力の操作: 結果と視覚化のダウンロード、ノートブックでの結果の表示の制御。
- ノートブックを実行し、通常のジョブをスケジュールします。
- ノートブックを使用して共同作業する: ノートブックを共有し、ノートブックでコメントを使用します。
- ノートブックをインポートおよびエクスポートします。
- ノートブックをテストします。
- ノートブックのライブラリをカスタマイズします。