ワークスペース内のバンドルで共同作業する
宣言型自動化バンドル(旧称:Databricksアセットバンドル)は作成後、ワークスペースにデプロイされ、ローカル開発環境からプログラムで管理することも、ワークスペースのUIから直接管理することもできます。ワークスペースでバンドルを直接共同作業することで、本番運用に移行する前に、より迅速な反復とテストが可能になります。
バンドルに関する詳細については、 「宣言型自動化バンドルとは?」を参照してください。
ワークスペースUIを使用してバンドルを作成および管理するのではなく、ワークスペースでバンドルを開発したい場合は、ローカルターミナルの場合と同様に、ワークスペース Webターミナルの Databricks CLI を使用できます。 「Databricks CLI コマンドの実行」を参照してください。
ワークスペースでのバンドルのインストール要件は何ですか?
ワークスペースでバンドルを使用するためにローカルに何もインストールする必要はありませんが、Databricks ワークスペースの要件があります。
- ワークスペース ファイルを有効にする必要があります。「ワークスペースファイルとは」を参照してください。
- バンドルを作成するための Git フォルダーが必要です。Git フォルダーを作成するには、 「リポジトリのクローンを作成する」を参照してください。
- サーバレス コンピュートを有効にする必要があります。 サーバレス コンピュートの要件を参照してください。
- ワークスペースのバンドルは、サーバレス下り制御と互換性があります。 ただし、パブリック PyPi レジストリのパッケージを使用して Python プロジェクトをビルドする必要がある場合は、代わりにプライベート ミラーを使用してください。
バンドルのデプロイとワークスペースでのリソースの実行に使用される Databricks CLI のバージョンは、 [デプロイ ] ダイアログで提供されます。
ワークスペースでバンドルを使用するためにYAMLを作成する方法を理解する必要がありますか?
いいえ。ワークスペース内の宣言型自動化バンドルは、バンドルを管理するためのUIを提供し、他のユーザーがローカル開発環境で開発したバンドルについて共同作業を行うことができます。ワークスペース内のバンドルを操作するために、YAMLを学習したり、Databricks CLIの使い方を知っている必要はありません。
私は既に Databricks UI でワークフローを管理しています。なぜバンドルを使用する必要があるのですか?
宣言型自動化バンドルを使用すると、ワークフローに必要なすべてのファイルをソース管理できます。ワークスペース内のバンドルは、ワークスペースユーザーがUIを通じてアップデートの編集、コミット、テスト、デプロイを行うための仕組みを提供します。ユーザーはGitフォルダ内からバンドルプロジェクトを起動します。
GitHubリポジトリにバンドルがあります。Databricks ワークスペースで編集するにはどうすればよいですか?
フォルダーのルートに databricks.yml ファイルが存在する場合、Databricks によってフォルダーはバンドルとして識別されます。GitHub リポジトリの Git フォルダーを Databricks に作成すると、Databricks はそれをバンドルとして認識します。
ワークスペースではすべてのバンドル構成がサポートされていますか?
既存のバンドルのほぼすべては、ワークスペースで管理できます。ただし、宣言型自動化バンドル用のPythonは、現在のところワークスペースではサポートされていません。
コラボレーションのためにバンドルを共有するにはどうすればよいですか?
バンドルは親 Git フォルダーの権限を継承するため、バンドルを共有するには、バンドル プロジェクトを含む Git フォルダーを共同作業者と共有します。「コラボレーション、レビュー、および本番運用へのデプロイ」を参照してください。
ワークスペースでバンドルを本番運用に移動するにはどうすればよいですか?
バンドルは、デプロイするプロジェクト全体、プロジェクトを実行するために必要なインフラストラクチャ、およびデプロイ先を定義します。これらのターゲットは通常、開発モードと本番運用モードです。 ワークスペース内の宣言型自動化バンドルを使用すると、UI から簡単にターゲットの切り替え、ワークフローのデプロイ、実行を行うことができます。ワークスペースからバンドルをデプロイし、ワークフローを実行する方法については、「ワークスペースからバンドルをデプロイし、ワークフローを実行する」を参照してください。
バンドル エディターからバンドルを別の Databricks ワークスペースにデプロイできますか?
いいえ、サポートされていません。Databricksでは、ワークスペースのバンドル エディターで開発し、 Gitフォルダーを同期して変更をコミットし、 CLIを使用してバンドルを別のワークスペースにデプロイするCI/CDワークフロー ( GitHub Actionsなど) をセットアップすることをお勧めします。