クラスター ライブラリ
クラスター ライブラリは、クラスター上で実行されているすべてのノートブックとジョブで使用できます。 この記事では、Databricks ワークスペースで ライブラリ UI をインストールする 方法について詳しく説明します。
ライブラリのインストールを強制するポリシーを使用してコンピュートを作成した場合、コンピュートにライブラリをインストールまたはアンインストールすることはできません。 ワークスペース管理者は、ポリシー レベルですべてのライブラリ管理を制御します。
次の方法を使用して、クラスターにライブラリをインストールできます。
-
特定のクラスターでのみ使用するライブラリをインストールします。
-
REST API を使用してライブラリをインストールします。 ライブラリ API を参照してください。
-
Databricks CLI を使用してライブラリをインストールします。 「Databricks CLI とは」を参照してください。
-
Terraform を使用してライブラリをインストールします。 Databricks Terraform プロバイダーとライブラリを参照してください。
-
ライブラリをインストールするには、ライブラリのインストールを定義するポリシーを使用してクラスターを作成します。 ポリシーへのライブラリの追加を参照してください。
-
(非推奨)クラスタ作成時に実行されるinitスクリプトを使用してライブラリをインストールします。 Install a library with an initスクリプト (legacy)を参照してください。
クラスターにライブラリをインストールする
クラスタにライブラリをインストールするには、以下の手順に従ってください。
- サイドバーの
[ コンピュート ]をクリックします。
- クラスター名をクリックします。
- 「 ライブラリ 」タブをクリックします。
- 「 新規インストール 」をクリックします。
- [ライブラリをインストール] ダイアログが表示されます。
- [ライブラリのソース] オプションのいずれかを選択し、表示される手順に従い、その後 [インストール] をクリックします。
ライブラリは、Databricks Runtime 14.3 LTS 以前を使用している場合は DBFS からインストールできます。 ただし、ワークスペース ユーザーは誰でも DBFS に格納されているライブラリ ファイルを変更できます。 Databricksワークスペースでのライブラリのセキュリティを向上させるために、DBFSルートへのライブラリファイルの保存は、Databricks Runtime 15.1 以降のデフォルトによって非推奨になり、無効になっています。「 Storing Library in DBFSRoutes is deprecated and disabled by デフォルト」を参照してください。
Databricks代わりに、 ライブラリ、 ファイル、 コネクタを含むすべてのライブラリをワークスペースPython JARSparkファイルまたは ボリュームにアップロードするかUnity Catalog 、ライブラリ パッケージ リポジトリを使用することをお勧めします。ワークロードがこれらのパターンをサポートしていない場合は、クラウド・オブジェクト・ストレージに保管されているライブラリーも使用できます。
すべてのクラスター・アクセス・モードが、すべてのライブラリ構成をサポートしているわけではありません。 コンピュート-scoped ライブラリを参照してください。
ライブラリのソース | 手順 |
---|---|
ワークスペース | ワークスペースファイルを選択するか、Whl、zip 形式のホイールハウス、JAR、ZIP、tar、または requirements.txt ファイルをアップロードします。 「ワークスペース ファイルからのライブラリのインストール」を参照してください |
ボリューム | ボリュームから Whl、JAR、または requirements.txt ファイルを選択します。 ボリュームからのライブラリーのインストールを参照してください。 |
ファイルパス/S3 | ライブラリの種類を選択し、ライブラリオブジェクトへの完全な URI を指定します (例: |
PyPI | PyPI パッケージ名を入力します。 PyPI パッケージを参照してください。 |
Maven | Maven 座標を指定します。 「Maven または Spark パッケージ」を参照してください。 |
CRAN | パッケージの名前を入力します。 CRAN パッケージを参照してください。 |
DBFS (非推奨) | JAR または Whl ファイルを DBFSルートに読み込みます。DBFS に格納されたファイルは、どのワークスペース ユーザーでも変更できるため、これはお勧めしません。 |
クラスターにライブラリをインストールしても、そのクラスターに既にアタッチされているノートブックには、新しいライブラリがすぐに表示されません。 最初にノートブックを デタッチ してから、クラスターに 再度アタッチ する必要があります。
インストールに 2 時間以上かかったライブラリは、失敗としてマークされます。
ポリシーを使用したライブラリのインストール
ライブラリのインストールを強制するポリシーを使用してクラスターを作成すると、指定したライブラリがクラスターに自動的にインストールされます。 追加のライブラリをインストールしたり、ライブラリをアンインストールしたりすることはできません。
ワークスペース 管理者は、ポリシーにライブラリを追加して、ポリシーを使用するすべてのコンピュートでライブラリのインストールを管理および適用できます。 管理者の手順については、「 ポリシーにライブラリを追加する」を参照してください。
クラスターからのライブラリのアンインストール
クラスターからライブラリをアンインストールしても、クラスターを再起動するまでライブラリは削除されません。クラスターを再起動するまで、アンインストールされたライブラリのステータスは [再起動時のアンインストールを保留中] と表示されます。
ライブラリをアンインストールするには、クラスターUIを使用します。
- サイドバーの
[ コンピュート ]をクリックします。
- クラスター名をクリックします。
- 「 ライブラリ 」タブをクリックします。
- ライブラリをアンインストールするクラスターの横にあるチェックボックスをオンにし、 [アンインストール] をクリックしてから [確認] をクリックします。ステータスが [再起動時のアンインストールを保留中] に変わります。
[再起動] をクリックし、 [確認] をクリックしてライブラリをアンインストールします。ライブラリはクラスターの [ライブラリ] タブから削除されます。
クラスターにインストールされているライブラリを表示する
- サイドバーの
[ コンピュート ]をクリックします。
- クラスター名をクリックします。
- 「ライブラリ」 タブをクリックします。タブには、ライブラリごとに、名前とバージョン、タイプ、 インストール ステータス、およびアップロードされている場合はソース ファイルが表示されます。
クラスターインストール済みライブラリの更新
クラスターにインストールされたライブラリを更新するには、古いバージョンのライブラリをアンインストールし、新しいバージョンをインストールします。
Requirements.txtファイルは、アンインストールして再起動する必要はありません。 requirements.txtファイルの内容を変更した場合は、再インストールするだけで、インストールされたファイルの内容を更新できます。