ワークスペース ライブラリ (レガシ)
このドキュメントは廃止されており、更新されない可能性があります。 このコンテンツに記載されている製品、サービス、またはテクノロジはサポートされなくなりました。 コンピュートスコープ ライブラリを参照してください。
ワークスペースライブラリは廃止されたため、使用しないでください。 ただし、ライブラリをワークスペース ファイルとして保存することは、ワークスペース ライブラリとは異なり、引き続き完全にサポートされています。 ワークスペースファイルとして保存されているライブラリを、コンピュートまたはジョブタスクに直接インストールできます。
ワークスペースライブラリは、クラスターにインストールするライブラリを作成するローカルリポジトリとして機能します。ワークスペースライブラリは、組織によって作成されたカスタムコードである場合もあれば、組織が標準化したオープンソースライブラリの特定のバージョンである場合もあります。
ワークスペース ライブラリをノートブックまたはジョブで使用する前に、クラスターにインストールする必要があります。 「ワークスペース ライブラリをクラスターにインストールする」を参照してください。
共有フォルダ内のワークスペースライブラリはワークスペース内のすべてのユーザーが利用できますが、ユーザーフォルダ内のワークスペースライブラリはそのユーザーのみが利用できます。
ライブラリは、Databricks Runtime 14.3 LTS 以前を使用している場合は DBFS からインストールできます。 ただし、ワークスペース ユーザーは誰でも DBFS に格納されているライブラリ ファイルを変更できます。 Databricksワークスペースでのライブラリのセキュリティを向上させるために、DBFSルートへのライブラリファイルの保存は、Databricks Runtime 15.1 以降のデフォルトによって非推奨になり、無効になっています。DBFSルートに格納されるライブラリは非推奨となり、デフォルトで無効化されますを参照してください。
代わりに、Databricksでは、Python ライブラリ、JAR ファイル、Spark コネクタを含むすべてのライブラリをワークスペース ファイルまたはUnity Catalog ボリュームにアップロードするか 、ライブラリ パッケージ リポジトリを使用することをお勧めします。ワークロードがこれらのパターンをサポートしていない場合は、クラウド・オブジェクト・ストレージに保管されているライブラリーも使用できます。
ワークスペースライブラリは、ワークスペースファイルとともに格納されたライブラリとどのように異なりますか?
「ワークスペース ライブラリ」という用語は、ワークスペースに登録されている任意のライブラリを指します。 ワークスペース ライブラリは、ノートブック ファイルおよびワークスペース ファイルと一緒に表示され ACL それらを含むディレクトリのルールに従います。
「ワークスペース ファイル」という用語は、ワークスペースに格納されている任意のファイルを指します。 Python .whl を保存できます パッケージをワークスペース ファイルとして登録し、ワークスペース ライブラリとして登録する 「ワークスペースファイルとは」を参照してください。
ライブラリをワークスペース ファイルとしてアップロードできます。 ワークスペース ファイルの基本的な使用方法を参照してください。
ワークスペース ファイルにはさまざまな種類のファイルをアップロードできますが、Python .whl のみ ファイルは、ワークスペース ファイルを使用してインストールできます。 コンピュートスコープ ライブラリを参照してください。
Databricks Runtime 13.3 LTS 以降では、%pip
を使用して、ワークスペース ファイルとして保存されているPython wheelファイルをインストールできます。ワークスペースファイルとして保存されたパッケージを %pip
とともにインストールするを参照してください。
ワークスペース ライブラリを作成する
この機能は使用できなくなりました。 ワークスペースライブラリの作成とインストールは使用できなくなりましたを参照してください。
- ライブラリを保存するワークスペースフォルダを右クリックします。
- 「作成」>「ライブラリ」 を選択します。「ライブラリの作成」ダイアログが表示されます。
- 「 ライブラリソース 」を選択し、適切な手順に従います。
Jar、Python egg、または Python wheel ファイルをアップロードする
Python egg ファイルのインストールは非推奨であり、今後の Databricks Runtime リリースで削除される予定です。
ライブラリは、Databricks Runtime 14.3 LTS 以前を使用している場合は DBFS からインストールできます。 ただし、ワークスペース ユーザーは誰でも DBFS に格納されているライブラリ ファイルを変更できます。 Databricksワークスペースでのライブラリのセキュリティを向上させるために、DBFSルートへのライブラリファイルの保存は、Databricks Runtime 15.1 以降のデフォルトによって非推奨になり、無効になっています。DBFSルートに格納されるライブラリは非推奨となり、デフォルトで無効化されますを参照してください。
代わりに、Databricksでは、Python ライブラリ、JAR ファイル、Spark コネクタを含むすべてのライブラリをワークスペース ファイルまたはUnity Catalog ボリュームにアップロードするか 、ライブラリ パッケージ リポジトリを使用することをお勧めします。ワークロードがこれらのパターンをサポートしていない場合は、クラウド・オブジェクト・ストレージに保管されているライブラリーも使用できます。
- 「ライブラリソース」ボタンリストで、「 アップロード 」を選択します。
- 「 Jar 」、「 Python Egg 」、または「 Python Whil 」を選択します。
- 必要に応じて、ライブラリ名を入力します。
- Jar、Egg、またはWhlをドロップボックスにドラッグするか、ドロップボックスをクリックしてファイルを選択します。ファイルが
dbfs:/FileStore/jars
にアップロードされます。 - 「 作成 」をクリックします。ライブラリのステータス画面が表示されます。
アップロードされた JAR、Python egg、または Python wheel ファイルを参照する
新しいワークスペース ライブラリを作成するには、DBFSルート、オブジェクト ストレージ、またはワークスペース ファイルに格納されているJAR、Python egg、Python wheelファイルを参照します。このワークフローに従って、ファイルをアップロードまたは移動せずにライブラリへのポインターを登録します。
Databricks Runtime 13.2 以降では、 Unity Catalog でボリュームを参照することもできます。 この機能は パブリック プレビュー段階です。
標準アクセス モード (以前の共有アクセス モード) のコンピュートの場合は、 allowlist
に JAR を追加する必要があります。 標準アクセスモード (旧称 共有アクセスモード) のコンピュートにおけるライブラリの許可とinitスクリプトを参照してください。
-
[ライブラリ ソース] ボタン リストで ファイル パス/S3 を選択します。
-
「 Jar 」、「 Python Egg 」、または「 Python Whil 」を選択します。
-
必要に応じて、ライブラリ名を入力します。
-
以下の例のように、ライブラリへのパスを指定します。
s3://bucket-name/path/to/library.whl
/Workspace/path/to/library.whl
dbfs:/path/to/library.whl
/Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
-
「 作成 」をクリックします。ライブラリのステータス画面が表示されます。
オブジェクトストレージでのライブラリの操作の詳細については、 オブジェクトストレージからのライブラリのインストールを参照してください。
ワークスペース ファイルの詳細については、 Databricks でのファイルの操作を参照してください。
ワークスペース ライブラリをクラスターにインストールする
Databricksは、すべてのワークスペースライブラリを、クラスターにインストールされた順序で処理します。ライブラリ間に依存関係がある場合は、クラスターへのインストール順序に注意する必要がある場合があります。
ライブラリは、Databricks Runtime 14.3 LTS 以前を使用している場合は DBFS からインストールできます。 ただし、ワークスペース ユーザーは誰でも DBFS に格納されているライブラリ ファイルを変更できます。 Databricksワークスペースでのライブラリのセキュリティを向上させるために、DBFSルートへのライブラリファイルの保存は、Databricks Runtime 15.1 以降のデフォルトによって非推奨になり、無効になっています。DBFSルートに格納されるライブラリは非推奨となり、デフォルトで無効化されますを参照してください。
代わりに、Databricksでは、Python ライブラリ、JAR ファイル、Spark コネクタを含むすべてのライブラリをワークスペース ファイルまたはUnity Catalog ボリュームにアップロードするか 、ライブラリ パッケージ リポジトリを使用することをお勧めします。ワークロードがこれらのパターンをサポートしていない場合は、クラウド・オブジェクト・ストレージに保管されているライブラリーも使用できます。
シングル ユーザー アクセス モードでは、割り当てられたプリンシパル (ユーザーまたはサービスプリンシパル) の ID が使用されます。 標準アクセス モード (以前の共有アクセス モード) では、ライブラリはライブラリをインストールしたユーザーの ID を使用します。 分離なし共有アクセス モードはボリュームをサポートしませんが、標準アクセス モードと同じ ID 割り当てを使用します。
クラスタリングにライブラリをインストールするためのすべてのオプションについては、 コンピュートスコープのライブラリを参照してください。
ワークスペースにすでに存在するライブラリをインストールする場合は、クラスターUIまたはライブラリUIから行うことができます。
クラスター
- サイドバーで、
[ 計算 ]をクリックします。
- クラスター名をクリックします。
- 「 ライブラリ 」タブをクリックします。
- 「 新規インストール 」をクリックします。
- 「ライブラリソース」ボタンリストで、「 ワークスペースライブラリ 」を選択します。
- ワークスペースライブラリを選択します。
- [ インストール ] をクリックします。
ライブラリ
- ライブラリがあるフォルダに移動します。
- ライブラリ名をクリックします。
- ライブラリをインストールするクラスターの横にあるチェックボックスをオンにして、「 インストール 」をクリックします。実行中のクラスターのみがリストに表示されます。
ワークスペースライブラリの詳細を表示する
ワークスペースフォルダは、ワークスペースライブラリを探したり、ACLを管理したりするのに役立ちます。
- ライブラリがあるワークスペースフォルダに移動します。
- ライブラリ名をクリックします。
ライブラリの詳細ページには、実行中のクラスターとライブラリのインストールステータス が表示されます。ライブラリがインストールされている場合、ページにはパッケージホストへのリンクが表示されます。ライブラリがアップロードされた場合、ページにはアップロードされたパッケージファイルへのリンクが表示されます。
ワークスペース ライブラリの移動
ワークスペースフォルダは、ワークスペースライブラリを探したり、ACLを管理したりするのに役立ちます。ワークスペースライブラリを移動してもファイルは移動されませんが、ワークスペースライブラリにアクセスできるユーザーを変更することができます。
- ライブラリがあるワークスペースフォルダに移動します。
- ライブラリ名を右クリックし、「 移動 」を選択します。フォルダブラウザが表示されます。
- コピー先のフォルダをクリックします。
- 「 移動 」をクリックします。
ワークスペースライブラリの削除
ワークスペース ライブラリを削除する前に、すべてのクラスター からアンインストールする必要があります 。
ワークスペースライブラリを削除するには、以下を実行します。
- ライブラリをゴミ箱フォルダに移動します。
- ゴミ箱フォルダ内のライブラリを完全に削除するか、ゴミ箱フォルダを空にします。