Databricks で Python プロセスを再起動します。

Databricks で Python プロセスをプログラムで再起動して、ローカルにインストールまたはアップグレードされたライブラリが現在の SparkSession の Python カーネルで正しく機能することを確認できます。

Python プロセスを再起動すると、Python の状態情報が失われます。 Databricks では、ノートブックの先頭にすべてのセッション スコープ ライブラリをインストールし、続行する前に dbutils.library.restartPython() を実行して Python プロセスをクリーンアップすることをお勧めします。

このプロセスは、インタラクティブ ノートブックやジョブでスケジュールされた Python タスクで使用できます。

dbutils.library.restartPythonとは何ですか?

ヘルパー関数 dbutils.library.restartPython() は、Databricks ノートブックで Python プロセスを再起動するための推奨される方法です。

dbutils.library サブモジュールのほとんどの関数は非推奨です。Databricks では、 %pip を使用してノートブック スコープのすべてのライブラリ インストールを管理することを強くお勧めします。 ノートブック スコープの Python ライブラリに関するページを参照してください。

Pythonプロセスをいつ再起動する必要がありますか?

次のいずれかを含むローカルインストールを実行するたびに、Pythonプロセスを再起動することをお勧めします。

  • Databricks Runtimeに含まれるパッケージのバージョンを指定する。

  • Databricks Runtimeに含まれるパッケージのカスタムバージョンのインストール .

  • %pip install <library-name> --upgradeを使用してライブラリを明示的に最新バージョンに更新する。

  • ローカル requirements.txt ファイルからのカスタム環境の構成。

  • Databricks Runtimeに含まれている依存ライブラリのバージョンを変更する必要があるライブラリをインストールする。