Databricks CLIチュートリアル
注:
この情報は、Databricks CLI バージョン 0.205 以降に適用されます。 Databricks CLI は パブリック プレビュー段階です。
Databricks CLI 使用には、 Databricks ライセンス および Databricks プライバシー通知(使用データのプロビジョニングを含む)が適用されます。
Databricksコマンドラインインターフェイス(Databricks CLIとも呼ばれます)ユーティリティは、ターミナル、コマンドプロンプト、または自動化スクリプトからDatabricksプラットフォームを自動化する使いやすいインターフェイスを提供します。
この記事では、ローカル開発マシンを使用してDatabricks CLIをすぐに使い始める方法を紹介します。詳しくは、「Databricks CLIとは」を参照してください。
次のハンズオン・チュートリアルでは、以下の条件が前提となります。
LinuxまたはmacOSの場合、Homebrewがインストールされています。
注:
Homebrewを使用できない場合、CLIをインストールする他の方法については、「Databricks CLIのインストールまたは更新」を参照してください。
Windowsの場合は、winget、Chocolatey、またはWindows Subsystem for Linux (WSL)がインストールされています。インストール方法については、ご使用のOSのマニュアルを参照してください。
注:
Chocolateyを使用したDatabricks CLIのインストールは実験段階です。
winget
、Chocolatey、またはWSLを使用できない場合、CLIを他の方法でインストールするには、「Databricks CLIのインストールまたは更新」を参照してください。
以下のステップを実行します。
まだインストールされていない場合は、以下のようにDatabricks CLIをインストールします。
Homebrewを使用して、以下の2つのコマンドを実行してDatabricks CLIをインストールします。
brew tap databricks/tap brew install databricks
winget、Chocolatey、またはWindows Subsystem for Linux (WSL) を使用して、Databricks CLIをインストールできます。
winget
、Chocolatey、またWSLを使用できない場合は、この手順をスキップし、代わりにコマンドプロンプトまたはPowerShellを使用してソースからDatabricks CLIをインストールしてください。注:
Chocolateyを使用したDatabricks CLIのインストールは実験段階です。
winget
を使用してDatabricks CLIをインストールするには、次の2つのコマンドを実行してから、コマンドプロンプトを再起動します。winget search databricks winget install Databricks.DatabricksCLI
Chocolateyを使用してDatabricks CLIをインストールするには、以下のコマンドを実行します:
choco install databricks-cli
WSLを使用してDatabricks CLIをインストールするには:
WSL経由で
curl
とzip
インストールします。詳しくは、お使いのオペレーティングシステムのマニュアルをご覧ください。WSLを使用して、以下のコマンドを実行してDatabricks CLIをインストールします。
curl -fsSL https://raw.githubusercontent.com/databricks/setup-cli/main/install.sh | sh
次のコマンドを実行して、Databricks CLIがインストールされていることを確認します。これにより、Databricks CLIの現在のバージョンが表示されるので、そのバージョンが0.205.0以降であることを確認します。
databricks -v
注:
databricks
を実行したが、command not found: databricks
のようなエラーが表示された場合、またはdatabricks -v
を実行し、0.18以前のバージョン番号が表示された場合は、ご使用のマシンでDatabricks CLIの実行可能な正しいバージョンが見つからなかったことを示しています。この問題を解決するには、「CLIのインストールを確認する」を参照してください。
Databricks CLIをインストールしたら、次の手順をステップします。
注:
このチュートリアルでは、OAuth ユーザー対マシン (U2M) 認証を使用して、Databricksユーザーアカウントを使用してCLIを認証することを想定しています。他のDatabricks認証タイプを使用するようにCLIを設定するには、「Databricks CLIの認証」を参照してください。
Databricks CLIを使用して、ターゲットアカウントまたはワークスペースごとに以下のコマンドを実行し、ローカルでOAuthトークン管理を開始します。
アカウントレベルの操作では、以下のコマンドでプレースホルダーを置き換えてください。
<account-console-url>
をDatabricks https://accounts.gcp.databricks.comに置き換えます。<account-id>
をDatabricksのアカウントIDに置き換えます。「アカウントIDを確認する」を参照してください。
databricks auth login --host <account-console-url> --account-id <account-id>
ワークスペースレベルの操作では 、以下のコマンドで
<workspace-url>
をDatabricksワークスペースインスタンスのURLhttps://dbc-a1b2345c-d6e7.cloud.databricks.com
に置き換えてください。databricks auth login --host <workspace-url>
Databricks CLIは、入力した情報をDatabricks構成プロファイルとして保存するよう促します。
Enter
を押して提案されたプロファイル名を受け入れるか、新規または既存のプロファイルの名前を入力してください。同じ名前の既存のプロファイルは、入力した情報で上書きされます。プロファイルを使用すると、複数のアカウントやワークスペース間で認証コンテキストをすばやく切り替えることができます。既存のプロファイルのリストを取得するには、別のターミナルまたはコマンドプロンプトでDatabricks CLIを使用してコマンド
databricks auth profiles
を実行します。特定のプロファイルの既存の設定を表示するには、コマンドdatabricks auth env --profile <profile-name>
を実行します。ウェブブラウザで、画面の指示に従ってDatabricksアカウントまたはワークスペースにログインします。
プロファイルの現在のOAuthトークンの値と、トークンの有効期限を表示するには、次のいずれかのコマンドを実行します:
アカウントレベルの操作では、以下のコマンドを実行してください:
databricks auth token -p <profile-name>
databricks auth token --host <workspace-url> --account-id <account-id>
databricks auth token --host <workspace-url> --account-id <account-id> -p <profile-name>
--host
と--account-id
の値が同じプロファイルが複数ある場合は、Databricks CLIが一致するOAuthトークン情報を正しく見つけられるように、--host
、--account-id
、-p
オプションをまとめて指定する必要がある場合があります。ワークスペースレベルの操作では、以下のコマンドを実行してください:
databricks auth token -p <profile-name>
databricks auth token --host <workspace-url>
databricks auth token --host <workspace-url> -p <profile-name>
同じ
--host
値を持つプロファイルが複数ある場合、Databricks CLIが正しいOAuthトークン情報を見つけられるように--host
と-p
オプションを一緒に指定する必要がある場合があります。
次のステップ
Databricks CLIをセットアップしたら:
CLIの使用方法については、「Databricks CLIの基本的な使用法」を参照してください。
使用可能なCLIコマンドの概要については、「Databricks CLIコマンド」を参照してください。
CLIが実行されない場合、または予期しない結果が表示される場合は、「CLIのインストールを確認する」を参照してください。