ノートブックの結果の保存場所を構成する
組織のプライバシー要件により、一部のノートブック コマンドの結果が格納されている Databricksマネージド コントロール プレーン デフォルトの場所ではなく、すべての対話型ノートブックの結果をクラウド アカウントのワークスペース ストレージ バケットに格納する必要がある場合があります。
ノートブックのコマンド出力の保存方法は、ノートブックの実行方法によって異なります。
デフォルトでは、ノートブックで [ 実行 ] をクリックしてノートブックを対話的に実行すると、以下のようになります。
- 結果が小さい場合は、ノートブックのコマンドの内容とメタデータと共に Databricks コントロール プレーンに格納されます。
- より大きな結果は、Google Cloud アカウントのワークスペース ストレージ バケットに保存されます。 Databricks は、ワークスペース ストレージ バケットを自動的に作成します。 Databricks は、このストレージ領域をワークスペース システム データとワークスペースの DBFSルートに使用します。 ノートブックの結果は、ユーザーがアクセスできないワークスペース システムのデータ ストレージに格納されます。 「ワークスペースストレージバケット」を参照してください。
ノートブックをジョブとして実行すると、ノートブックをスケジュールするか、[ジョブ] ページで [ 今すぐ実行 ] をクリックすると、すべての結果がアカウントのワークスペース ストレージ バケットに保存されます。
結果のサイズに関係なく、 すべての対話型ノートブックの結果をクラウド アカウントに格納するようにワークスペースを構成できます。
対話型ノートブックの結果の保存場所を構成する
ワークスペースは、すべてのインタラクティブ ノートブックの結果をコントロール プレーンではなく Google Cloud アカウントに保存するように構成できます。 この機能は、 管理者設定ページ または REST API を使用して有効にできます。 この設定は、ジョブとして実行されるノートブックには影響せず、その結果はデフォルトで Google Cloud アカウントにすでに保存されている。
次の点に注意してください。
- この設定の変更は、新しい結果に対してのみ有効です。既存のノートブックの結果は移動しません。
- グラフの列名など、結果に関する一部のメタデータは引き続きコントロールプレーンに保存されることに注意してください。
- クラウドプロバイダーのストレージコストが増える可能性があります。
- 結果の読み取りおよび書き込み時に、ネットワークおよびIOのレイテンシーが増加する可能性があります。
管理者設定ページを使用して、すべてのノートブックの結果をアカウントに保存します
ワークスペース管理者としてログインし、以下を実行します。
- 設定ページに移動します。
- [セキュリティ ] タブをクリックします。
- [対話型ノートブックの結果を顧客アカウントに保存する ] トグルをクリックします。
REST API を使用して、すべてのノートブックの結果をアカウントに保存します
REST APIを使用して、Google Cloud アカウントにすべてのデータベースの結果を保存するようにワークスペースを構成するには:
- この作業にはワークスペース管理者の権限が必要となります。
- 個人用アクセストークンが必要です。次の手順では、
curl
コマンドで-n
オプションを使用できるように、個人用アクセス トークンを使用して.netrc
ファイルを構成していることを前提としています。詳細については、上記の記事を参照してください。
現在の設定を取得するには、GET /workspace-conf
エンドポイントを呼び出して、keys
を storeInteractiveNotebookResultsInCustomerAccount
に設定します。
curl -n --request GET \
'https://<databricks-instance>/api/2.0/workspace-conf?keys=storeInteractiveNotebookResultsInCustomerAccount'
ワークスペースがインタラクティブなデータの結果を Google Cloud アカウントに保存できるようにするには、 PATCH /workspace-conf
エンドポイントを呼び出して、リクエスト本文でstoreInteractiveNotebookResultsInCustomerAccount
をtrue
に設定します。
curl -n --request PATCH \
'https://<databricks-instance>/api/2.0/workspace-conf' \
--header 'Content-Type: text/plain' \
--data-raw '{
"storeInteractiveNotebookResultsInCustomerAccount": "true"
}'
この機能を無効にするには、同じフラグを false
に設定します。
curl -n --request PATCH \
'https://<databricks-instance>/api/2.0/workspace-conf' \
--header 'Content-Type: text/plain' \
--data-raw '{
"storeInteractiveNotebookResultsInCustomerAccount": "false"
}'