コンピュートポリシーリファレンス

この記事は、コンピュートポリシーの定義に関する参考資料です。記事には、使用可能なポリシー属性と制限の種類のリファレンスが含まれています。一般的なユースケースで参照できるサンプルポリシーもあります。

ポリシー定義とは何ですか?

ポリシー定義は、 JSONで表現された個別のポリシールールです。定義では、クラスターAPIで制御される任意の属性にルールを追加できます。たとえば、次の定義は、デフォルトの自動終了時間を設定し、ユーザーによるプールの使用を禁止し、Photon の使用を強制します。

{
   "autotermination_minutes" : {
    "type" : "unlimited",
    "defaultValue" : 4320,
    "isOptional" : true
  },
  "instance_pool_id": {
    "type": "forbidden",
    "hidden": true
  },
  "runtime_engine": {
    "type": "fixed",
    "value": "PHOTON",
    "hidden": true
  }
}

属性ごとに 1 つの制限しか設定できません。属性のパスは API 属性名を反映します。ネストされた属性の場合、パスはネストされた属性名をドットで連結します。ポリシー定義で定義されていない属性は制限されません。

サポートされている属性

ポリシーは、 APIで制御されるすべての属性をサポートします。属性に設定できる制限の種類は、属性の種類と UI 要素との関係に基づいて、設定ごとに異なる場合があります。ポリシーを使用してコンピュート権限を定義することはできません。

ポリシーを使用して、1 時間あたりの最大 DBU とクラスタータイプを設定することもできます。仮想属性のパスを参照してください。

次の表に、サポートされているポリシー属性パスを示します。

属性パス	タイプ	説明
`autoscale.max_workers`	省略可能な数値	非表示にすると、UI から最大ワーカー数フィールドが削除されます。
`autoscale.min_workers`	省略可能な数値	非表示の場合、UI から最小ワーカー数フィールドが削除されます。
`autotermination_minutes`	数字	値 0 は、自動終了しないことを表します。非表示にすると、自動終了チェックボックスと値入力が UI から削除されます。
`aws_attributes.availability`	string	AWS の可用性を制御します ( `SPOT` 、 `ON_DEMAND` 、または`SPOT_WITH_FALLBACK` )
`aws_attributes.ebs_volume_count`	数字	AWS EBS ボリュームの数。
`aws_attributes.ebs_volume_size`	数字	AWS EBS ボリュームのサイズ (GiB 単位)。
`aws_attributes.ebs_volume_type`	string	AWS EBS ボリュームのタイプ。
`aws_attributes.first_on_demand`	数字	オンデマンドインスタンスに配置するノードの数を制御します。
`aws_attributes.instance_profile_arn`	string	AWSプロファイルを制御します。
`aws_attributes.spot_bid_price_percent`	数字	AWS スポットインスタンスの最大価格を制御します。
`aws_attributes.zone_id`	string	AWS ゾーン ID を制御します。
`cluster_log_conf.path`	string	ログファイルの宛先 URL。
`cluster_log_conf.region`	string	S3 ロケーションのリージョン。
`cluster_log_conf.type`	S3、DBFS、またはなし	ログの保存先のタイプ。
`cluster_name`	string	クラスター名。
`custom_tags.*`	string	タグ名を追加して特定のタグ値を制御します。例: `custom_tags.<mytag>` 。
`data_security_mode`	string	クラスターのアクセスモードを設定します。 Unity Catalog には`SINGLE_USER`または`USER_ISOLATION` (UI の共有アクセスモード) が必要です。値 `NONE` は、セキュリティ機能が有効になっていないことを意味します。
`docker_image.basic_auth.password`	string	Databricks Container Services イメージの基本認証のパスワード。
`docker_image.basic_auth.username`	string	Databricks Container Servicesイメージの基本認証のユーザー名。
`docker_image.url`	string	Databricks Container Servicesイメージ URL を制御します。非表示にすると、UI からDatabricks Container Servicesセクションが削除されます。
`driver_node_type_id`	オプションの文字列	非表示にすると、ドライバーノードタイプの選択が UI から削除されます。
`enable_elastic_disk`	ブーリアン	非表示にすると、UI から[オートスケールローカルストレージを有効にする]チェックボックスが削除されます。
`enable_local_disk_encryption`	ブーリアン	クラスターにローカルに接続されたディスクの暗号化を有効にするには`true`に設定し、無効にするには`false`に設定します (API で指定)。
`init_scripts..workspace.destination` `init_scripts..volumes.destination` `init_scripts..s3.destination` `init_scripts..file.destination` `init_scripts.*.s3.region`	string	`*` 属性配列内の init スクリプトのインデックスを参照します。配列属性のポリシーの記述を参照してください。
`instance_pool_id`	string	`driver_instance_pool_id`も定義されている場合はワーカーノードによって使用されるプールを制御し、そうでない場合はすべてのクラスターノードによって使用されるプールを制御します。ワーカーノードにプールを使用する場合は、ドライバーノードにもプールを使用する必要があります。非表示にすると、UI からプールの選択が削除されます。
`driver_instance_pool_id`	string	指定すると、ドライバーノードとワーカーノードに異なるプールが構成されます。指定しない場合、 `instance_pool_id`を継承します。ワーカーノードにプールを使用する場合は、ドライバーノードにもプールを使用する必要があります。非表示にすると、UI からドライバープールの選択が削除されます。
`node_type_id`	string	非表示にすると、UI からワーカーノードタイプの選択が削除されます。
`num_workers`	省略可能な数値	非表示にすると、UI からワーカー番号の指定が削除されます。
`runtime_engine`	string	クラスターが Photon を使用するかどうかを決定します。可能な値は `PHOTON` または `STANDARD`です。
`single_user_name`	string	資格情報パススルーのシングルユーザーアクセスのユーザー名。
`spark_conf.*`	オプションの文字列	コンフィギュレーションキー名を付加して、特定のコンフィギュレーション値を制御します。たとえば、 `spark_conf.spark.executor.memory`です。
`spark_env_vars.*`	オプションの文字列	環境変数を追加して、特定の Spark 環境変数値を制御します (例: `spark_env_vars.<environment variable name>` 。
`spark_version`	string	API (Databricks Runtime) を通じて指定された Spark イメージバージョン名。 Databricks Runtime を動的に選択する特別なポリシー値を使用することもできます。「Databricks Runtime 選択のための特別なポリシー値」を参照してください。
`ssh_public_keys.*`	string	`*` は、属性配列内の公開鍵のインデックスを参照します。配列属性のポリシーの記述を参照してください。
`workload_type.clients.jobs`	ブーリアン	コンピュートリソースをジョブに使用できるかどうかを定義します。「コンピュートをジョブで使用しないようにする」を参照してください。
`workload_type.clients.notebooks`	ブーリアン	コンピュートリソースをドイツ語で使用できるかどうかを定義します。「コンピュートをジョブで使用しないようにする」を参照してください。

仮想属性パス

この表には、ポリシーでサポートされる 2 つの追加の合成属性が含まれています。

属性パス

タイプ

説明

dbus_per_hour

数字

ドライバーノードを含むリソースが 1 時間あたりに使用できる最大 DBU を表す計算属性。このメトリクスは、個々のコンピュートレベルでコストを直接制御する方法です。範囲を制限して使用してください。

cluster_type

string

作成できるクラスターのタイプを表します。

all-purpose Databricks汎用コンピュート
job ジョブスケジューラによって作成されたジョブコンピュート用
dlt Delta Live Tablesパイプライン用に作成されたコンピュート

指定されたタイプのコンピュートがポリシーから作成されることを許可またはブロックします。 all-purpose値が許可されていない場合、ポリシーは汎用コンピュート作成 UI に表示されません。 job値が許可されていない場合、ポリシーはジョブコンピュート作成 UI に表示されません。

Databricks Runtime 選択のための特別なポリシー値

spark_version属性は、現在サポートされている Databricks Runtime バージョンのセットに基づいて、Databricks Runtime バージョンに動的にマップされる特殊な値をサポートします。

spark_version 属性では、次の値を使用できます。

auto:latest: 最新の GA Databricks Runtime バージョンにマップされます。
auto:latest-ml: 最新の Databricks Runtime ML バージョンにマップします。
auto:latest-lts: 最新の長期サポート (LTS) Databricks Runtime バージョンにマップされます。
auto:latest-lts-ml: 最新の LTS Databricks Runtime ML バージョンにマップされます。
auto:prev-major: 2 番目に新しい GA Databricks Runtime バージョンにマップされます。たとえば、 auto:latest が 14.2 の場合、 auto:prev-major は 13.3 です。
auto:prev-major-ml: 2 番目に新しい GA Databricks Runtime ML バージョンにマップされます。たとえば、 auto:latest が 14.2 の場合、 auto:prev-major は 13.3 です。
auto:prev-lts: 2 番目に新しい LTS Databricks Runtime バージョンにマップされます。たとえば、 auto:latest-lts が 13.3 の場合、 auto:prev-lts は 12.2 です。
auto:prev-lts-ml: 2 番目に新しい LTS Databricks Runtime ML バージョンにマップされます。たとえば、 auto:latest-lts が 13.3 の場合、 auto:prev-lts は 12.2 です。

注：

これらの値を使用すると、新しいバージョンがリリースされたときにコンピュートが自動的に更新されることはありません。 Databricks Runtimeバージョンを変更するには、ユーザーがコンピュートを明示的に編集する必要があります。

サポートされているポリシーの種類

このセクションには、使用可能な各ポリシータイプに関するリファレンスが含まれています。ポリシーの種類には、固定ポリシーと制限ポリシーの 2 つのカテゴリがあります。

固定ポリシーにより、属性に対するユーザー構成が防止されます。固定ポリシーには次の 2 つのタイプがあります。

固定ポリシー
禁止ポリシー

制限ポリシーは、属性を構成するためのユーザーのオプションを制限します。制限ポリシーを使用すると、デフォルト値を設定したり、属性をオプションにしたりすることもできます。追加の制限ポリシーフィールドを参照してください。

ポリシーを制限するためのオプションは次のとおりです。

許可リストポリシー
ブロックリストポリシー
正規表現ポリシー
レンジポリシー
無制限ポリシー

固定ポリシー

固定ポリシーは属性を指定された値に制限します。数値とBoolean以外の属性値の場合、値は文字列で表されるか、文字列に変換可能である必要があります。

固定ポリシーでは、 hiddenフィールドをtrueに設定して、UI から属性を非表示にすることもできます。

interface FixedPolicy {
    type: "fixed";
    value: string | number | boolean;
    hidden?: boolean;
}

このサンプルポリシーは、Databricks Runtime バージョンを修正し、ユーザーの UI からフィールドを非表示にします。

{
  "spark_version": { "type": "fixed", "value": "auto:latest-lts", "hidden": true }
}

禁止ポリシー

禁止ポリシーにより、ユーザーは属性を構成できなくなります。禁止ポリシーはオプションの属性とのみ互換性があります。

interface ForbiddenPolicy {
    type: "forbidden";
}

このポリシーでは、ワーカーノードのコンピュートにプールを接続することを禁止します。 driver_instance_pool_idポリシーを継承するため、ドライバーノードではプールも禁止されています。

{
  "instance_pool_id": { "type": "forbidden" }
}

許可リストポリシー

許可リストポリシーは、属性を構成するときにユーザーが選択できる値のリストを指定します。

interface AllowlistPolicy {
  type: "allowlist";
  values: (string | number | boolean)[];
  defaultValue?: string | number | boolean;
  isOptional?: boolean;
}

この許可リストの例では、ユーザーは 2 つの Databricks Runtime バージョンから選択できます。

{
  "spark_version":  { "type": "allowlist", "values": [ "13.3.x-scala2.12", "12.2.x-scala2.12" ] }
}

ブロックリストポリシー

ブロックリストポリシーには、許可されていない値がリストされます。値は完全に一致する必要があるため、属性の値の表現方法が緩い場合 (先頭と末尾のスペースを許可するなど)、このポリシーは期待どおりに機能しない可能性があります。

interface BlocklistPolicy {
  type: "blocklist";
  values: (string | number | boolean)[];
  defaultValue?: string | number | boolean;
  isOptional?: boolean;
}

この例では、ユーザーが Databricks Runtime として7.3.x-scala2.12を選択できないようにします。

{
  "spark_version":  { "type": "blocklist", "values": [ "7.3.x-scala2.12" ] }
}

正規表現ポリシー

正規表現ポリシーは、使用可能な値を正規表現に一致する値に制限します。安全のため、正規表現が文字列値の先頭と末尾に固定されていることを確認してください。

interface RegexPolicy {
  type: "regex";
  pattern: string;
  defaultValue?: string | number | boolean;
  isOptional?: boolean;
}

この例では、ユーザーが選択できる Databricks Runtime バージョンを制限します。

{
  "spark_version":  { "type": "regex", "pattern": "13\\.[3456].*" }
}

レンジポリシー

範囲ポリシーは、 minValueフィールドとmaxValueフィールドを使用して値を指定された範囲に制限します。値は 10 進数でなければなりません。数値制限は、double 浮動小数点値として表現できる必要があります。特定の制限がないことを示すには、 minValue または maxValueを省略できます。

interface RangePolicy {
  type: "range";
  minValue?: number;
  maxValue?: number;
  defaultValue?: string | number | boolean;
  isOptional?: boolean;
}

この例では、ワーカーの最大数を 10 に制限します。

{
  "num_workers":  { "type": "range", "maxValue": 10 }
}

無制限ポリシー

無制限ポリシーは、属性を必須にしたり、UI でデフォルト値を設定したりするために使用されます。

interface UnlimitedPolicy {
  type: "unlimited";
  defaultValue?: string | number | boolean;
  isOptional?: boolean;
}

この例では、コンピュートにCOST_BUCKETタグを追加します。

{
  "custom_tags.COST_BUCKET":  { "type": "unlimited" }
}

Spark 構成変数のデフォルト値を設定し、省略 (削除) も可能にするには、次のようにします。

{
  "spark_conf.spark.my.conf":  { "type": "unlimited", "isOptional": true, "defaultValue": "my_value" }
}

追加の制限ポリシーフィールド

ポリシータイプを制限するには、次の 2 つの追加フィールドを指定できます。

defaultValue - コンピュート作成 UI に自動的に入力される値。
isOptional - 属性に対する制限ポリシーにより、その属性は自動的に必須になります。属性をオプションにするには、 isOptional フィールドを trueに設定します。

注：

デフォルト値は、クラスターAPIを使用して作成されたコンピュートには自動的に適用されません。 APIを使用してデフォルト値を適用するには、コンピュート定義に引数 apply_policy_default_values を追加し、それを true に設定します。

このサンプルポリシーでは、ワーカーノードのプールにデフォルト値id1を指定しますが、これはオプションになります。コンピュートを作成するときに、別のプールを選択するか、プールを使用しないように選択できます。 driver_instance_pool_idがポリシーで定義されていない場合、またはコンピュートを作成するときに定義されていない場合は、ワーカーノードとドライバーノードに同じプールが使用されます。

{
  "instance_pool_id": { "type": "unlimited", "isOptional": true, "defaultValue": "id1" }
}

配列属性のポリシーの記述

配列属性のポリシーは、次の 2 つの方法で指定できます。

すべての配列要素に対する一般的な制限。これらの制限では、ポリシーパスで*ワイルドカードシンボルが使用されます。
特定のインデックスの配列要素に関する特定の制限。これらの制限では、パスに番号を使用します。

たとえば、配列属性 init_scriptsの場合、汎用パスは init_scripts.* で始まり、特定のパスは init_scripts.<n>で始まります。ここで、 <n> は配列内の整数インデックス (0 から始まる) です。総称的な制限と特定の制限を組み合わせることができますが、その場合、総称的な制限は、特定の制限のない各配列要素に適用されます。いずれの場合も、適用されるポリシー制限は 1 つだけです。

次のセクションでは、配列属性を使用する一般的な例の例を示します。

包含固有のエントリを必須にする

順序を指定せずに特定の値を要求することはできません。例えば：

{
  "init_scripts.0.volumes.destination": {
    "type": "fixed",
    "value": "<required-script-1>"
  },
  "init_scripts.1.volumes.destination": {
    "type": "fixed",
    "value": "<required-script-2>"
  }
}

リスト全体の固定値が必要

{
  "init_scripts.0.volumes.destination": {
    "type": "fixed",
    "value": "<required-script-1>"
  },
  "init_scripts.*.volumes.destination": {
    "type": "forbidden"
  }
}

使用を完全に禁止する

{
   "init_scripts.*.volumes.destination": {
    "type": "forbidden"
  }
}

特定の制限に従うエントリを許可する

{
    "init_scripts.*.volumes.destination": {
    "type": "regex",
    "pattern": ".*<required-content>.*"
  }
}

特定のinitスクリプトセットを修正する

init_scriptsパスの場合、配列には複数の構造体の 1 つを含めることができ、ユースケースに応じてすべての可能なバリアントを処理する必要があります。たとえば、特定の init スクリプトセットを要求し、他のバージョンのすべてのバリアントを禁止するには、次のパターンを使用できます。

{
  "init_scripts.0.volumes.destination": {
    "type": "fixed",
    "value": "<volume-paths>"
  },
  "init_scripts.1.volumes.destination": {
    "type": "fixed",
    "value": "<volume-paths>"
  },
  "init_scripts.*.workspace.destination": {
    "type": "forbidden"
  },
  "init_scripts.*.s3.destination": {
    "type": "forbidden"
  },
  "init_scripts.*.file.destination": {
    "type": "forbidden"
  }
}

ポリシーの例

このセクションには、独自のポリシーを作成するための参考として使用できるポリシーの例が含まれています。 Databricks が提供するポリシーファミリを、一般的なポリシー使用ケースのテンプレートとして使用することもできます。

一般的なコンピュートポリシー
Delta Live Tablesの制限を定義するパイプラインコンピュート
シンプルな中規模ポリシー
ジョブ専用ポリシー
外部メタストアポリシー
ジョブでコンピュートが使用されないようにする
オートスケールポリシーを削除する
カスタムタグの適用

一般的なコンピュートポリシー

タグを要求し、インスタンスの最大数を制限し、タイムアウトを強制しながら、ユーザーをガイドし、一部の機能を制限することを目的とした汎用コンピュートポリシー。

{
  "instance_pool_id": {
    "type": "forbidden",
    "hidden": true
  },
  "spark_version": {
    "type": "unlimited",
    "defaultValue": "auto:latest-ml"
  },
  "node_type_id": {
    "type": "allowlist",
    "values": [
      "i3.xlarge",
      "i3.2xlarge",
      "i3.4xlarge"
    ],
    "defaultValue": "i3.2xlarge"
  },
  "driver_node_type_id": {
    "type": "fixed",
    "value": "i3.2xlarge",
    "hidden": true
  },
  "autoscale.min_workers": {
    "type": "fixed",
    "value": 1,
    "hidden": true
  },
  "autoscale.max_workers": {
    "type": "range",
    "maxValue": 25,
    "defaultValue": 5
  },
  "enable_elastic_disk": {
    "type": "fixed",
    "value": true,
    "hidden": true
  },
  "autotermination_minutes": {
    "type": "fixed",
    "value": 30,
    "hidden": true
  },
  "custom_tags.team": {
    "type": "fixed",
    "value": "product"
  }
}

Delta Live Tablesの制限を定義するパイプラインコンピュート

注：

ポリシーを使用してDelta Live Tablesコンピュートを構成する場合、 Databricksでは、default コンピュートと maintenance コンピュートの両方に単一のポリシーを適用することをお勧めします。

パイプラインコンピュートのポリシーを構成するには、 cluster_typeフィールドをdltに設定したポリシーを作成します。次の例では、 Delta Live Tablesの最小限のポリシーを作成します。

{
  "cluster_type": {
    "type": "fixed",
    "value": "dlt"
  },
  "num_workers": {
    "type": "unlimited",
    "defaultValue": 3,
    "isOptional": true
  },
  "node_type_id": {
    "type": "unlimited",
    "isOptional": true
  },
  "spark_version": {
    "type": "unlimited",
    "hidden": true
  }
}

シンプルな中規模ポリシー

最小限の構成で中規模のコンピュートを作成できます。作成時に必須となるフィールドはコンピュート名のみです。残りは固定され、隠されています。

{
  "instance_pool_id": {
    "type": "forbidden",
    "hidden": true
  },
  "spark_conf.spark.databricks.cluster.profile": {
    "type": "forbidden",
    "hidden": true
  },
  "autoscale.min_workers": {
    "type": "fixed",
    "value": 1,
    "hidden": true
  },
  "autoscale.max_workers": {
    "type": "fixed",
    "value": 10,
    "hidden": true
  },
  "autotermination_minutes": {
    "type": "fixed",
    "value": 60,
    "hidden": true
  },
  "node_type_id": {
    "type": "fixed",
    "value": "i3.xlarge",
    "hidden": true
  },
  "driver_node_type_id": {
    "type": "fixed",
    "value": "i3.xlarge",
    "hidden": true
  },
  "spark_version": {
    "type": "fixed",
    "value": "auto:latest-ml",
    "hidden": true
  },
  "enable_elastic_disk": {
    "type": "fixed",
    "value": false,
    "hidden": true
  },
  "custom_tags.team": {
    "type": "fixed",
    "value": "product"
  }
}

ジョブ専用ポリシー

ユーザーがジョブコンピュートを作成してジョブを実行できるようにします。ユーザーはこのポリシーを使用して汎用コンピュートを作成することはできません。

{
  "cluster_type": {
    "type": "fixed",
    "value": "job"
  },
  "dbus_per_hour": {
    "type": "range",
    "maxValue": 100
  },
  "instance_pool_id": {
    "type": "forbidden",
    "hidden": true
  },
  "num_workers": {
    "type": "range",
    "minValue": 1
  },
  "node_type_id": {
    "type": "regex",
    "pattern": "[rmci][3-5][rnad]*.[0-8]{0,1}xlarge"
  },
  "driver_node_type_id": {
    "type": "regex",
    "pattern": "[rmci][3-5][rnad]*.[0-8]{0,1}xlarge"
  },
  "spark_version": {
    "type": "unlimited",
    "defaultValue": "auto:latest-lts"
  },
  "custom_tags.team": {
    "type": "fixed",
    "value": "product"
  }
}

外部メタストアポリシー

管理者が定義したメタストアがすでにアタッチされたコンピュートをユーザーが作成できるようにします。これは、ユーザーが追加の構成を必要とせずに独自のコンピュートを作成できるようにするのに役立ちます。

{
  "spark_conf.spark.hadoop.javax.jdo.option.ConnectionURL": {
      "type": "fixed",
      "value": "jdbc:sqlserver://<jdbc-url>"
  },
  "spark_conf.spark.hadoop.javax.jdo.option.ConnectionDriverName": {
      "type": "fixed",
      "value": "com.microsoft.sqlserver.jdbc.SQLServerDriver"
  },
  "spark_conf.spark.databricks.delta.preview.enabled": {
      "type": "fixed",
      "value": "true"
  },
  "spark_conf.spark.hadoop.javax.jdo.option.ConnectionUserName": {
      "type": "fixed",
      "value": "<metastore-user>"
  },
  "spark_conf.spark.hadoop.javax.jdo.option.ConnectionPassword": {
      "type": "fixed",
      "value": "<metastore-password>"
  }
}

ジョブでコンピュートが使用されないようにする

このポリシーは、ユーザーがコンピュートを使用してジョブを実行することを防ぎます。ユーザーは、コンピュートをドイツ語でのみ使用できます。

{
  "workload_type.clients.notebooks": {
    "type": "fixed",
    "value": true
  },
  "workload_type.clients.jobs": {
    "type": "fixed",
    "value": false
  }
}

オートスケールポリシーを削除する

このポリシーはオートスケールを無効にし、ユーザーが指定された範囲内でワーカーの数を設定できるようにします。

{
  "num_workers": {
  "type": "range",
  "maxValue": 25,
  "minValue": 1,
  "defaultValue": 5
  }
}

カスタムタグの適用

ポリシーにコンピュートタグルールを追加するには、 custom_tags.<tag-name>属性を使用します。

たとえば、このポリシーを使用するユーザーは、コンピュートを起動するために、 COST_CENTERタグに 9999、9921、または 9531 を入力する必要があります。

   {"custom_tags.COST_CENTER": {"type":"allowlist", "values":["9999", "9921", "9531" ]}}

コンピュート ポリシー リファレンス