コンピュート ポリシー リファレンス

この記事は、コンピュートポリシーの定義に関する参考資料です。 記事には、使用可能なポリシー属性と制限の種類のリファレンスが含まれています。 一般的なユースケースで参照できるサンプル ポリシーもあります。

ポリシー定義とは何ですか?

ポリシー定義は、 JSONで表現された個別のポリシー ルールです。 定義では、クラスターAPIで制御される任意の属性にルールを追加できます。 たとえば、次の定義は、デフォルトの自動終了時間を設定し、ユーザーによるプールの使用を禁止し、Photon の使用を強制します。

{
   "autotermination_minutes" : {
    "type" : "unlimited",
    "defaultValue" : 4320,
    "isOptional" : true
  },
  "instance_pool_id": {
    "type": "forbidden",
    "hidden": true
  },
  "runtime_engine": {
    "type": "fixed",
    "value": "PHOTON",
    "hidden": true
  }
}

属性ごとに 1 つの制限しか設定できません。 属性のパスは API 属性名を反映します。 ネストされた属性の場合、パスはネストされた属性名をドットで連結します。 ポリシー定義で定義されていない属性は制限されません。

サポートされている属性

ポリシーは、 APIで制御されるすべての属性をサポートします。 属性に設定できる制限の種類は、属性の種類と UI 要素との関係に基づいて、設定ごとに異なる場合があります。 ポリシーを使用してコンピュート権限を定義することはできません。

ポリシーを使用して、1 時間あたりの最大 DBU とクラスター タイプを設定することもできます。 仮想属性のパスを参照してください。

次の表に、サポートされているポリシー属性パスを示します。

属性パス

タイプ

説明

autoscale.max_workers

省略可能な数値

非表示にすると、UI から最大ワーカー数フィールドが削除されます。

autoscale.min_workers

省略可能な数値

非表示の場合、UI から最小ワーカー数フィールドが削除されます。

autotermination_minutes

数字

値 0 は、自動終了しないことを表します。 非表示にすると、自動終了チェックボックスと値入力が UI から削除されます。

aws_attributes.availability

string

AWS の可用性を制御します ( SPOTON_DEMAND 、またはSPOT_WITH_FALLBACK )

aws_attributes.ebs_volume_count

数字

AWS EBS ボリュームの数。

aws_attributes.ebs_volume_size

数字

AWS EBS ボリュームのサイズ (GiB 単位)。

aws_attributes.ebs_volume_type

string

AWS EBS ボリュームのタイプ。

aws_attributes.first_on_demand

数字

オンデマンドインスタンスに配置するノードの数を制御します。

aws_attributes.instance_profile_arn

string

AWSプロファイルを制御します。

aws_attributes.spot_bid_price_percent

数字

AWS スポットインスタンスの最大価格を制御します。

aws_attributes.zone_id

string

AWS ゾーン ID を制御します。

cluster_log_conf.path

string

ログ ファイルの宛先 URL。

cluster_log_conf.region

string

S3 ロケーションのリージョン。

cluster_log_conf.type

S3、DBFS、またはなし

ログの保存先のタイプ。

cluster_name

string

クラスター名。

custom_tags.*

string

タグ名を追加して特定のタグ値を制御します。例: custom_tags.<mytag>

data_security_mode

string

クラスターのアクセス モードを設定します。 Unity Catalog にはSINGLE_USERまたはUSER_ISOLATION (UI の共有アクセス モード) が必要です。 値 NONE は、セキュリティ機能が有効になっていないことを意味します。

docker_image.basic_auth.password

string

Databricks Container Services イメージの基本認証のパスワード。

docker_image.basic_auth.username

string

Databricks Container Servicesイメージの基本認証のユーザー名。

docker_image.url

string

Databricks Container Servicesイメージ URL を制御します。 非表示にすると、UI からDatabricks Container Servicesセクションが削除されます。

driver_node_type_id

オプションの文字列

非表示にすると、ドライバー ノード タイプの選択が UI から削除されます。

enable_elastic_disk

ブーリアン

非表示にすると、UI から[オートスケール ローカル ストレージを有効にする]チェックボックスが削除されます。

enable_local_disk_encryption

ブーリアン

クラスターにローカルに接続されたディスクの暗号化を有効にするにはtrueに設定し、無効にするにはfalseに設定します (API で指定)。

init_scripts.*.workspace.destination init_scripts.*.volumes.destination init_scripts.*.s3.destination init_scripts.*.file.destination init_scripts.*.s3.region

string

* 属性配列内の init スクリプトのインデックスを参照します。 配列属性のポリシーの記述を参照してください。

instance_pool_id

string

driver_instance_pool_idも定義されている場合はワーカー ノードによって使用されるプールを制御し、そうでない場合はすべてのクラスター ノードによって使用されるプールを制御します。 ワーカー ノードにプールを使用する場合は、ドライバー ノードにもプールを使用する必要があります。 非表示にすると、UI からプールの選択が削除されます。

driver_instance_pool_id

string

指定すると、ドライバー ノードとワーカー ノードに異なるプールが構成されます。 指定しない場合、 instance_pool_idを継承します。 ワーカー ノードにプールを使用する場合は、ドライバー ノードにもプールを使用する必要があります。 非表示にすると、UI からドライバー プールの選択が削除されます。

node_type_id

string

非表示にすると、UI からワーカー ノード タイプの選択が削除されます。

num_workers

省略可能な数値

非表示にすると、UI からワーカー番号の指定が削除されます。

runtime_engine

string

クラスターが Photon を使用するかどうかを決定します。 可能な値は PHOTON または STANDARDです。

single_user_name

string

コンピュート リソースに割り当てることができるユーザーまたはグループを制御します。

spark_conf.*

オプションの文字列

コンフィギュレーション キー名を付加して、特定のコンフィギュレーション値を制御します。 たとえば、 spark_conf.spark.executor.memoryです。

spark_env_vars.*

オプションの文字列

環境変数を追加して、特定の Spark 環境変数値を制御します (例: spark_env_vars.<environment variable name>

spark_version

string

API (Databricks Runtime) を通じて指定された Spark イメージ バージョン名。 Databricks Runtime を動的に選択する特別なポリシー値を使用することもできます。 「Databricks Runtime 選択のための特別なポリシー値」を参照してください。

ssh_public_keys.*

string

* は、属性配列内の公開鍵のインデックスを参照します。 配列属性のポリシーの記述を参照してください。

workload_type.clients.jobs

ブーリアン

コンピュートリソースをジョブに使用できるかどうかを定義します。 「コンピュートをジョブで使用しないようにする」を参照してください。

workload_type.clients.notebooks

ブーリアン

コンピュートリソースをノートブックで使用できるかどうかを定義します。 「コンピュートをジョブで使用しないようにする」を参照してください。

仮想属性パス

この表には、ポリシーでサポートされる 2 つの追加の合成属性が含まれています。

属性パス

タイプ

説明

dbus_per_hour

数字

ドライバー ノードを含むリソースが 1 時間あたりに使用できる最大 DBU を表す計算属性。 このメトリクスは、個々のコンピュート レベルでコストを直接制御する方法です。 範囲を制限して使用してください。

cluster_type

string

作成できるクラスターのタイプを表します。

  • all-purpose Databricks汎用コンピュート

  • job ジョブ スケジューラによって作成されたジョブ コンピュート用

  • dlt Delta Live Tablesパイプライン用に作成されたコンピュート

指定されたタイプのコンピュートがポリシーから作成されることを許可またはブロックします。 all-purpose値が許可されていない場合、ポリシーは汎用コンピュート作成 UI に表示されません。 job値が許可されていない場合、ポリシーはジョブ コンピュート作成 UI に表示されません。

Databricks Runtime 選択のための特別なポリシー値

spark_version属性は、現在サポートされている Databricks Runtime バージョンのセットに基づいて、Databricks Runtime バージョンに動的にマップされる特殊な値をサポートします。

spark_version 属性では、次の値を使用できます。

  • auto:latest: 最新の GA Databricks Runtime バージョンにマップされます。

  • auto:latest-ml: 最新の Databricks Runtime ML バージョンにマップします。

  • auto:latest-lts: 最新の長期サポート (LTS) Databricks Runtime バージョンにマップされます。

  • auto:latest-lts-ml: 最新の LTS Databricks Runtime ML バージョンにマップされます。

  • auto:prev-major: 2 番目に新しい GA Databricks Runtime バージョンにマップされます。 たとえば、 auto:latest が 14.2 の場合、 auto:prev-major は 13.3 です。

  • auto:prev-major-ml: 2 番目に新しい GA Databricks Runtime ML バージョンにマップされます。 たとえば、 auto:latest が 14.2 の場合、 auto:prev-major は 13.3 です。

  • auto:prev-lts: 2 番目に新しい LTS Databricks Runtime バージョンにマップされます。 たとえば、 auto:latest-lts が 13.3 の場合、 auto:prev-lts は 12.2 です。

  • auto:prev-lts-ml: 2 番目に新しい LTS Databricks Runtime ML バージョンにマップされます。 たとえば、 auto:latest-lts が 13.3 の場合、 auto:prev-lts は 12.2 です。

注:

これらの値を使用すると、新しいバージョンがリリースされたときにコンピュートが自動的に更新されることはありません。 Databricks Runtimeバージョンを変更するには、ユーザーがコンピュート を明示的に編集する必要があります。

サポートされているポリシーの種類

このセクションには、使用可能な各ポリシー タイプに関するリファレンスが含まれています。 ポリシーの種類には、固定ポリシーと制限ポリシーの 2 つのカテゴリがあります。

固定ポリシーにより、属性に対するユーザー構成が防止されます。 固定ポリシーには次の 2 つのタイプがあります。

制限ポリシーは、属性を構成するためのユーザーのオプションを制限します。 制限ポリシーを使用すると、デフォルト値を設定したり、属性をオプションにしたりすることもできます。 追加の制限ポリシー フィールドを参照してください。

ポリシーを制限するためのオプションは次のとおりです。

固定ポリシー

固定ポリシーは属性を指定された値に制限します。 数値とBoolean以外の属性値の場合、値は文字列で表されるか、文字列に変換可能である必要があります。

固定ポリシーでは、 hiddenフィールドをtrueに設定して、UI から属性を非表示にすることもできます。

interface FixedPolicy {
    type: "fixed";
    value: string | number | boolean;
    hidden?: boolean;
}

このサンプル ポリシーは、Databricks Runtime バージョンを修正し、ユーザーの UI からフィールドを非表示にします。

{
  "spark_version": { "type": "fixed", "value": "auto:latest-lts", "hidden": true }
}

禁止ポリシー

禁止ポリシーにより、ユーザーは属性を構成できなくなります。 禁止ポリシーはオプションの属性とのみ互換性があります。

interface ForbiddenPolicy {
    type: "forbidden";
}

このポリシーでは、ワーカー ノードのコンピュートにプールを接続することを禁止します。 driver_instance_pool_idポリシーを継承するため、ドライバー ノードではプールも禁止されています。

{
  "instance_pool_id": { "type": "forbidden" }
}

許可リストポリシー

許可リスト ポリシーは、属性を構成するときにユーザーが選択できる値のリストを指定します。

interface AllowlistPolicy {
  type: "allowlist";
  values: (string | number | boolean)[];
  defaultValue?: string | number | boolean;
  isOptional?: boolean;
}

この許可リストの例では、ユーザーは 2 つの Databricks Runtime バージョンから選択できます。

{
  "spark_version":  { "type": "allowlist", "values": [ "13.3.x-scala2.12", "12.2.x-scala2.12" ] }
}

ブロックリストポリシー

ブロックリスト ポリシーには、許可されていない値がリストされます。 値は完全に一致する必要があるため、属性の値の表現方法が緩い場合 (先頭と末尾のスペースを許可するなど)、このポリシーは期待どおりに機能しない可能性があります。

interface BlocklistPolicy {
  type: "blocklist";
  values: (string | number | boolean)[];
  defaultValue?: string | number | boolean;
  isOptional?: boolean;
}

この例では、ユーザーが Databricks Runtime として7.3.x-scala2.12を選択できないようにします。

{
  "spark_version":  { "type": "blocklist", "values": [ "7.3.x-scala2.12" ] }
}

正規表現ポリシー

正規表現ポリシーは、使用可能な値を正規表現に一致する値に制限します。 安全のため、正規表現が文字列値の先頭と末尾に固定されていることを確認してください。

interface RegexPolicy {
  type: "regex";
  pattern: string;
  defaultValue?: string | number | boolean;
  isOptional?: boolean;
}

この例では、ユーザーが選択できる Databricks Runtime バージョンを制限します。

{
  "spark_version":  { "type": "regex", "pattern": "13\\.[3456].*" }
}

レンジポリシー

範囲ポリシーは、 minValueフィールドとmaxValueフィールドを使用して値を指定された範囲に制限します。 値は 10 進数でなければなりません。 数値制限は、double 浮動小数点値として表現できる必要があります。 特定の制限がないことを示すには、 minValue または maxValueを省略できます。

interface RangePolicy {
  type: "range";
  minValue?: number;
  maxValue?: number;
  defaultValue?: string | number | boolean;
  isOptional?: boolean;
}

この例では、ワーカーの最大数を 10 に制限します。

{
  "num_workers":  { "type": "range", "maxValue": 10 }
}

無制限ポリシー

無制限ポリシーは、属性を必須にしたり、UI でデフォルト値を設定したりするために使用されます。

interface UnlimitedPolicy {
  type: "unlimited";
  defaultValue?: string | number | boolean;
  isOptional?: boolean;
}

この例では、コンピュートにCOST_BUCKETタグを追加します。

{
  "custom_tags.COST_BUCKET":  { "type": "unlimited" }
}

Spark 構成変数のデフォルト値を設定し、省略 (削除) も可能にするには、次のようにします。

{
  "spark_conf.spark.my.conf":  { "type": "unlimited", "isOptional": true, "defaultValue": "my_value" }
}

追加の制限ポリシーフィールド

ポリシー タイプを制限するには、次の 2 つの追加フィールドを指定できます。

  • defaultValue - コンピュート作成 UI に自動的に入力される値。

  • isOptional - 属性に対する制限ポリシーにより、その属性は自動的に必須になります。 属性をオプションにするには、 isOptional フィールドを trueに設定します。

注:

デフォルト 値は、クラスターAPIを使用して作成されたコンピュートには自動的に適用されません。 APIを使用してデフォルト値を適用するには、コンピュート定義に引数 apply_policy_default_values を追加し、それを true に設定します。

このサンプル ポリシーでは、ワーカー ノードのプールにデフォルト値id1を指定しますが、これはオプションになります。 コンピュートを作成するときに、別のプールを選択するか、プールを使用しないように選択できます。 driver_instance_pool_idがポリシーで定義されていない場合、またはコンピュートを作成するときに定義されていない場合は、ワーカー ノードとドライバー ノードに同じプールが使用されます。

{
  "instance_pool_id": { "type": "unlimited", "isOptional": true, "defaultValue": "id1" }
}

配列属性のポリシーの記述

配列属性のポリシーは、次の 2 つの方法で指定できます。

  • すべての配列要素に対する一般的な制限。 これらの制限では、ポリシー パスで*ワイルドカード シンボルが使用されます。

  • 特定のインデックスの配列要素に関する特定の制限。 これらの制限では、パスに番号を使用します。

たとえば、配列属性 init_scriptsの場合、汎用パスは init_scripts.* で始まり、特定のパスは init_scripts.<n>で始まります。ここで、 <n> は配列内の整数インデックス (0 から始まる) です。 総称的な制限と特定の制限を組み合わせることができますが、その場合、総称的な制限は、特定の制限のない各配列要素に適用されます。 いずれの場合も、適用されるポリシー制限は 1 つだけです。

次のセクションでは、配列属性を使用する一般的な例の例を示します。

包含固有のエントリを必須にする

順序を指定せずに特定の値を要求することはできません。 例えば:

{
  "init_scripts.0.volumes.destination": {
    "type": "fixed",
    "value": "<required-script-1>"
  },
  "init_scripts.1.volumes.destination": {
    "type": "fixed",
    "value": "<required-script-2>"
  }
}

リスト全体の固定値が必要

{
  "init_scripts.0.volumes.destination": {
    "type": "fixed",
    "value": "<required-script-1>"
  },
  "init_scripts.*.volumes.destination": {
    "type": "forbidden"
  }
}

使用を完全に禁止する

{
   "init_scripts.*.volumes.destination": {
    "type": "forbidden"
  }
}

特定の制限に従うエントリを許可する

{
    "init_scripts.*.volumes.destination": {
    "type": "regex",
    "pattern": ".*<required-content>.*"
  }
}

特定のinitスクリプトセットを修正する

init_scriptsパスの場合、配列には複数の構造体の 1 つを含めることができ、ユースケースに応じてすべての可能なバリアントを処理する必要があります。たとえば、特定の init スクリプト セットを要求し、他のバージョンのすべてのバリアントを禁止するには、次のパターンを使用できます。

{
  "init_scripts.0.volumes.destination": {
    "type": "fixed",
    "value": "<volume-paths>"
  },
  "init_scripts.1.volumes.destination": {
    "type": "fixed",
    "value": "<volume-paths>"
  },
  "init_scripts.*.workspace.destination": {
    "type": "forbidden"
  },
  "init_scripts.*.s3.destination": {
    "type": "forbidden"
  },
  "init_scripts.*.file.destination": {
    "type": "forbidden"
  }
}

ポリシーの例

このセクションには、独自のポリシーを作成するための参考として使用できるポリシーの例が含まれています。 Databricks が提供するポリシー ファミリを、一般的なポリシー使用ケースのテンプレートとして使用することもできます。

一般的なコンピュートポリシー

タグを要求し、インスタンスの最大数を制限し、タイムアウトを強制しながら、ユーザーをガイドし、一部の機能を制限することを目的とした汎用コンピュート ポリシー。

{
  "instance_pool_id": {
    "type": "forbidden",
    "hidden": true
  },
  "spark_version": {
    "type": "unlimited",
    "defaultValue": "auto:latest-ml"
  },
  "node_type_id": {
    "type": "allowlist",
    "values": [
      "i3.xlarge",
      "i3.2xlarge",
      "i3.4xlarge"
    ],
    "defaultValue": "i3.2xlarge"
  },
  "driver_node_type_id": {
    "type": "fixed",
    "value": "i3.2xlarge",
    "hidden": true
  },
  "autoscale.min_workers": {
    "type": "fixed",
    "value": 1,
    "hidden": true
  },
  "autoscale.max_workers": {
    "type": "range",
    "maxValue": 25,
    "defaultValue": 5
  },
  "enable_elastic_disk": {
    "type": "fixed",
    "value": true,
    "hidden": true
  },
  "autotermination_minutes": {
    "type": "fixed",
    "value": 30,
    "hidden": true
  },
  "custom_tags.team": {
    "type": "fixed",
    "value": "product"
  }
}

Delta Live Tablesの制限を定義するパイプライン コンピュート

注:

ポリシーを使用してDelta Live Tablesコンピュートを構成する場合、 Databricksでは、default コンピュートと maintenance コンピュートの両方に単一のポリシーを適用することをお勧めします。

パイプライン コンピュートのポリシーを構成するには、 cluster_typeフィールドをdltに設定したポリシーを作成します。 次の例では、 Delta Live Tablesの最小限のポリシーを作成します。

{
  "cluster_type": {
    "type": "fixed",
    "value": "dlt"
  },
  "num_workers": {
    "type": "unlimited",
    "defaultValue": 3,
    "isOptional": true
  },
  "node_type_id": {
    "type": "unlimited",
    "isOptional": true
  },
  "spark_version": {
    "type": "unlimited",
    "hidden": true
  }
}

シンプルな中規模ポリシー

最小限の構成で中規模のコンピュートを作成できます。 作成時に必須となるフィールドはコンピュート名のみです。残りは固定され、隠されています。

{
  "instance_pool_id": {
    "type": "forbidden",
    "hidden": true
  },
  "spark_conf.spark.databricks.cluster.profile": {
    "type": "forbidden",
    "hidden": true
  },
  "autoscale.min_workers": {
    "type": "fixed",
    "value": 1,
    "hidden": true
  },
  "autoscale.max_workers": {
    "type": "fixed",
    "value": 10,
    "hidden": true
  },
  "autotermination_minutes": {
    "type": "fixed",
    "value": 60,
    "hidden": true
  },
  "node_type_id": {
    "type": "fixed",
    "value": "i3.xlarge",
    "hidden": true
  },
  "driver_node_type_id": {
    "type": "fixed",
    "value": "i3.xlarge",
    "hidden": true
  },
  "spark_version": {
    "type": "fixed",
    "value": "auto:latest-ml",
    "hidden": true
  },
  "enable_elastic_disk": {
    "type": "fixed",
    "value": false,
    "hidden": true
  },
  "custom_tags.team": {
    "type": "fixed",
    "value": "product"
  }
}

ジョブ専用ポリシー

ユーザーがジョブ コンピュートを作成してジョブを実行できるようにします。 ユーザーはこのポリシーを使用して汎用コンピュートを作成することはできません。

{
  "cluster_type": {
    "type": "fixed",
    "value": "job"
  },
  "dbus_per_hour": {
    "type": "range",
    "maxValue": 100
  },
  "instance_pool_id": {
    "type": "forbidden",
    "hidden": true
  },
  "num_workers": {
    "type": "range",
    "minValue": 1
  },
  "node_type_id": {
    "type": "regex",
    "pattern": "[rmci][3-5][rnad]*.[0-8]{0,1}xlarge"
  },
  "driver_node_type_id": {
    "type": "regex",
    "pattern": "[rmci][3-5][rnad]*.[0-8]{0,1}xlarge"
  },
  "spark_version": {
    "type": "unlimited",
    "defaultValue": "auto:latest-lts"
  },
  "custom_tags.team": {
    "type": "fixed",
    "value": "product"
  }
}

外部メタストアポリシー

管理者が定義したメタストアがすでにアタッチされたコンピュートをユーザーが作成できるようにします。 これは、ユーザーが追加の構成を必要とせずに独自のコンピュートを作成できるようにするのに役立ちます。

{
  "spark_conf.spark.hadoop.javax.jdo.option.ConnectionURL": {
      "type": "fixed",
      "value": "jdbc:sqlserver://<jdbc-url>"
  },
  "spark_conf.spark.hadoop.javax.jdo.option.ConnectionDriverName": {
      "type": "fixed",
      "value": "com.microsoft.sqlserver.jdbc.SQLServerDriver"
  },
  "spark_conf.spark.databricks.delta.preview.enabled": {
      "type": "fixed",
      "value": "true"
  },
  "spark_conf.spark.hadoop.javax.jdo.option.ConnectionUserName": {
      "type": "fixed",
      "value": "<metastore-user>"
  },
  "spark_conf.spark.hadoop.javax.jdo.option.ConnectionPassword": {
      "type": "fixed",
      "value": "<metastore-password>"
  }
}

ジョブでコンピュートが使用されないようにする

このポリシーは、ユーザーがコンピュートを使用してジョブを実行することを防ぎます。 ユーザーは、コンピュートをノートブックでのみ使用できます。

{
  "workload_type.clients.notebooks": {
    "type": "fixed",
    "value": true
  },
  "workload_type.clients.jobs": {
    "type": "fixed",
    "value": false
  }
}

オートスケールポリシーを削除する

このポリシーはオートスケールを無効にし、ユーザーが指定された範囲内でワーカーの数を設定できるようにします。

{
  "num_workers": {
  "type": "range",
  "maxValue": 25,
  "minValue": 1,
  "defaultValue": 5
  }
}

カスタムタグの適用

ポリシーにコンピュート タグ ルールを追加するには、 custom_tags.<tag-name>属性を使用します。

たとえば、このポリシーを使用するユーザーは、コンピュートを起動するために、 COST_CENTERタグに 9999、9921、または 9531 を入力する必要があります。

   {"custom_tags.COST_CENTER": {"type":"allowlist", "values":["9999", "9921", "9531" ]}}