サーバレスエグレスコントロールのネットワークポリシーの管理

警告

BDC と SAP Databricksの間の接続が切断されないようにするには、サーバレスエグレスコントロールを設定する前に SAP のマニュアルを参照してください。

このページでは、SAP Databricksでサーバレスワークロードからのアウトバウンドネットワーク接続を制御するためのネットワークポリシーを構成および管理する方法について説明します。

必要条件

ネットワークポリシーを管理するための権限は、アカウント管理者に制限されています。

ネットワークポリシーへのアクセス

アカウントでネットワークポリシーを作成、表示、更新するには:

アカウントコンソールから、 [セキュリティ] をクリックします。
[ネットワーク] タブをクリックします。
[ポリシー] の下で、 [コンテキストベースのイングレスおよびエグレス制御] をクリックします。

ネットワークポリシーを作成する

新しいネットワークポリシーの作成 をクリックします。
ポリシー名 を入力します。
[出力] タブをクリックします。
ネットワークアクセスモードを選択します。
- すべての宛先へのアクセスを許可する : 無制限のアウトバウンドインターネットアクセス。 [フルアクセス ] を選択した場合、送信インターネットアクセスは制限されません。
- 特定の宛先へのアクセス制限 : 送信アクセスは指定された宛先に制限されます。

ネットワークポリシーの詳細。

ネットワークポリシーの設定

次の手順では、制限付きアクセスモードのオプション設定の概要を示します。

エグレスルールを設定する

出力ルールを設定する前に、次の点に注意してください。

UC 外部ロケーションのメタストアとクラウドストレージコンテナバケットが異なるリージョンにある場合、アクセスを成功させるには、バケットをエグレス許可リストに明示的に追加する必要があります。
サポートされる宛先の最大数は 2500 です。
許可されたドメインとして追加できる FQDN の数は、ポリシーごとに 100 に制限されています。
ネットワークロードバランサーの Private Link エントリとして追加されたドメインは、ネットワークポリシーで暗黙的に許可リストに登録されます。ドメインが削除された場合、またはプライベートエンドポイントが削除された場合、ネットワークポリシー制御によって変更が完全に適用されるまでに最大 24 時間かかる場合があります。
Delta Sharingバケットは、ネットワークポリシーで暗黙的にホワイトリストに登録されます。

サーバレスコンピュートに追加のドメインへのアクセス権を付与するには、 許可されたドメイン リストの上にある 宛先の追加 をクリックします。

FQDN フィルターを使用すると、同じ IP アドレスを共有するすべてのドメインにアクセスできます。エンドポイント全体でモデルサービングプロビジョニングは、ネットワークアクセスが制限付きに設定されている場合、インターネットアクセスを防ぎます。ただし、FQDN フィルタリングによるきめ細かな制御はサポートされていません。
ワークスペースが追加のクラウドストレージコンテナにアクセスできるようにするには、[ 許可されたストレージの宛先] リストの上にある [ 宛先の追加 ] ボタンをクリックします。

注記

REPL や UDF などのユーザーコードコンテナーからクラウドストレージサービスへの直接アクセスは、デフォルトでは許可されていません。このアクセスを有効にするには、ポリシーの [許可されたドメイン] にストレージリソースの FQDN を追加します。ストレージリソースのベースドメインのみを追加すると、リージョン内のすべてのストレージリソースへのアクセスが誤って許可されてしまう可能性があります。

ポリシーの施行

dry-run モードを使用すると、リソースへのアクセスを中断することなく、ポリシー設定をテストし、送信接続を監視できます。 dry-run モードが有効な場合、ポリシーに違反する要求はログに記録されますが、ブロックされません。次のオプションから選択できます。

Databricks SQL :Databricks SQLウェアハウスはドライ実行モードで動作します。
AI モデルサービング : モデルサービングエンドポイントはドライ実行モードで動作します。
すべての製品 : すべての SAP Databricks サービスはドライ実行モードで動作し、他のすべての選択を上書きします。

デフォルトポリシーを更新する

各 SAP Databricks アカウントには、 デフォルトポリシー が含まれています。 デフォルト・ポリシーは 、明示的にネットワーク・ポリシーが割り当てられていないすべてのワークスペース(新しく作成されたワークスペースを含む)に関連付けられます。このポリシーは変更できますが、削除することはできません。

ネットワークポリシーをワークスペースに関連付ける

デフォルトのポリシーを追加の設定で更新した場合、既存のネットワークポリシーがないワークスペースにも自動的に適用されます。

ワークスペースを別のポリシーに関連付けるには、次の操作を行います。

ワークスペースを選択します。
ネットワークポリシー で、 ネットワークポリシーの更新 をクリックします。
リストから目的のネットワークポリシーを選択します。
[ポリシーの適用]を クリックします。

ネットワークポリシーを更新します。

ネットワークポリシーの変更を適用する

ほとんどのネットワーク設定の更新は、10 分で自動的にサーバレスコンピュートに反映されます。これには以下が含まれます。

新しい Unity Catalog 外部ロケーションまたは接続を追加する。
ワークスペースを別のメタストアにアタッチする。
許可されたストレージまたはインターネットの宛先を変更します。

注記

インターネットアクセスまたはドライ実行モードの設定を変更する場合は、コンピュートを再起動する必要があります。

サーバレスワークロードの再起動または再デプロイ

更新する必要があるのは、インターネットアクセスモードを切り替えるとき、またはドライ実行モードを更新するときだけです。

適切な再始動手順を決定するには、以下の製品別リストを参照してください。

Databricks ML Serving : ML サービングエンドポイントを再デプロイします。
サーバレス SQLウェアハウス : SQLウェアハウスを停止して再起動します。
ジョブ : 新しいジョブの実行がトリガーされるか、既存のジョブの実行が再開されると、ネットワークポリシーの変更が自動的に適用されます。
ノートブック :
- ノートブックがSparkと対話しない場合は、ネットワークポリシーを更新するために、サーバレスコンピュートを終了して再アタッチできます。
- ノートブックが Sparkと対話すると、サーバレスリソースが更新され、変更が自動的に検出されます。ほとんどの変更は 10 分で更新されますが、インターネットアクセスモードの切り替え、ドライ実行モードの更新、または適用の種類が異なるアタッチされたポリシー間の変更には、最大 24 時間かかる場合があります。これらの特定の種類の変更の更新を迅速化するには、関連付けられているすべてのノートブックとジョブをオフにします。

Databricks アセットバンドルの UI 依存関係

サーバーレスエグレス制御で制限付きアクセスモードを使用する場合、 Databricksアセットバンドル UI 機能は特定の外部ドメインにアクセスする必要があります。送信アクセスが完全に制限されている場合、ユーザーは Databricks アセットバンドルを操作するときにワークスペースインターフェイスにエラーが表示されることがあります。

Databricksアセットバンドルの UI 機能が制限されたネットワークポリシーで動作し続けるようにするには、ポリシー の許可されたドメイン に次のドメインを追加します。

github.com
objects.githubusercontent.com
release-assets.githubusercontent.com
checkpoint-api.hashicorp.com
releases.hashicorp.com
registry.terraform.io

ネットワークポリシーの適用を確認する

ネットワークポリシーが正しく適用されていることを確認するには、さまざまなサーバレスワークロードから制限されたリソースへのアクセスを試みます。

SQL エディタまたはノートブックでテストクエリを実行し、ネットワークポリシーによって制御されるリソースへのアクセスを試みます。
結果を確認します。
- 信頼できる宛先 : クエリは成功します。
- 信頼できない宛先 : クエリはネットワークアクセスエラーで失敗します。

モデルサービングで検証

モデルサービングを使用してネットワークポリシーを検証するには、次のようにします。

始める前に

モデルサービングエンドポイントが作成されると、モデルを提供するコンテナイメージが構築されます。ネットワークポリシーは、このビルドステージ中に適用されます。ネットワークポリシーでモデルサービングを使用する場合は、次の点を考慮してください。

依存関係アクセス: PyPI や conda-forge の Python パッケージ、ベースコンテナイメージ、モデルの環境やモデルの環境で必要な Docker コンテキストで指定された外部 URL のファイルなど、外部ビルドの依存関係は、ネットワークポリシーで許可する必要があります。
- たとえば、モデルでビルド中にダウンロードする必要がある特定のバージョンの scikit-learn が必要な場合、ネットワークポリシーでパッケージをホストしているリポジトリへのアクセスを許可する必要があります。
ビルドの失敗: ネットワークポリシーが必要な依存関係へのアクセスをブロックしている場合、モデルサービングコンテナのビルドは失敗します。これにより、サービスエンドポイントが正常にデプロイされなくなり、保存や正しく機能しなくなる可能性があります。
拒否のトラブルシューティング: ビルドフェーズ中のネットワークアクセス拒否はログに記録されます。これらのログには、値 ML Buildの network_source_type フィールドがあります。この情報は、ビルドを正常に完了するためにネットワークポリシーに追加する必要がある特定のブロックされたリソースを特定するために重要です。

ランタイム・ネットワーク・アクセスの検証

次の手順では、デプロイされたモデルのネットワークポリシーをランタイムで検証する方法、特に推論中に外部リソースにアクセスしようとする試みについて検証する方法を示します。これは、モデルサービングコンテナが正常にビルドされた、つまり、ビルド時の依存関係がネットワークポリシーで許可されていることを前提としています。

テストモデルの作成

Python ノートブックで、推論時にパブリックインターネットリソースへのアクセスを試みるモデル (ファイルのダウンロードや API 要求の作成など) を作成します。

このノートブックを実行して、テストワークスペースにモデルを生成します。例えば：

Python
import mlflow
import mlflow.pyfunc
import mlflow.sklearn
import requests

class DummyModel(mlflow.pyfunc.PythonModel):
    def load_context(self, context):
        # This method is called when the model is loaded by the serving environment.
        # No network access here in this example, but could be a place for it.
        pass

    def predict(self, _, model_input):
        # This method is called at inference time.
        first_row = model_input.iloc[0]
        try:
            # Attempting network access during prediction
            response = requests.get(first_row['host'])
        except requests.exceptions.RequestException as e:
            # Return the error details as text
            return f"Error: An error occurred - {e}"
        return [response.status_code]

with mlflow.start_run(run_name='internet-access-model'):
    wrappedModel = DummyModel()

    # When this model is deployed to a serving endpoint,
    # the environment will be built. If this environment
    # itself (e.g., specified conda_env or python_env)
    # requires packages from the internet, the build-time SEG policy applies.
    mlflow.pyfunc.log_model(
        artifact_path="internet_access_ml_model",
        python_model=wrappedModel,
        registered_model_name="internet-http-access"
    )

配信エンドポイントを作成する
1. ワークスペースのナビゲーションで、 [AI/ML] を選択します。
2. サービング タブをクリックします。
3. サービングエンドポイントの作成 をクリックします。
4. 次の設定でエンドポイントを構成します。
  - サービングエンドポイント名 : わかりやすい名前を指定します。
  - エンティティの詳細 : モデルレジストリモデル を選択します。
  - モデル : 前の手順で作成したモデルを選択します (internet-http-access)。
5. [確認] をクリックします。この段階で、モデルサービングコンテナのビルドプロセスが開始されます。 ML Buildのネットワークポリシーが適用されます。依存関係のネットワークアクセスがブロックされたためにビルドが失敗した場合、エンドポイントは準備完了になりません。
6. サービスエンドポイントが [準備完了 ] 状態に達するまで待ちます。準備完了にならない場合は、拒否ログで network_source_type: ML Build エントリを確認します。
エンドポイントをクエリします。
1. [サービスエンドポイント] ページの [クエリエンドポイント ] オプションを使用して、テスト要求を送信します。
  JSON
```
{ "dataframe_records": [{ "host": "[https://www.google.com](https://www.google.com)" }] }
```
実行時アクセスの結果を確認します。
- ランタイムでインターネットアクセスが有効 : クエリは成功し、 200のようなステータスコードを返します。
- ランタイムでのインターネットアクセス制限 : クエリは、モデルコード内の try-except ブロックからのエラーメッセージなど、接続タイムアウトまたはホスト解決エラーを示すネットワークアクセスエラーで失敗します。

ネットワークポリシーを更新する

ネットワークポリシーは、作成後いつでも更新できます。ネットワークポリシーを更新するには:

アカウントコンソールのネットワークポリシーの詳細ページで、ポリシーを変更します。
- ネットワークアクセスモードを変更します。
- 特定のサービスのドライ実行モードを有効または無効にします。
- FQDN またはストレージの宛先を追加または削除します。
更新をクリックします。
ネットワークポリシーの変更を適用する を参照して、更新プログラムが既存のワークロードに適用されることを確認します。

制限

アーティファクトのアップロードサイズ : MLflowの内部 Databricks Filesystem を dbfs:/databricks/mlflow-tracking/<experiment_id>/<run_id>/artifacts/<artifactPath> 形式で使用する場合、アーティファクトのアップロードは log_artifact、 log_artifacts、および log_model APIで5GBに制限されます。
モデルサービング : モデルサービングのイメージを構築する場合、エグレスコントロールは適用されません。
短時間のみ有効なガベージコレクション (GC) ワークロードのログ配信拒否 : 存続時間が 120 秒未満の短時間 GC ワークロードからのログ拒否ログは、ログの遅延によりノードが終了する前に配信されない場合があります。アクセスは引き続き適用されますが、対応するログエントリが欠落している可能性があります。
Databricks SQL ユーザー定義関数 (UDF) のネットワーク接続 : Databricks SQL でネットワークアクセスを有効にするには、Databricks アカウントチームにお問い合わせください。

必要条件​

ネットワークポリシーへのアクセス​

ネットワークポリシーを作成する​

ネットワークポリシーの設定​

エグレス ルールを設定する​

ポリシーの施行​

デフォルトポリシーを更新する​

ネットワークポリシーをワークスペースに関連付ける​

ネットワーク ポリシーの変更を適用する​

サーバレスワークロードの再起動または再デプロイ​

Databricks アセットバンドルの UI 依存関係​

ネットワーク ポリシーの適用を確認する​

モデルサービングで検証​

始める前に​

ランタイム・ネットワーク・アクセスの検証​

ネットワークポリシーを更新する​

制限​