メインコンテンツまでスキップ

カスタム分類器

備考

ベータ版

この機能はベータ版です。ワークスペース管理者は、 プレビュー ページからこの機能へのアクセスを制御できます。Databricksのプレビューを管理するを参照してください。

このページでは、Unity Catalog で Databricks データ分類用のカスタム分類子を作成および管理する方法について説明します。カスタム分類器は、組み込みの分類システムを拡張し、社内従業員ID、独自の製品コード、ベンダー識別子、パートナーアカウント番号など、組織固有の機密データを検出できるようにします。

カスタム分類子を作成するには、管理タグを選択し、そのクラスの代表的な値を含むサンプル列を指定します。 データ分類は、定期的なスキャン中にこのクラスを検出します。

カスタム分類器を使用すると、次のことが可能になります。

  • 組織固有データのタグ : 従業員 ID、パートナー コード、内部アカウント番号など、組織に固有のデータ タイプの自動タグを検出して構成します。
  • ガバナンス制御を拡張する :機密データにABAC列レベルマスクを適用する。
注記

カスタム分類器の設定と、Databricksがサンプル列から生成する検出メタデータは、保存時に暗号化されます。システムカタログ上で顧客管理キー(CMK)を使用して暗号化キーを管理できます。システムカタログにCMKを設定すると、カスタム分類子データだけでなく、システムカタログ内のすべてのデータが暗号化されます。

カタログエクスプローラーで、システムカタログ上に顧客管理キーを設定します。

要件

  • メタストア内の少なくとも1つのカタログで、データ分類を有効にする必要があります。データ分類の使用を参照してください。
  • ワークスペースでは、サーバレスコンピュートが利用可能である必要があります (ワークスペースでUnity Catalog使用することで有効になります)。
  • カスタム分類子を作成、編集、または削除するには、メタストア管理者である必要があります。
  • カスタム分類子を作成または編集するには、分類子が使用する管理タグに対するASSIGN権限が必要です。 「管理タグの権限の管理」を参照してください。
  • 分類子の列を選択するには、その列を含むテーブルにSELECT存在する必要があります。

カスタム分類器を作成する

  1. データ分類結果ページから、 「カスタム分類器の管理」 をクリックします。

    データ分類結果ページにある「カスタム分類器の管理」ボタン。

  2. カスタム分類子の管理 サイドパネルで、 [カスタム分類子の作成]を クリックします。

  3. タグを選択してください 。既存の管理タグを選択するか、 [新しいタグの作成] をクリックしてインラインで管理タグ を定義します。 タグに許可された値がある場合は、検出したい特定の値を選択してください。

    カスタム分類子の作成ウィザード ステップ 1: 管理タグを選択します。

  4. 例として列を選択してください 。カタログツリーを参照し、そのクラスの代表的な値を含む列を選択してください。検出したい事象の典型的な値を持つ列を選択してください。より広範で多様な例を用いることで、より正確な検出ルールを作成できます。

    カスタム分類子の作成ウィザード ステップ 2: サンプル列を選択します。

  5. 作成 をクリックします。

カスタム分類器による検出結果は、通常数時間以内に結果ページに表示されます。

注記

カスタム分類子は、メタストア内でデータ分類が有効になっている すべての カタログに適用されます。カタログ単位またはスキーマ単位のスコープ設定はサポートされていません。

カスタム分類器を管理する

「カスタム分類子の管理」 サイドパネルには、メタストア用に設定されているすべてのカスタム分類子が表示されます。このパネルから、タグ名で検索したり、既存の分類器の例となる列を編集したり、分類器を削除したりできます。

カスタム分類器のリストは、「カスタム分類器の管理」サイドパネルに表示されます。

カスタム分類器を編集する

既存のカスタム分類器のサンプル列を更新するには:

  1. 「カスタム分類子の管理」 サイドパネルで、編集したいカスタム分類子を選択します。
  2. サンプル列リストの横にある 「編集」 をクリックします。
  3. 列を追加または削除します。例の列数制限は引き続き適用されます。
  4. 保存 をクリックします。

アップデートは数時間以内に反映されます。以前の設定で検出された項目はそのまま残ります。

カスタム分類子を作成した後は、管理タグとタグ値を変更することはできません。 別のタグに切り替えるには、カスタム分類子を削除して新しいものを作成してください。

カスタム分類器を削除する

  1. 「カスタム分類子の管理」 サイドパネルで、削除するカスタム分類子を選択します。
  2. 削除 をクリックします。
  3. 削除を確認してください。
  4. 分類器が 「カスタム分類器の管理」 サイドパネルから削除されていることを確認してください。

カスタム分類器を削除する場合:

  • その分類器では、新たな検出結果は生成されません。
  • 既存の検出結果は、データ分類結果ページから削除されます。
  • 既に列に自動適用されたタグは、自動的には削除されません。

一時停止中のカスタム分類器

ルール生成または検証が失敗した場合、Databricks はカスタム分類器を一時停止し、データ分類結果ページに警告を表示します。一時停止中のカスタム分類器は、新たな検出結果を生成しません。

1つ以上のカスタム分類器が一時停止されていることを示す警告です。

停止状態を解消するには、カスタム分類器を編集し、アクセスできない、または十分な代表性を持たないサンプル列を置き換えてください。管理タグまたはタグ値が有効でなくなった場合は、カスタム分類子を削除し、有効なタグを使用して新しい分類子を作成します。

カスタム分類器の検出結果を表示する

カスタム分類子の検出を表示するには、組み込み分類の場合と同じステップに従います。 分類結果の表示を参照してください。

制限事項

  • メタストアごとに最大50個のカスタム分類子を作成できます。
  • 各カスタム分類器は、分類に必要な十分なデータを提供するために、1~10個のサンプル列を参照する必要があります。
  • 管理タグの命名にはタグポリシールールが適用されます。
  • カスタム分類子は、メタストア内のデータ分類が有効になっているすべてのカタログに適用されます。カタログ単位またはスキーマ単位のスコープ設定はサポートされていません。
  • カスタム分類器で使用される管理タグは、作成後に変更することはできません。別のタグを使用するには、カスタム分類子を削除して再作成してください。
  • 新規および更新されたカスタム分類器は、以降のデータ分類スキャンにのみ適用されます。既存のスキャン結果は自動的に再分類されないため、以前にスキャンされたデータの検出結果は、次のスキャンが完了した後に表示されます。
  • すべてのデータ分類の制限事項は、サポートされているテーブルタイプを含め、カスタム分類器にも適用されます。制限事項を参照してください。

トラブルシューティング

以下のトピックは、カスタム分類器に関する一般的な問題のトラブルシューティングに役立ちます。

カスタム分類器が停止されました

一般的な原因としては、以下のようなものがあります。

  • 1つ以上の例となる列は、分類器が作成されてから削除または名前が変更されたテーブルを参照しています。
  • 例として挙げた列は、システムが安定した検出方法を学習するには十分な代表性を備えていません。
  • 管理タグが管理タグでなくなったか、タグ値が無効になりました。

解決するには、カスタム分類器を別のサンプル列セットで編集し、次のスキャンを待ってください。無効な管理タグまたはタグ値が原因で停止が発生した場合は、カスタム分類子を削除し、有効なタグを使用して新しいカスタム分類子を作成してください。

カスタム分類子の作成または一覧表示時に権限が拒否されました

メタストア管理者である必要があります。カスタム分類子を作成または編集するには、管理タグに対するASSIGN権限がさらに必要です。 要件を参照してください。

サンプル列を選択できません

その列を含むテーブルにはSELECTが必要です。テーブルにSELECTが存在しない場合は、テーブルの所有者に許可を求めるか、別の例となる列を選択してください。

関連している