メインコンテンツまでスキップ

Netskope Logsからデータを取り込みます。

備考

ベータ版

この機能はベータ版です。ワークスペース管理者は、 プレビュー ページからこの機能へのアクセスを制御できます。Databricksのプレビューを管理するを参照してください。

このページでは、Lakeflow Connect を使用して管理された Netskope Logs インジェストパイプラインを作成する方法を示します。

要件

  • 取り込みパイプラインを作成するには、まず、次の要件を満たす必要があります。

    • ワークスペースでUnity Catalogが有効になっている必要があります。

    • サーバレス コンピュートがワークスペースで有効になっている必要があります。サーバレス コンピュートの要件を参照してください。

    • 新しい接続を作成する予定がある場合は、メタストアに対する CREATE CONNECTION 特権が必要です。Unity Catalog での特権の管理を参照してください。

      コネクタが UI ベースのパイプライン オーサリングをサポートしている場合、管理者はこのページのステップを完了することで、接続とパイプラインを同時に作成できます。 ただし、パイプラインを作成するユーザーが API ベースのパイプライン オーサリングを使用している場合、または管理者以外のユーザーである場合、管理者はまずカタログ エクスプローラーで接続を作成する必要があります。 「管理対象取り込みソースへの接続」を参照してください。

    • 既存の接続を使用する場合:接続オブジェクトに対してUSE CONNECTIONまたはALL PRIVILEGESの権限が必要です。

    • ターゲットカタログに対するUSE CATALOG権限が必要です。

    • 既存のスキーマに対するUSE SCHEMAおよびCREATE TABLE権限、またはターゲットカタログに対するCREATE SCHEMA権限を持っている必要があります。

  • Netskopeから取り込むには、まずDatabricksからの認証を構成し、接続を作成する必要があります。Netskopeへの認証を構成する、およびNetskopeログ接続を作成するを参照してください。

取り込みパイプラインを作成

サポートされているソーステーブルの一覧については、「サポートされているソーステーブル」を参照してください。

  1. Databricksワークスペースのサイドバーで、 データ取り込み をクリックします。
  2. **[データの追加]**ページで、**[Databricks コネクタ]**の下にある**[Netskope Logs]**をクリックします。
  3. 取り込みウィザードの 接続 ページで、Netskope認証情報を格納する接続を選択します。メタストアに対するCREATE CONNECTION特権をお持ちの場合は、 プラスアイコン。 接続の作成 をクリックして、Netskopeへの認証を構成するからの認証情報で接続を作成できます。
  4. 次へ をクリックします。
  5. 「Ingestion setup」ページで、パイプラインの名前を入力します。
  6. イベントログを書き込むカタログとスキーマを選択してください。スキーマを作成するには、カタログに対する USE CATALOG 権限と CREATE SCHEMA 権限をお持ちの場合、ドロップダウンメニューの プラスアイコン。 スキーマの作成 をクリックできます。
  7. パイプラインの作成および続行 をクリックします。
  8. **ソース**ページで、取り込むテーブルを選択します。
  9. 保存して続行 をクリックします。
  10. 宛先 ページで、データを取り込むカタログとスキーマを選択します。スキーマを作成するには、カタログに対する USE CATALOG 権限と CREATE SCHEMA 権限をお持ちの場合、ドロップダウンメニューの プラスアイコン。 スキーマの作成 をクリックできます。
  11. 保存して続行 をクリックします。
  12. (オプション) スケジュールと通知 ページで、 プラスアイコン。 スケジュールを作成 をクリックします。宛先テーブルを更新する頻度を設定します。
  13. (オプション)「 プラスアイコン。 **通知を追加**」をクリックして、パイプラインの操作が成功または失敗した場合のEメール通知を設定します。
  14. パイプラインの保存と実行 をクリックします。

Netskope Logsコネクタは、defaultソーススキーマでイベントテーブルとアラートテーブルを利用可能にします。詳しくは、サポートされているソース テーブルをご覧ください。必要なテーブルを取り込みます。

取り込むテーブルを指定する

このオプションを使用して、特定のテーブルのサブセットを取り込むか、テーブルごとに宛先名をカスタマイズします。

YAML
resources:
pipelines:
netskope_logs_pipeline:
name: netskope_logs_pipeline
catalog: 'main'
target: 'netskope_logs_data'
ingestion_definition:
connection_name: netskope_logs_connection
objects:
- table:
source_schema: 'default'
source_table: 'audit'
destination_catalog: 'main'
destination_schema: 'netskope_logs_data'
destination_table: 'audit'
- table:
source_schema: 'default'
source_table: 'alert_dlp'
destination_catalog: 'main'
destination_schema: 'netskope_logs_data'
destination_table: 'alert_dlp'

宣言型オートメーションバンドル ジョブ定義ファイル

以下は、宣言型オートメーションバンドルで使用するジョブ定義ファイルの例です。ジョブは毎日実行されます。

YAML
resources:
jobs:
netskope_logs_job:
name: netskope_logs_job
schedule:
quartz_cron_expression: '0 0 0 * * ?'
timezone_id: 'UTC'
tasks:
- task_key: netskope_logs_ingestion
pipeline_task:
pipeline_id: ${resources.pipelines.netskope_logs_pipeline.id}

一般的なパターン

高度なパイプライン構成については、「マネージド取り込みパイプラインの一般的なパターン」を参照してください。

次のステップ

パイプラインの開始、スケジュール、アラートを設定する共通パイプラインメンテナンス タスクを参照してください。

その他のリソース