Passo 1: Configurar o armazenamento logs de auditoria

Este artigo explica como configurar um bucket de armazenamento AWS S3 para entrega de baixa latência de logs de auditoria.

Criar o balde S3

  1. logs no Console AWS como um usuário com privilégios de administrador e acessa o serviço S3 .

  2. Clique no botão Criar bucket .

  3. Em Bucket name, insira um nome para seu bucket. Para obter mais orientações sobre nomenclatura de buckets, consulte as regras de nomenclatura de buckets da AWS.

  4. Clique em Criar intervalo.

Criar um registro de configuração de armazenamento Databricks

Em seguida, você precisa criar um registro de configuração de armazenamento do Databricks que represente seu novo bucket S3.

Especifique seu bucket S3 chamando a API de criação de nova configuração de armazenamento.

Passe os seguintes valores:

  • storage_configuration_name: Novo nome de configuração de armazenamento exclusivo.

  • root_bucket_info: um objeto JSON que contém um campo bucket_name que contém o nome do seu bucket S3.

Por exemplo:

curl -X POST
    'https://accounts.cloud.databricks.com/api/2.0/accounts/<databricks-account-id>/storage-configurations' \
  --header 'Authorization: Bearer $OAUTH_TOKEN'  \
  -d '{
    "storage_configuration_name": "databricks-workspace-storageconf-v1",
    "root_bucket_info": {
      "bucket_name": "my-company-example-bucket"
    }
  }'

Resposta:

{
  "storage_configuration_id": "<databricks-storage-config-id>",
  "account_id": "<databricks-account-id>",
  "root_bucket_info": {
    "bucket_name": "my-company-example-bucket"
  },
  "storage_configuration_name": "databricks-workspace-storageconf-v1",
  "creation_time": 1579754875555
}

Copie o valor storage_configuration_id retornado no corpo da resposta. Você precisará dele ao chamar a API de entrega logs .

Próximos passos

Em seguida, configure uma IAM role e crie uma credencial no Databricks. Consulte a Passo 2: Configurar credenciais para entrega logs de auditoria.