Passo 1: Configurar o armazenamento logs de auditoria
Este artigo explica como configurar um bucket de armazenamento AWS S3 para entrega de baixa latência de logs de auditoria.
Criar o balde S3
logs no Console AWS como um usuário com privilégios de administrador e acessa o serviço S3 .
Clique no botão Criar bucket .
Em Bucket name, insira um nome para seu bucket. Para obter mais orientações sobre nomenclatura de buckets, consulte as regras de nomenclatura de buckets da AWS.
Clique em Criar intervalo.
Criar um registro de configuração de armazenamento Databricks
Em seguida, você precisa criar um registro de configuração de armazenamento do Databricks que represente seu novo bucket S3.
Especifique seu bucket S3 chamando a API de criação de nova configuração de armazenamento.
Passe os seguintes valores:
storage_configuration_name
: Novo nome de configuração de armazenamento exclusivo.root_bucket_info
: um objeto JSON que contém um campobucket_name
que contém o nome do seu bucket S3.
Por exemplo:
curl -X POST
'https://accounts.cloud.databricks.com/api/2.0/accounts/<databricks-account-id>/storage-configurations' \
--header 'Authorization: Bearer $OAUTH_TOKEN' \
-d '{
"storage_configuration_name": "databricks-workspace-storageconf-v1",
"root_bucket_info": {
"bucket_name": "my-company-example-bucket"
}
}'
Resposta:
{
"storage_configuration_id": "<databricks-storage-config-id>",
"account_id": "<databricks-account-id>",
"root_bucket_info": {
"bucket_name": "my-company-example-bucket"
},
"storage_configuration_name": "databricks-workspace-storageconf-v1",
"creation_time": 1579754875555
}
Copie o valor storage_configuration_id
retornado no corpo da resposta. Você precisará dele ao chamar a API de entrega logs .
Próximos passos
Em seguida, configure uma IAM role e crie uma credencial no Databricks. Consulte a Passo 2: Configurar credenciais para entrega logs de auditoria.