Etapa 1: Configurar a auditoria log storage
Este artigo explica como configurar um bucket de armazenamento AWS S3 para entrega de baixa latência de auditoria logs.
Os exemplos de código nestas instruções pressupõem que o senhor esteja chamando a API da Databricks usando a CLI da Databricks. Para obter mais informações sobre o uso do Databricks CLI, consulte O que é o Databricks CLI?
Criar o bucket S3
- Faça login no console AWS como usuário com privilégios de administrador e acesse o serviço S3 .
- Clique no botão Criar bucket .
- Em Nome do bucket , insira um nome para seu bucket. Para obter mais orientações sobre a nomenclatura de buckets, consulte as regras de nomenclatura de buckets da AWS.
- Clique em Criar bucket .
Criar um registro de configuração de armazenamento do Databricks
Em seguida, é necessário criar um registro de configuração de armazenamento do Databricks que represente seu novo bucket S3.
Especifique seu bucket S3 usando o comando account storage create
CLI ou a API de configuração de armazenamento.
O comando CLI a seguir cria a configuração de armazenamento:
databricks account storage create METASTORE_ID --json `{
"storage_configuration_name": "databricks-workspace-storageconf-v1",
"root_bucket_info": {
"bucket_name": "my-company-example-bucket"
}
}`
storage_configuration_name
: Novo nome exclusivo de configuração de armazenamento.root_bucket_info
: Um objeto JSON que contém um campobucket_name
que contém seu nome do bucket S3.
Resposta:
{
"account_id": "<databricks-account-id>",
"creation_time": 12345678,
"root_bucket_info": {
"bucket_name": "my-company-example-bucket"
},
"storage_configuration_id": "<storage_configuration_id>",
"storage_configuration_name": "databricks-workspace-storageconf-v1"
}
Copie o valor storage_configuration_id
retornado no corpo da resposta. O senhor precisará dele quando ligar para o log delivery API.
Próximas etapas
Em seguida, configure um IAM role e crie uma credencial em Databricks. Consulte Etapa 2: Configurar credenciais para auditoria log delivery.