Crie um workspaceclássico
Este artigo descreve como criar e gerenciar o espaço de trabalho usando o console account. Como alternativa, o senhor pode criar um workspace usando a conta API ou Terraform.
Antes de começar
- Certifique-se de que o senhor entendeu todas as definições de configuração antes de criar um novo workspace. As configurações do espaço de trabalho não podem ser modificadas depois que o senhor criar o workspace.
- Você precisa ter algumas permissões do Google necessárias em sua account, que pode ser uma conta do Google ou uma accountde serviço. Consulte Permissões necessárias para a criação workspace.
- Certifique-se de que o workspace senhor tenha cotas suficientes de recursos do Google Cloud necessárias para o. Solicite um aumento de cota se precisar.
Preparar uma configuração de rede (opcional)
Se você deseja implantar seu workspace em uma VPCgerenciada pelo cliente, registre uma configuração de rede antes de criar o workspace:
- Analise todos os requisitos para gerenciar o cliente VPC.
- Crie sua VPC.
- registra sua configuração de rede, que representa seu VPC e suas sub-redes.
Criar um workspace
Para criar um workspace:
-
Databricks account Comolog in account administrador do , acesse o console e clique no ícone do espaço de trabalho.
-
Clique em Create workspace .
-
Na seção Noções básicas :
- No campo Nome do espaço de trabalho , insira um nome para este workspace. Somente caracteres alfanuméricos, sublinhados e hífenes são permitidos, e o nome deve ter de 3 a 30 caracteres.
- No dropdown Região , selecione uma região para a rede e clusters do seu workspace . Para obter informações sobre as regiões compatíveis, consulte clouds e regiõesDatabricks.
- No campo ID do projetoGCP , insira o ID do seu projeto do Google Cloud. Se você tiver um projeto, mas não souber o ID dele, acesse a página de gerenciamento de recursos do Google Cloud Platform , encontre seu projeto e copie o ID. Se você estiver implantado em uma VPC gerenciada pelo cliente, o ID dependerá se você está usando uma VPCindependente ou compartilhada:
- Para uma VPC autônoma, defina isso como o ID do projeto para sua VPC.
- Para um VPC compartilhado, defina isso como o ID do projeto para esse recurso do workspace.
-
Na dropdown Configuração de rede , selecione ou crie uma configuração de rede para o workspace. Por default, isso está definido como Databricks-gerenciar VPC.
-
(Opcional) Na seção Rede , configure as definições de rede:
- No campo CIDR da sub-rede (intervalo de IP) , insira opcionalmente um intervalo de IP de sub-rede personalizado. Os endereços IP devem estar no formato CIDR e dentro de:
10.0.0.0/8,100.64.0.0/10,172.16.0.0/12,192.168.0.0/16e240.0.0.0/4. Para orientações sobre dimensionamento, consulte Dimensionamento de sub-rede para um novo workspace. - Na dropdown Configuração de conectividade de rede , selecione uma configuração de conectividade de rede para ativar o Google Private Service Connect (PSC) ou crie uma diretamente no menu. Antes de configurar o PSC, consulte Ativar o serviço Connect privado para seu workspace para obter os requisitos.
- Na dropdown Configurações de acesso privado , selecione uma configuração de acesso privado para ativar o Google Private Service Connect (PSC) ou crie uma diretamente no menu. Antes de configurar o PSC, consulte Ativar o serviço Connect privado para seu workspace para obter os requisitos.
- No campo CIDR da sub-rede (intervalo de IP) , insira opcionalmente um intervalo de IP de sub-rede personalizado. Os endereços IP devem estar no formato CIDR e dentro de:
-
(Opcional) Na seção Avançado , você pode configurar quaisquer definições avançadas para seu workspace. Consulte Configurações avançadas.
-
Clique em Criar workspace . Você será redirecionado automaticamente para a página de detalhes workspace .
-
Se esta é a primeira vez que você criou um workspace, uma janela pop-up do Google solicitará que você selecione sua conta do Google account e concorde com a solicitação de escopos adicionais. Se a janela pop-up não aparecer e a página não mudar, você pode ter um bloqueador de pop-ups no seu navegador. Faça login com o mesmo e-mail do Google ( email ) utilizado para acessar Databricks.
-
Databricks redireciona você para a página de detalhes workspace . Confirme se o status do seu workspace é "Em execução" .
-
Prenda as caçambas do workspace's GCS. Consulte Proteger os workspace's GCS buckets em seu projeto.
Configurações avançadas
As seguintes configurações são opcionais ao criar um novo workspace. Para view essas configurações, clique no dropdown Avançado na página de criação workspace .
- Criptografia : Você pode adicionar uma chave de criptografia à sua implantação workspace para o gerenciamento de serviços e o armazenamento workspace . A key para o serviço gerenciado criptografa Notebooks, segredos e dados de consulta Databricks SQL no plano de controle. A key para o armazenamento workspace criptografa o bucket de armazenamento do seu workspace e os buckets GCS de recursos compute no plano compute clássico. Para obter mais orientações, consulte Configurar chave de gerenciamento do cliente para criptografia.
- Segurança e compliance : Essas caixas de seleção permitem ativar o perfil de segurança compliance , adicionar padrões compliance e habilitar o monitoramento de segurança aprimorado para seu workspace. Para obter mais informações, consulte Configurar definições de segurança e compliance aprimoradas.
Habilitando o Google APIs em um projeto workspace
Durante a criação do workspace, o Databricks ativa automaticamente os seguintes itens obrigatórios do Google APIs no projeto do Google Cloud, caso ainda não estejam ativados:
Esses APIs não são desativados automaticamente durante a exclusão do workspace.
limites de criação de espaço de trabalho
O senhor pode criar no máximo 200 espaços de trabalho por semana no mesmo projeto do Google Cloud. Se o senhor exceder esse limite, a criação de um workspace falhará com a mensagem de erro: "Criação de nuvem personalizada IAM role <your-role> no projeto <your-project> rejeitada".
Ver o status do site workspace
Depois de criar um workspace, você pode visualizar seu status na página Workspaces .
- Provisionamento : em andamento. Aguarde alguns minutos e atualize a página.
- Em execução : implantação bem-sucedida do workspace.
- Falha : falha na implantação.
- Banido : Entre em contato com a equipe Databricks account .
- Cancelamento : em processo de cancelamento.
Se o status do seu novo workspace for Failed (Falha ), clique em workspace para view uma mensagem de erro detalhada. Se o senhor não entender o erro, entre em contato com a equipe Databricks account .
O senhor não pode atualizar a configuração de um site com falha workspace. O senhor deve excluí-lo e criar um novo workspace.
Faça login no workspace
- Vá para o consoleaccount e clique no ícone do espaço de trabalho .
- Na linha com seu workspace, clique em Abrir .
Proteja os workspace's GCS buckets em seu projeto
Quando o senhor cria um workspace, Databricks on Google Cloud cria dois buckets Google Cloud Storage GCS no seu projeto GCP:
- Um bucket GCS armazena dados do sistema, como revisões de notebooks, detalhes de execução de trabalhos, resultados de comandos e Spark logs.
- Um bucket GCS é o armazenamento raiz do seu workspacepara o sistema de arquivosDatabricks (DBFS). Seu bucket DBFS root não se destina ao armazenamento de dados de produção do cliente. Criar outra fonte de dados e armazenamento para dados de produção do cliente em GCS buckets adicionais. Opcionalmente, o senhor pode montar os buckets adicionais do GCS como montagens do Databricks File System (DBFS). Consulte Conectar-se ao Google Cloud Storage.
Databricks Recomenda-se enfaticamente que o senhor proteja esses GCS baldes de modo que não possam ser acessados de fora Databricks on Google Cloud.
Para proteger esses buckets do GCS:
-
Em um navegador, acesse o GCP Cloud Console.
-
Selecione o projeto do Google Cloud que hospeda seu Databricks workspace.
-
Acesse a página do serviço de armazenamento desse projeto.
-
Procure os baldes para seu novo workspace. Seus nomes são:
databricks-<workspace id>databricks-<workspace id>-system
-
Para cada balde:
-
Clique no balde para acessar view detalhes.
-
Clique na guia Permissões .
-
Analise todas as entradas da lista de membros e determine se o acesso é esperado para cada membro.
-
Verifique a coluna Condição do IAM . Algumas permissões, como as denominadas "Databricks serviço account para workspace", têm IAM Condições que as restringem a determinados buckets. A interface do usuário do console do Google Cloud não avalia a condição, portanto, ela pode mostrar funções que na verdade não conseguiriam acessar o bucket.
Para funções sem nenhuma condição de IAM, considere adicionar restrições a elas:
-
Ao adicionar permissões de armazenamento no nível do projeto ou acima, use as condições do IAM para excluir os buckets do Databricks ou para permitir apenas buckets específicos.
-
Escolha o conjunto mínimo de permissões necessárias. Por exemplo, se somente o acesso de leitura for necessário, especifique Storage Viewer em vez de Storage Admin.
-
-
Não use funções básicas porque elas são muito amplas.
- Ative o registro de auditoria de acesso a dados do Google Cloud. A Databricks recomenda enfaticamente que o senhor ative o registro de auditoria do Data Access para os buckets do GCS que a Databricks cria. Isso permite uma investigação mais rápida de quaisquer problemas que possam surgir. Esteja ciente de que o registro de auditoria do Data Access pode aumentar os custos de uso do GCP. Para obter instruções, consulte Configuração dos logs de auditoria do Data Access.
Se o senhor tiver dúvidas sobre como proteger esses GCS buckets, entre em contato com a equipe Databricks account .
Próximas etapas
Agora que o senhor implantou o site workspace, pode começar a desenvolver sua estratégia de dados. A Databricks recomenda os seguintes artigos:
- Adicione usuários, grupos e entidades de serviço ao seu workspace. gerenciar usuários, entidades de serviço e grupos.
- Saiba mais sobre governança de dados e privilégios no Databricks. Consulte O que é o Unity Catalog?
- Conecte seu Databricks workspace à fonte de dados externa. Consulte Conectar à fonte de dados e ao serviço externo.
- Faça a ingestão de seus dados no site workspace. Consulte Conectores padrão em LakeFlow Connect.
- Aprenda a gerenciar o acesso a objetos do site workspace, como Notebook, compute, dashboards e consultas. Consulte Listas de controle de acesso.