Criar salas limpas
Prévia
Esse recurso está em Prévia Pública.
Este artigo descreve como criar uma sala limpa, um ambiente seguro e que protege a privacidade, onde várias partes podem trabalhar juntas em dados corporativos confidenciais sem acesso direto aos dados umas das outras.
Antes de começar
Os privilégios necessários para usar salas limpas variam de acordo com a tarefa:
Para criar uma sala limpa, o senhor deve ter o privilégio
CREATE CLEAN ROOM
ou ser um administrador de metastore. O criador é automaticamente atribuído como proprietário da sala limpa em seu metastore do Unity Catalog.Para iniciar a participação em uma sala limpa compartilhada com o senhor, é necessário ser um administrador de metastore.
Quando uma sala limpa é compartilhada, o administrador da metastore da organização colaboradora recebe automaticamente a propriedade da sala limpa. O administrador da metastore pode reatribuir a propriedade a um administrador que não seja da metastore. Como prática recomendada para a governança de dados, a Databricks recomenda que a propriedade seja atribuída a um grupo.
Se o site workspace não tiver um administrador de metastore atribuído, o senhor deverá atribuir a função. Consulte Atribuir um administrador de metastore e gerenciar a propriedade do objeto Unity Catalog .
Para adicionar e remover dados ativos e Notebook em uma sala limpa, o senhor deve ser o proprietário da sala limpa ou ter o privilégio
MODIFY CLEAN ROOM
na sala limpa. Além disso, o senhor e o proprietário da sala limpa (se não for o proprietário) devem terSELECT
nas mesas e vistas que adicionar eREAD VOLUME
nos volumes que adicionar.
Para saber mais sobre os requisitos de permissão para atualizar salas limpas e executar tarefas (Notebook) em salas limpas, consulte gerenciar salas limpas e executar Notebook em salas limpas.
O senhor pode criar até cinco salas limpas por metastore.
o passo 1. solicitar o identificador de compartilhamento do colaborador
Antes de poder criar uma sala limpa, o senhor deve ter o identificador de compartilhamento da sala limpa da organização com a qual vai colaborar. O identificador do compartilhamento é uma cadeia de caracteres que consiste no ID global da metastore da organização + ID workspace + nome de usuário do contato (endereçoemail ). O colaborador pode estar em qualquer cloud ou região.
Entre em contato com o colaborador para solicitar seu identificador de compartilhamento.
O colaborador pode obter o identificador de compartilhamento usando as instruções em Encontre seu identificador de compartilhamento.
o passo 2: Criar uma sala limpa
Para criar uma sala limpa, o senhor deve usar o Catalog Explorer.
No seu workspace do Databricks, clique em Catálogo.
Na página de acesso rápido, clique no botão Clean Rooms >.
Como alternativa, clique no ícone de engrenagem na parte superior do painel Catalog (Catálogo) e selecione Clean Rooms (Salas limpas).
Clique em Create Clean Room (Criar sala limpa).
Na página Create Clean Room (Criar sala limpa), digite um nome de fácil utilização para a sala limpa.
O nome não pode usar espaços, pontos ou barras (/).
O senhor não pode alterar o nome da sala limpa depois que ela for salva. Use um nome que o colaborador considere útil e descritivo.
Selecione o provedor cloud e a região onde a sala limpa central será criada.
O provedor cloud deve ser o mesmo que o seu workspace atual, mas a região não. Considere as políticas de residência de dados ou outras políticas de sua organização ao fazer sua seleção.
(Opcional) Adicione um comentário.
Digite o identificador de compartilhamento da Sala Limpa do colaborador.
Veja o passo 1. Solicitar o identificador de compartilhamento do colaborador.
Anote os nomes de catálogo atribuídos ao senhor (o criador) e ao colaborador.
Todos os dados ativos adicionados à sala limpa aparecerão nesse catálogo na sala limpa central e poderão ser referenciados usando esse catálogo no namespace de três níveis do site Unity Catalog (
<catalog>.<schema>.<table-etc>
).Selecione o tipo de política de acesso à rede. Isso não pode ser alterado após a criação da sala limpa.
Acesso total: acesso irrestrito à Internet de saída.
Acesso restrito: isso limita o acesso externo aos destinos da Internet que você especificar. Consulte Visão geral da política de rede e Gerenciamento de políticas de rede para controle de saída sem servidor.
Observação
O acesso restrito pode atrasar a disponibilidade do ativo por até dez minutos e não é compatível com os colaboradores da nuvem do Google.
Depois de criar a sala limpa, o senhor pode view a política de acesso à rede em Security tab.
Clique em Create Clean Room (Criar sala limpa).
o passo 3: Adicionar dados ativos e Notebook à sala limpa
Qualquer uma das partes da sala limpa (o criador e o colaborador) pode adicionar tabelas, volumes, visualizações e Notebook à sala limpa.
Permissões necessárias:
O senhor deve ser o proprietário ou ter o privilégio
MODIFY CLEAN ROOM
na sala limpa.O senhor e o proprietário da sala limpa (se não for o proprietário) devem ter
SELECT
em qualquer tabela ou view eREAD VOLUME
em qualquer volume que adicionar, juntamente comUSE CATALOG
eUSE SCHEMA
no catálogo e esquema pai.O proprietário da sala limpa deve manter esses privilégios durante toda a vida útil da sala limpa.
Observação
As instruções a seguir pressupõem que o senhor esteja retornando a uma sala limpa já criada para adicionar o ativo. Se o senhor acabou de criar uma sala limpa pela primeira vez, um assistente o orientará na adição de dados ativos e do Notebook. A interface de usuário real para adicionar esses ativos é a mesma, independentemente de o senhor ser orientado pelo assistente ou não.
Para adicionar ativo:
No seu workspace do Databricks, clique em Catálogo.
Na página de acesso rápido, clique no botão Clean Rooms >.
Como alternativa, clique no ícone de engrenagem na parte superior do painel Catalog (Catálogo) e selecione Clean Rooms (Salas limpas).
Localize e clique no nome da sala limpa que o senhor deseja atualizar.
Clique em + Add data ativo para adicionar tabelas, volumes ou visualizações.
Selecione o ativo de dados que deseja compartilhar e clique em Add data ativo.
Ao compartilhar uma tabela, um volume ou view, o senhor pode, opcionalmente, adicionar um alias. O nome alternativo será o único nome visível na sala limpa.
Ao compartilhar uma tabela, o senhor pode, opcionalmente, adicionar cláusulas de partição que lhe permitem compartilhar apenas parte da tabela. Para obter detalhes sobre como usar partições para limitar o que o senhor compartilha, consulte Especificar partições de tabela para compartilhar.
Para adicionar o Notebook, clique no botão + Add Notebook e procure o Notebook que deseja adicionar.
Opcionalmente, o senhor pode dar ao Notebook um nome alternativoNotebook.
Notebook que você compartilha em salas limpas consulta de dados e execução de dados análise de cargas de trabalho nas tabelas, visualizações e volumes que você e o outro colaborador adicionaram à sala limpa.
O Notebook funciona com base no princípio da aprovação implícita: o senhor não pode executar o Notebook que criou. O senhor cria o Notebook que o seu colaborador usa e o seu colaborador cria o Notebook que o senhor usa.
Se o senhor compartilhar um Notebook que inclua resultados, esses resultados serão compartilhados com o seu colaborador.
O senhor pode usar um Notebook para criar tabelas de saída que são temporariamente compartilhadas com o metastore do seu colaborador quando ele executa o Notebook. Consulte Criar e trabalhar com tabelas de saída em Databricks Clean Rooms.
Importante
Todas as referências do Notebook a tabelas, visualizações ou volumes que foram adicionados à sala limpa devem usar o nome de catálogo atribuído quando a sala limpa foi criada ("creator" para dados ativos adicionados pelo criador da sala limpa e "collaborator" para dados ativos adicionados pelo colaborador convidado). Por exemplo, uma tabela adicionada pelo criador pode ser chamada de
creator.sales.california
.Da mesma forma, verifique se o Notebook usa todos os aliases atribuídos a esse ativo de dados na sala limpa.