Acessar dados compartilhados com você usando OpenSharing (para destinatários)
Esta página explica como acessar dados que foram compartilhados com você usando OpenSharing. O OpenSharing oferece suporte a dois modelos: o compartilhamento Databricks-to-Databricks, para usuários de workspace do Databricks com o Unity Catalog, e o compartilhamento Databricks-to-Open, para qualquer destinatário que use qualquer ferramenta.
OpenSharing e destinatários de dados
OpenSharing é um padrão aberto para o compartilhamento de dados. Um usuário do Databricks, referido como um provedor de dados neste contexto, pode usar o OpenSharing no Databricks para compartilhar dados com uma pessoa ou grupo fora de sua organização, chamado de destinatário de dados .
Compartilhamento Databricks-to-Databricks e compartilhamento Databricks-para-aberto
A forma como você acessa os dados depende de você ser um usuário Databricks e de o seu provedor de dados ter configurado os dados que estão sendo compartilhados com você para o compartilhamento Databricks-to-Databricks ou compartilhamento aberto .
No modelo Databricks-to-Databricks , é preciso ser um usuário em um workspace Databricks que esteja habilitado para Unity Catalog. Um membro da sua equipe fornece ao provedor de dados um identificador exclusivo para o seu metastore do Unity Catalog, e o provedor de dados o utiliza para criar uma conexão de compartilhamento segura. Os dados compartilhados ficam disponíveis para acesso no seu workspace. Se necessário, um membro da sua equipe configura o controle de acesso granular nesses dados.
No modelo de compartilhamento Databricks-para-Open, pode-se usar qualquer ferramenta de sua preferência (incluindo Databricks) para acessar os dados compartilhados. O provedor de dados envia-lhe uma URL de ativação ou um link de portal através de um canal seguro. Siga-o para fazer o download de um arquivo de credencial ou URL que permite acessar os dados compartilhados com você.
Os dados compartilhados não são fornecidos diretamente pela Databricks, mas por provedores de dados em execução na Databricks.
O Databricks pode coletar informações sobre o uso e acesso dos destinatários de dados aos dados compartilhados (incluindo a identificação de qualquer indivíduo ou empresa que acesse os dados usando o arquivo de credenciais em conexão com tais informações) e pode compartilhá-las com o provedor de dados aplicável.
Obter acesso aos dados compartilhados com você
Como você acessa os dados depende se o seu provedor de dados compartilhou dados com você usando o protocolo de compartilhamento Databricks-to-Open ou o protocolo de compartilhamento Databricks-to-Databricks. Consulte compartilhamento Databricks-para-Databricks e compartilhamento aberto.
Obtenha acesso no modelo Databricks-to-Databricks
No modelo Databricks-to-Databricks:
-
O provedor de dados envia ao senhor instruções para encontrar um identificador exclusivo para o metastore do Unity Catalog associado ao seu workspace Databricks, e o senhor o envia a eles.
O identificador de compartilhamento é uma string composta pela cloud do metastore, região e UUID (o identificador exclusivo para o metastore), no formato
<cloud>:<region>:<uuid>. Por exemplo,aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.Para obter o identificador de compartilhamento usando o Catalog Explorer:
-
No seu Databricks workspace, clique em
Catálogo .
-
No topo do painel Catálogo , clique no ícone de
engrenagem e selecione OpenSharing .
Alternativamente, no canto superior direito, clique em **Share > OpenSharing**.
-
Na tab **Compartilhado comigo**, selecione o nome da sua organização de compartilhamento do Databricks no canto superior direito e selecione **Copiar identificador de compartilhamento**.
Para obter o identificador de compartilhamento usando um Notebook ou uma consulta do Databricks SQL, use a função SQL default
CURRENT_METASTORE. Se você usar um Notebook, ele deverá ser executado em um modo de acesso padrão ou dedicado no workspace que você usará para acessar os dados compartilhados.SQLSELECT CURRENT_METASTORE(); -
-
O provedor de dados cria:
- Um destinatário em sua account do Databricks para representar você e os usuários em sua organização que acessarão os dados.
- Um compartilhamento , que é uma representação das tabelas, volumes e views a serem compartilhados com o senhor.
-
O usuário acessa os dados compartilhados com ele. É possível que a sua equipe ou um de seus membros possa, se necessário, configurar o acesso granular a esses dados para os seus usuários. Consulte Ler dados compartilhados usando o Databricks-to-Databricks OpenSharing (para destinatários).
Obter acesso no modelo de compartilhamento Databricks-to-Open
No modelo de compartilhamento Databricks para Aberto:
-
O provedor de dados cria:
- Um destinatário em sua account do Databricks para representar você e os usuários em sua organização que acessarão os dados.
- Um compartilhamento , que é uma representação das tabelas e partições a serem compartilhadas com você.
-
O provedor de dados envia a URL de ativação (por um canal seguro) ou uma URL de portal. O senhor o segue para baixar um arquivo de credenciais ou uma URL que permite acessar os dados compartilhados com o senhor.
Ambos os tokens do portador e as Credenciais do cliente OAuth são compatíveis.
Não compartilhe o link de ativação com ninguém. Você pode baixar um arquivo de credenciais apenas uma vez. Se você visitar o link de ativação novamente após o arquivo de credenciais já ter sido baixado, o botão Baixar Arquivo de Credenciais será desativado.
Se você perder o link de ativação antes de usá-lo, entre em contato com o provedor de dados. 3. Armazene o arquivo de credencial em um local seguro.
Não compartilhe o arquivo de credenciais com ninguém fora do grupo de usuários que devem ter acesso aos dados compartilhados. Se precisar compartilhá-lo com alguém em sua organização, a Databricks recomenda usar um gerenciador de senhas.
Ler os dados compartilhados
Como você lê os dados que foram compartilhados de forma segura com você usando o OpenSharing depende se você recebeu um arquivo de credencial (o modelo de compartilhamento Databricks-to-Open) ou se você está usando um workspace do Databricks e forneceu ao provedor de dados seu identificador de compartilhamento (o modelo Databricks-to-Databricks).
Se você receber um erro informando que um ativo de dados não existe ao tentar ler seus compartilhamentos, consulte Erro "ativo de dados não existe".
Ler dados compartilhados usando um arquivo de credenciais (compartilhamento Databricks-to-Open)
Caso dados tenham sido compartilhados com o senhor/a senhora utilizando o protocolo de compartilhamento OpenSharing Databricks-to-Open com tokens de portador, utilize o arquivo de credenciais baixado para autenticar na account do provedor de dados e ler os dados compartilhados. O acesso persiste enquanto o token subjacente for válido e o provedor continuar a compartilhar os dados. Provedores gerenciam a expiração e rotação de tokens. Tokens são válidos por, no máximo, um ano após a criação. As atualizações dos dados estão disponíveis em quase tempo real. É possível ler e fazer cópias dos dados compartilhados, mas não é possível modificar os dados de origem.
Para saber como acessar e ler dados compartilhados usando o arquivo de credenciais no Databricks, Apache Spark, Pandas e Power BI, consulte Ler dados compartilhados utilizando o OpenSharing Databricks-para-compartilhamento aberto com tokens de portador.
Ler dados compartilhados usando uma federação OIDC (Databricks para compartilhamento aberto)
Se os dados tiverem sido compartilhados com você usando o protocolo de compartilhamento OpenSharing Databricks-to-Open com federação OIDC, você usa a URL que foi enviada a você para autenticar-se na account do provedor de dados e ler os dados compartilhados. O acesso persiste enquanto o provedor continuar a compartilhar os dados. As atualizações dos dados estão disponíveis em quase tempo real. É possível ler e fazer cópias dos dados compartilhados, mas não é possível modificar os dados de origem.
Para saber como acessar e ler dados compartilhados usando o fluxo de federação de tokens OIDC no Tableau e Power BI, consulte Ler dados compartilhados usando a federação Open ID Connect (OIDC) em um fluxo U2M. Para saber como acessar e ler dados compartilhados usando o fluxo de federação de tokens OIDC em um aplicativo cliente Python, consulte Ler dados compartilhados usando a federação Open ID Connect (OIDC) em um fluxo M2M.
Ler dados compartilhados usando compartilhamento Databricks-to-Databricks
Se os dados foram compartilhados com você usando o modelo Databricks-to-Databricks, então nenhum arquivo de credenciais é necessário para acessar os dados compartilhados. A Databricks cuida da conexão segura, e os dados compartilhados são automaticamente detectáveis no seu workspace do Databricks.
Para aprender como encontrar, ler e gerenciar esses dados compartilhados em seu workspace Databricks, consulte Ler dados compartilhados utilizando o compartilhamento aberto Databricks-to-Databricks (para destinatários).
Auditar o uso de dados compartilhados
Se você tem acesso a um workspace do Databricks, você pode usar os logs de auditoria do Databricks para entender quem em sua organização está acessando quais dados usando o OpenSharing. Consulte Auditar e monitorar o compartilhamento de dados.