Acesse dados compartilhados com você usando Delta compartilhamento (para destinatários)

Este artigo mostra como acessar os dados que foram compartilhados com você usando o Delta compartilhamento.

Delta compartilhamento e destinatários de dados

Delta Sharing é um padrão aberto para compartilhamento seguro de dados. Um usuário do Databricks, chamado de provedor de dados, pode usar o Delta compartilhamento para compartilhar dados com uma pessoa ou grupo fora de sua organização, chamado de destinatário de dados.

Compartilhamento de Databricks para Databricks e compartilhamento aberto

Como você acessa os dados depende se você é um usuário do Databricks e se o seu provedor de dados configurou ou não os dados que estão sendo compartilhados com você para compartilhamento de Databricks para Databricks ou compartilhamento aberto.

No modelo Databricks-to-Databricks, o senhor deve ser um usuário em um Databricks workspace que esteja habilitado para Unity Catalog. Um membro da sua equipe fornece ao provedor de dados um identificador exclusivo para o metastore do Unity Catalog, e o provedor de dados o utiliza para criar uma conexão de compartilhamento segura. Os dados compartilhados ficam disponíveis para acesso em seu site workspace. Se necessário, um membro da sua equipe configura o controle de acesso granular a esses dados.

No modelo de compartilhamento aberto, você pode usar qualquer ferramenta que desejar (incluindo Databricks) para acessar os dados compartilhados. O provedor de dados envia a você um URL de ativação por meio de um canal seguro. Você o segue para downloads um arquivo de credencial que permite acessar os dados compartilhados com você.

Termos de uso

Os dados compartilhados não são fornecidos diretamente pelo Databricks, mas por provedores de dados em execução no Databricks.

Observação

Ao acessar os dados compartilhados de um provedor de dados como destinatário de dados, o destinatário de dados declara que foi autorizado a acessar os compartilhamentos de dados fornecidos a ele pelo provedor de dados e reconhece que (1) Databricks não tem responsabilidade por tais dados ou dados uso do destinatário de tais dados compartilhados, e (2) Databricks pode coletar informações sobre o uso do destinatário de dados e acesso aos dados compartilhados (incluindo a identificação de qualquer indivíduo ou empresa que acessa o uso de dados do arquivo de credencial em conexão com tal informação) e pode compartilhá-lo com o provedor de dados aplicável.

Tenha acesso aos dados compartilhados com você

A forma como você acessa os dados depende se o seu provedor de dados compartilhou dados com você usando o protocolo de compartilhamento aberto ou o protocolo de compartilhamento Databricks-to-Databricks. Consulte Compartilhamento de Databricks para Databricks e compartilhamento aberto.

Obtenha acesso no modelo Databricks-to-Databricks

No modelo Databricks-to-Databricks:

  1. O provedor de dados envia instruções para encontrar um identificador exclusivo para o metastore Unity Catalog associado ao seu workspace Databricks e você o envia a eles.

    O identificador de compartilhamento é uma strings que consiste na cloud, região e UUID do metastore (o identificador exclusivo do metastore), no formato <cloud>:<region>:<uuid>. Por exemplo, aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.

    Para obter o identificador de compartilhamento usando o Catalog Explorer:

    1. No seu workspace do Databricks, clique em Ícone de catálogo Catálogo.

    2. No painel esquerdo, expanda o menu Delta compartilhamento e selecione Compartilhado comigo.

    3. acima da tab Provedores , clique no ícone Cópia do identificador de compartilhamento .

    Para obter o identificador de compartilhamento usando uma Notebook ou do Databricks SQL query Databricks, use a default função SQL CURRENT_METASTORE. Se você usar um Notebook, ele deverá ser executado em clusterscompartilhados ou de usuário único no workspace que você usará para acessar os dados compartilhados.

    SELECT CURRENT_METASTORE();
    
  2. O provedor de dados cria:

    • Um destinatário em sua account do Databricks para representar você e os usuários em sua organização que acessarão os dados.

    • Um share, que é uma representação das tabelas, volumes e view a serem compartilhadas com você.

  3. Você acessa os dados compartilhados com você. Você ou alguém da sua equipe pode, se necessário, configurar o acesso granular aos dados desses dados para seus usuários. Consulte Ler dados compartilhados usando o compartilhamento Delta do Databricks-to-Databricks (para destinatários).

Obtenha acesso no modelo de compartilhamento aberto

No modelo de compartilhamento aberto:

  1. O provedor de dados cria:

    • Um destinatário em sua account do Databricks para representar você e os usuários em sua organização que acessarão os dados. Um arquivo tokens e credenciais é gerado como parte dessa configuração.

    • Um share, que é uma representação das tabelas e partições a serem compartilhadas com você.

  2. O provedor de dados envia a você um URL de ativação por meio de um canal seguro. Você o segue para downloads um arquivo de credencial que permite acessar os dados compartilhados com você.

    Importante

    Não compartilhe o link de ativação com ninguém. Você pode downloads um arquivo de credencial apenas uma vez. Se você visitar o link de ativação novamente após o downloads do arquivo de credencial, o botão downloads do arquivo de credencial será desativado.

    Se você perder o link de ativação antes de usá-lo, entre em contato com o provedor de dados.

  3. Armazene o arquivo de credencial em um local seguro.

    Não compartilhe o arquivo de credencial com ninguém fora do grupo de usuários que devem ter acesso aos dados compartilhados. Se você precisar compartilhá-lo com alguém em sua organização, o Databricks recomenda o uso de um gerenciador de senhas.

Leia os dados compartilhados

A forma como você lê os dados que foram compartilhados com segurança com você usando Delta Sharing depende se você recebeu um arquivo de credencial (o modelo de compartilhamento aberto) ou se está usando um workspace do Databricks e forneceu ao provedor de dados seu identificador de compartilhamento (o Databricks-to -Modelo Databricks).

Ler uso compartilhado de dados um arquivo de credencial (compartilhamento aberto)

Se os dados foram compartilhados com você usando o protocolo de compartilhamento aberto Delta Sharing, você usa o arquivo de credencial baixado para autenticar a account Databricks do provedor de dados e ler os dados compartilhados. O acesso persiste enquanto os tokens subjacentes forem válidos e o provedor continuar a compartilhar os dados. Provedores gerenciam expiração e rotação de tokens. As atualizações dos dados estão disponíveis para você quase em tempo real. Você pode ler e fazer cópias dos dados compartilhados, mas não pode modificar os dados de origem.

Para saber como acessar e ler o arquivo de credenciais compartilhado no Databricks, Apache Spark, pandas e Power BI, consulte Ler dados compartilhados usando Delta compartilhamento open compartilhamento (para destinatários).

Leia o uso compartilhado de dados Compartilhamento Databricks-to-Databricks

Se os dados foram compartilhados com você usando o modelo Databricks-to-Databricks, nenhum arquivo de credencial é necessário para acessar os dados compartilhados. O Databricks cuida da conexão segura e os dados compartilhados podem ser descobertos automaticamente em seu workspace do Databricks.

Para saber como encontrar, ler e gerenciar esses dados compartilhados em seu workspace do Databricks, consulte Ler dados compartilhados usando o compartilhamento Delta Databricks-to-Databricks (para destinatários).

Auditar o uso de dados compartilhados

Se o senhor tiver acesso a um Databricks workspace, poderá usar os logs de auditoria do Databricks para entender quem em sua organização está acessando qual uso de dados Delta Sharing. Consulte Auditar e monitorar o compartilhamento de dados.