Ler dados compartilhados usando Databricks-to-Databricks Compartilhamento Aberto (para destinatários)

Esta página descreve como ler dados compartilhados com você usando o protocolo OpenSharing Databricks-to-Databricks , onde o Databricks gerencia uma conexão segura para o compartilhamento de dados. Ao contrário do protocolo OpenSharing de *compartilhamento aberto*, o protocolo Databricks-to-Databricks não exige um arquivo de credenciais (segurança baseada em tokens).

O compartilhamento Databricks-to-Databricks exige que você, como destinatário, atenda a *ambos* os requisitos a seguir:

Você tem acesso a um workspace do Databricks que está habilitado para o Unity Catalog.
O provedor está usando o protocolo OpenSharing Databricks-to-Databricks , não o protocolo de compartilhamento Databricks-to-Open, que fornece um arquivo de credencial.

Se o provedor estiver utilizando o compartilhamento aberto (que fornece um arquivo de credencial), mas houver um Workspace habilitado para Unity Catalog, é possível importar o provedor e ler os dados compartilhados no Databricks. Consulte Importar um provedor e ler dados compartilhados no Databricks. Se não houver um Workspace habilitado para Unity Catalog, consulte Ler dados compartilhados com tokens portadores.

Como torno os dados compartilhados disponíveis para minha equipe?

Para ler dados e notebooks que foram compartilhados com você usando o protocolo Databricks-to-Databricks, você deve ser um usuário em um workspace do Databricks habilitado para Unity Catalog. Um membro de sua equipe fornece ao provedor de dados um identificador exclusivo para seu metastore do Unity Catalog, e o provedor de dados usa esse identificador para criar uma conexão de compartilhamento segura com sua organização. Os dados compartilhados ficam então disponíveis para acesso de leitura em seu workspace. As atualizações que o provedor de dados faz nas tabelas, views, volumes e partições compartilhadas são refletidas em seu workspace quase em tempo real.

nota

Alterações de coluna, como adição, renomeação ou exclusão, podem não aparecer no Catalog Explorer por até um minuto. Da mesma forma, novos compartilhamentos e atualizações de compartilhamentos, incluindo a adição de novas tabelas, são armazenados em cache por um minuto antes de estarem disponíveis para visualização e consulta.

nota

As tabelas em information_schema de um catálogo compartilhado refletem os metadados armazenados no Unity Catalog. Esses metadados são atualizados do provedor somente quando você consulta a tabela compartilhada diretamente ou executa um comando como DESCRIBE ou REFRESH FOREIGN. Até então, information_schema pode parecer desatualizado em comparação com os dados do provedor.

Para ler dados que foram compartilhados:

Um usuário da sua equipe localiza o compartilhamento —o contêiner para as tabelas, views, volumes e Notebooks que foram compartilhados com você—e usa esse compartilhamento para criar um catálogo —o contêiner de nível superior para todos os dados no Databricks Unity Catalog.
Um usuário da sua equipe concede ou nega acesso ao catálogo e aos objetos dentro do catálogo (esquemas, tabelas, views e volumes) aos membros da sua equipe.
Você lê os dados nas tabelas, visualizações e volumes aos quais você recebeu acesso, como qualquer ativo de dados no Databricks ao qual você tem acesso somente leitura (SELECT ou READ VOLUME).
Você pode visualizar e clonar notebooks no compartilhamento, desde que tenha o privilégio USE CATALOG no catálogo.

Permissões necessárias

Para poder listar e ver detalhes sobre todos os provedores e compartilhamentos de provedores, você deve ter o privilégio USE PROVIDER. Outros usuários têm acesso apenas aos provedores e compartilhamentos que eles possuem.

Para criar um catálogo a partir de um compartilhamento de provedor, é preciso ser administrador de metastore, um usuário que tenha os privilégios CREATE CATALOG e USE PROVIDER para o seu metastore do Unity Catalog, ou um usuário que tenha o privilégio CREATE CATALOG e a propriedade do objeto provedor.

A capacidade de conceder acesso somente leitura aos esquemas (bancos de dados), tabelas, views e volumes no catálogo criado a partir do compartilhamento segue a hierarquia de privilégios típica do Unity Catalog. A capacidade de visualizar notebooks no catálogo criado a partir do compartilhamento exige o privilégio USE CATALOG no catálogo. Consulte Gerenciar permissões para os esquemas, tabelas e volumes em um catálogo do OpenSharing.

Acessar dados em uma tabela ou volume compartilhado

Para ler dados em uma tabela ou volume compartilhado:

Um usuário privilegiado deve criar um catálogo a partir do compartilhamento que contém a tabela ou o volume. Pode ser um administrador de metastore, um usuário que tenha os privilégios CREATE CATALOG e USE PROVIDER para seu metastore do Unity Catalog, ou um usuário que tenha o privilégio CREATE CATALOG e a propriedade do objeto de provedor.
Esse usuário ou um usuário com os mesmos privilégios deve conceder acesso à tabela ou ao volume compartilhado.
Você pode acessar a tabela ou o volume assim como faria com qualquer outro ativo de dados registrado em seu metastore do Unity Catalog.

Criar um catálogo a partir de um compartilhamento

Para tornar os dados em um compartilhamento acessíveis à sua equipe, você deve criar um catálogo a partir do compartilhamento ou montar o compartilhamento em um catálogo compartilhado existente. Para criar um catálogo a partir de um compartilhamento, você pode usar o Catalog Explorer, a CLI do Unity Catalog do Databricks ou comandos SQL em um Notebook do Databricks ou o editor de consultas SQL do Databricks. Para montar o compartilhamento em um catálogo compartilhado existente, você pode usar o Catalog Explorer.

Permissões necessárias para criar um catálogo : Um administrador de metastore, um usuário que tenha os privilégios CREATE CATALOG e USE PROVIDER para seu metastore do Unity Catalog, ou um usuário que tenha o privilégio CREATE CATALOG e a propriedade do objeto de provedor.

Permissões necessárias para montar o compartilhamento em um catálogo existente : Um usuário deve ter o privilégio USE PROVIDER ou ter a propriedade do objeto do provedor, e também deve ser proprietário do catálogo compartilhado existente ou ter ambos os privilégios MANAGE e USE CATALOG no catálogo compartilhado existente.

nota

Se você estiver criando um catálogo a partir de um compartilhamento SAP BDC, os metadados semânticos do SAP (comentários de tabela e coluna, chaves primárias, chaves estrangeiras e tags de governança) são sincronizados automaticamente com o catálogo. Nenhuma ação adicional é necessária. Para obter detalhes, consulte metadados semânticos do SAP BDC.

nota

Se o compartilhamento incluir views, você deve usar um nome de catálogo diferente do nome do catálogo que contém a view no metastore do provedor.

Catalog Explorer
SQL
CLI

No seu workspace do Databricks, clique em Catálogo para abrir o Catalog Explorer.
No topo do painel Catálogo , clique no ícone de engrenagem e selecione OpenSharing .

Alternativamente, no canto superior direito, clique em **Share > OpenSharing**.
Na tab **Compartilhados comigo**, localize e selecione o provedor.
Localize o compartilhamento desejado e clique em **Montar no catálogo** na linha do compartilhamento.
Selecione Criar um novo catálogo ou Montar em um catálogo existente para adicionar o ativo de dados a um catálogo existente.
Insira um nome para o seu novo catálogo ou escolha qual catálogo existente adicionar o compartilhamento.
Clique em Criar ou Montar .

Como alternativa, ao abrir o Navegador de Catálogos, o senhor pode clicar em + > Criar Catálogo no canto superior direito para criar um catálogo compartilhado. Consulte Criar catálogos.

Execute o seguinte comando em um notebook ou no editor de consultas SQL do Databricks.

SQL
CREATE CATALOG [IF NOT EXISTS] <catalog-name>
USING SHARE <provider-name>.<share-name>;

Bash
databricks catalogs create <catalog-name> /
--provider-name <provider-name> /
--share-name <share-name>

O catálogo criado a partir de um compartilhamento é do tipo de catálogo OpenSharing. Você pode visualizar o tipo na página de detalhes do catálogo no Catalog Explorer ou executando o comando SQL DESCRIBE CATALOG em um Notebook ou no editor de consultas SQL do Databricks. Todos os catálogos compartilhados estão listados em Catálogo > Compartilhados no painel esquerdo do Explorador de Catálogos.

Um catálogo OpenSharing pode ser gerenciado da mesma forma que os catálogos regulares em um metastore do Unity Catalog. Você pode view, atualizar e excluir um catálogo do OpenSharing usando o Catalog Explorer, a CLI do Databricks e os comandos SQL SHOW CATALOGS, DESCRIBE CATALOG, ALTER CATALOG e DROP CATALOG.

A estrutura de namespace de 3 níveis em um catálogo OpenSharing criado a partir de um compartilhamento é a mesma que a de um catálogo normal no Unity Catalog: catalog.schema.table ou catalog.schema.volume.

Dados de tabela e volume em um catálogo compartilhado são somente leitura, o que significa que você pode executar operações de leitura como:

DESCRIBE, SHOW e SELECT para tabelas.
DESCRIBE VOLUME, LIST <volume-path>, SELECT * FROM <format>.'<volume_path>' e COPY INTO para volumes.

Notebooks em um catálogo compartilhado podem ser visualizados e clonados por qualquer usuário com USE CATALOG no catálogo.

Modelos em um catálogo compartilhado podem ser lidos e carregados para inferência por qualquer usuário com os seguintes privilégios: privilégio de EXECUTE no modelo registrado, além de privilégios de USE SCHEMA e USE CATALOG no esquema e no catálogo que contêm o modelo.

Gerenciar permissões para os esquemas, tabelas e volumes em um catálogo OpenSharing

Por padrão, o criador do catálogo é o proprietário de todos os objetos de dados em um catálogo OpenSharing e pode gerenciar permissões para qualquer um deles.

Os privilégios são herdados para baixo, embora alguns workspaces ainda possam estar no modelo de segurança legado que não fornecia herança. Consulte Herança de privilégios. Qualquer usuário a quem seja concedido o privilégio SELECT no catálogo terá o privilégio SELECT em todos os esquemas e tabelas no catálogo, a menos que esse privilégio seja revogado. Da mesma forma, qualquer usuário a quem seja concedido o privilégio READ VOLUME no catálogo terá o privilégio READ VOLUME em todos os volumes no catálogo, a menos que esse privilégio seja revogado. Não é possível conceder privilégios que concedam acesso de gravação ou de atualização a um catálogo do OpenSharing ou a objetos em um catálogo do OpenSharing.

O proprietário do catálogo pode delegar a propriedade de objetos de dados a outros usuários ou grupos, concedendo a esses usuários a capacidade de gerenciar as permissões e os ciclos de vida do objeto.

Para obter informações detalhadas sobre como gerenciar privilégios em objetos de dados usando o Unity Catalog, consulte Gerenciar privilégios no Unity Catalog.

Ler dados em uma tabela compartilhada

Você pode ler dados em uma tabela compartilhada usando qualquer uma das ferramentas disponíveis para você como um usuário do Databricks: Catalog Explorer, Notebooks, consultas SQL, a CLI do Databricks e APIs REST do Databricks. Você deve ter o privilégio SELECT na tabela.

Se o seu provedor tiver compartilhado a tabela WITH HISTORY, você poderá executar transações na tabela. Para obter mais informações sobre os requisitos e limitações das transações, consulte Transações.

Ler dados em uma tabela externa compartilhada ou esquema externo

info

Beta

Este recurso está em Beta. Os administradores do espaço de trabalho podem controlar o acesso a esse recurso na página Pré-visualizações . Consulte Gerenciar prévias do Databricks.

Você pode ler dados em uma tabela estrangeira compartilhada ou esquema estrangeiro usando qualquer uma das ferramentas disponíveis para você como um usuário Databricks: Catalog Explorer, notebooks, consultas SQL, a CLI do Databricks e APIs REST do Databricks. Você deve ter o privilégio SELECT na tabela externa compartilhada ou no esquema externo.

Você pode executar transações em tabelas estrangeiras compartilhadas. Consulte requisitos e limitações de transação.

Há custos adicionais ao acessar uma tabela externa compartilhada ou esquema externo. Para informações sobre como os custos de compartilhamento são calculados, consulte Como eu incorro e verifico os custos do OpenSharing?.

Limitações : Não é possível ignorar a restrição de clusters para ler tabelas externas compartilhadas, mesmo que o provedor permita.

Ler dados em uma tabela Iceberg externa compartilhada

info

Visualização

Esse recurso está em Prévia Pública.

É possível ler dados em uma tabela Iceberg estrangeira compartilhada usando qualquer uma das ferramentas disponíveis para você como usuário Databricks: Catalog Explorer, Notebook, consultas SQL, a CLI do Databricks e APIs REST do Databricks. No Catalog Explorer, uma tabela Iceberg estrangeira compartilhada é exibida com um tipo de tabela Estrageira e um formato de fonte de dados Iceberg .

Você tem acesso ao local de origem do Iceberg, mas só pode realizar os seguintes tipos de consultas:

Consultas de Snapshot
Consultas de transmissão

Requisitos :

Você deve ter o privilégio SELECT na tabela Iceberg estrangeira compartilhada.
Você deve usar o Databricks Runtime 15.4 LTS ou acima.

Ler dados em um volume compartilhado

Você pode ler dados em um volume compartilhado usando qualquer uma das ferramentas disponíveis como um usuário Databricks: Catalog Explorer, notebooks, consultas SQL, a CLI do Databricks e APIs REST do Databricks. Você deve ter o privilégio READ VOLUME no volume.

Leia dados protegidos por ABAC e aplique políticas ABAC

O controle de acesso baseado em atributos (ABAC) é um modelo de governança de dados que oferece controle de acesso flexível, escalável e centralizado em todo o Databricks.

Crie políticas ABAC para tabelas, esquemas e catálogos compartilhados criados a partir de um compartilhamento. Visualizações materializadas têm suporte com limitações. Não é possível criar políticas ABAC para tabelas de transmissão ou views materializadas compartilhadas. Para configurar políticas ABAC, consulte Criar e gerenciar políticas de filtro de linha e máscara de coluna.

Ler colunas de acompanhamento de linha em tabelas compartilhadas

Se o provedor de dados habilitou o acompanhamento de linha em uma tabela compartilhada, é possível consultar as colunas de metadados de acompanhamento de linha. Consulte Acompanhamento de linha no Databricks para obter uma lista das colunas disponíveis.

Como você acessa estas colunas depende do tipo de tabela compartilhada:

Tabelas compartilhadas com histórico e sem filtros de partição : É possível consultar colunas de acompanhamento de linhas sem restrições.
Tabelas com filtros de partição ou tabelas compartilhadas sem histórico : É preciso usar Scala Spark e definir explicitamente a opção responseFormat como delta.
Scala
```
spark.read.option(“responseformat”, “delta”).table(“shared_table”).select(“_metadata.row_id”).show()
```

Carregar um modelo compartilhado para inferência

Para obter detalhes sobre como carregar um modelo compartilhado e usá-lo para inferência em lote, consulte Carregar versão do modelo por alias para cargas de trabalho de inferência.

Consultar dados da história de uma tabela

Se a história for compartilhada com a tabela, você poderá consultar os dados da tabela em uma determinada versão ou carimbo de data/hora. Requer Databricks Runtime 12.2 LTS ou acima.

Por exemplo:

SQL
SELECT * FROM vaccine.vaccine_us.vaccine_us_distribution VERSION AS OF 3;
SELECT * FROM vaccine.vaccine_us.vaccine_us_distribution TIMESTAMP AS OF "2023-01-01 00:00:00";

Além disso, se o feed de dados alterados (CDF) estiver habilitado com a tabela, é possível consultar o CDF. Ambos, versão e carimbo de data/hora, são suportados:

SQL
SELECT * FROM table_changes('vaccine.vaccine_us.vaccine_us_distribution', 0, 3);
SELECT * FROM table_changes('vaccine.vaccine_us.vaccine_us_distribution', "2023-01-01 00:00:00", "2022-02-01 00:00:00");

Para obter mais informações sobre o feed de dados de alteração, consulte Usar o feed de dados de alteração no Databricks.

Consultar uma tabela usando a transmissão estructurada do Apache Spark

Se uma tabela for compartilhada com a história, você pode usá-la como fonte para a transmissão estructurada do Spark. Requer Databricks Runtime 12.2 LTS ou acima.

Opções compatíveis:

ignoreDeletes: Ignora transações que excluem dados.
ignoreChanges: Reprocessar atualizações se os arquivos foram reescritos na tabela de origem devido a uma operação de alteração de dados, como UPDATE, MERGE INTO, DELETE (dentro de partições) ou OVERWRITE. Linhas inalteradas ainda podem ser emitidas. Portanto, seus consumidores downstream devem ser capazes de lidar com duplicidades. As exclusões não são propagadas downstream. ignoreChanges subsume ignoreDeletes. Portanto, se você usar ignoreChanges, sua transmissão não será interrompida por exclusões ou atualizações na tabela de origem.
startingVersion: A versão da tabela compartilhada de onde começar. Todas as alterações na tabela a partir desta versão (inclusive) serão lidas pela fonte de transmissão.
startingTimestamp: O timestamp de onde começar. Todas as alterações da tabela confirmadas no timestamp ou depois dele (inclusive) serão lidas pela origem de transmissão. Exemplo: "2023-01-01 00:00:00.0"
maxFilesPerTrigger: O número de arquivos novos a serem considerados em cada micro-batch.
maxBytesPerTrigger: A quantidade de dados que é processada em cada microlote. Essa opção define um “soft max”, o que significa que um lote processa aproximadamente essa quantidade de dados e pode processar mais do que o limite para fazer a consulta de transmissão avançar nos casos em que a menor unidade de entrada é maior que esse limite.
readChangeFeed: Faça uma leitura de transmissão do feed de dados alterados da tabela compartilhada.

Triggers compatíveis:

Trigger.ProcessingTime: O default Trigger, usado quando nenhum Trigger explícito é especificado. Os dados são processados em microlotes contínuos.
Trigger.AvailableNow: a query captura a versão server-side da tabela compartilhada ao começar, processa o backlog como múltiplos micro-lotes que honram maxFilesPerTrigger e maxVersionsPerRpc, e termina quando a versão capturada é esgotada. Requer o Databricks Runtime 18.0 ou acima para responseFormat=delta; responseFormat=parquet adicionalmente requer que o JAR delta-sharing-client empacotado seja 1.4.0 ou acima (versões mais antigas retornam a um wrapper Trigger.AvailableNow que não respeita maxVersionsPerRpc).
Trigger.Once: Obsoleto; use Trigger.AvailableNow em vez disso. No Databricks Runtime 17.3 e abaixo, Trigger.AvailableNow é automaticamente convertido para Trigger.Once porque o suporte nativo a Trigger.AvailableNow requer o Databricks Runtime 18.0 ou acima.

Consultas de exemplo de transmissão estructurada

Scala
Python

Scala
spark.readStream.format("deltaSharing")
.option("startingVersion", 0)
.option("ignoreChanges", true)
.option("maxFilesPerTrigger", 10)
.table("vaccine.vaccine_us.vaccine_us_distribution")

Python
spark.readStream.format("deltaSharing")\
.option("startingVersion", 0)\
.option("ignoreDeletes", true)\
.option("maxBytesPerTrigger", 10000)\
.table("vaccine.vaccine_us.vaccine_us_distribution")

Se o feed de dados alterados (CDF) estiver habilitado com a tabela, você poderá ler o CDF por transmissão.

Scala
spark.readStream.format("deltaSharing")
.option("readChangeFeed", "true")
.table("vaccine.vaccine_us.vaccine_us_distribution")

Aplicar filtros de linha e máscaras de coluna

Para aplicar filtros de linha e máscaras de coluna em tabelas e tabelas estrangeiras compartilhadas por seu provedor de dados, consulte Aplicar filtros de linha e máscaras de coluna manualmente. Não é possível aplicar máscaras de coluna a tabelas de transmissão ou views materializadas.

Ler tabelas com vetores de exclusão ou mapeamento de coluna habilitado

info

Visualização

Esse recurso está em Prévia Pública.

Vetores de exclusão são um recurso de otimização de armazenamento que seu provedor pode habilitar em tabelas Delta compartilhadas. Consulte Vetores de exclusão no Databricks.

A Databricks também oferece suporte ao mapeamento de colunas para tabelas Delta. Consulte Renomear e eliminar colunas com o mapeamento de colunas do Delta Lake.

Se seu provedor compartilhou uma tabela com vetores de exclusão ou mapeamento de colunas habilitado, você pode realizar leituras em lotes na tabela usando um SQL warehouse ou um cluster executando o Databricks Runtime 14.1 ou acima. As consultas CDF e de transmissão exigem o Databricks Runtime 14.2 ou acima.

Você pode executar consultas em lote como estão, porque elas podem resolver automaticamente responseFormat com base nos recursos da tabela compartilhada.

Para ler um feed de dados de alteração (CDF) ou para executar consultas de transmissão em tabelas compartilhadas com vetores de exclusão ou mapeamento de coluna ativado, você deve definir a opção adicional responseFormat=delta.

Os exemplos a seguir mostram consultas de lotes, CDF e transmissão:

Scala
import org.apache.spark.sql.SparkSession

// Batch query
spark.read.format("deltaSharing").table(<tableName>)

// CDF query
spark.read.format("deltaSharing")
  .option("readChangeFeed", "true")
  .option("responseFormat", "delta")
  .option("startingVersion", 1)
  .table(<tableName>)

// Streaming query
spark.readStream.format("deltaSharing").option("responseFormat", "delta").table(<tableName>)

Ler tabelas Iceberg gerenciadas compartilhadas

info

Visualização

Esse recurso está em Prévia Pública.

A leitura de tabelas Iceberg gerenciadas compartilhadas é o mesmo que ler tabelas compartilhadas, com estas exceções:

Suporte no compartilhamento Databricks-para-Open:

As instruções nestes artigos se concentram na leitura de uso de dados usando interfaces de usuário do Databricks, especificamente a sintaxe e as interfaces do Unity Catalog. Devido à limitação no suporte avançado a recursos Delta para conectores OpenSharing, a consulta de tabelas Iceberg gerenciadas compartilhadas usando Python, Tableau e Power BI não é compatível.

Alterar feed de dados:

O feed de dados de alteração não é compatível com tabelas Iceberg gerenciadas.

Limitações do Databricks Iceberg:

Limitações de tabelas Iceberg e tabelas Iceberg gerenciadas se aplicam. Consulte Limitações.

Ler view compartilhadas

Ler views compartilhadas é o mesmo que ler tabelas compartilhadas, com estas exceções:

Restrições de visualizações compartilhadas:

Views compartilhadas suportam apenas um subconjunto de funções e operadores integrados no Databricks. Consulte Funções suportadas no compartilhamento de views Databricks-to-Databricks.
Os destinatários não podem consultar mais de 20 views compartilhadas em uma consulta no compartilhamento Databricks-to-Databricks. As views compartilhadas não podem ser de mais de cinco compartilhamentos de provedor diferentes.
Quando o provedor é da mesma account, ou quando se usa compute serverless em uma account diferente, não é possível consultar várias views dependentes do mesmo provedor em uma única consulta. Por exemplo, se view1 depende de view2 no lado do provedor e ambas as views forem compartilhadas, não é possível referenciar view1 e view2 na mesma consulta.
Você pode executar transações em views compartilhadas. Consulte requisitos e limitações de transação.

Requisitos de nomenclatura:

O nome do catálogo que você usa para o catálogo compartilhado que contém a view não pode ser o mesmo que qualquer catálogo de provedor que contém uma tabela referenciada pela view. Por exemplo, se a view compartilhada estiver contida em seu catálogo test, e uma das tabelas do provedor referenciadas nessa view estiver contida no catálogo test do provedor, a consulta resultará em um erro de conflito de namespace. Consulte Crie um catálogo a partir de um compartilhamento.

Tempo limite de query de resultado:

Se você não tiver acesso direto aos dados subjacentes, a Databricks executa a materialização em tempo real ao consultar a view. Quando essa materialização leva mais de 5 minutos, a consulta expira. Mude para serverless compute para evitar essa limitação.

História e transmissão:

Não é possível consultar o histórico ou usar uma view como uma fonte de transmissão.

Suporte a view no compartilhamento Databricks-para-Aberto:

As instruções neste artigo se concentram na leitura de dados compartilhados usando interfaces de usuário do Databricks, especificamente sintaxe e interfaces do Unity Catalog. Também é possível consultar views compartilhadas usando Apache Spark, Python e ferramentas de BI como Tableau e Power BI.

Custos:

Para informações sobre como os custos de compartilhamento são calculados, consulte Como eu incorro e verifico os custos do OpenSharing?.

Ler tabelas de transmissão compartilhadas e views materializadas

Ler tabelas de transmissão e views materializadas compartilhadas é o mesmo que ler tabelas compartilhadas, com estas exceções:

Suporte no compartilhamento Databricks-para-Open:

As instruções nesta página se concentram na leitura de dados compartilhados usando interfaces de usuário do Databricks, especificamente a sintaxe e as interfaces do Unity Catalog. Você também pode query tabelas de transmissão compartilhadas e exibições materializadas usando Apache Spark, Python e ferramentas de BI como Tableau e Power BI. Consulte Ler dados compartilhados com tokens de portador.

Transações:

Você pode executar transações em views materializadas e tabelas de transmissão compartilhadas. Consulte requisitos e limitações de transação.

Limitações do SQL :

A função current_recipient não é compatível.
O comando DESCRIBE EXTENDED não tem suporte.

Mapeamento de coluna:

Se você estiver usando o compute clássico ao receber um compartilhamento de uma account Databricks diferente, você deve especificar o responseFormat conforme abaixo ao consultar uma view materializada ou tabelas de transmissão com mapeamento de colunas.

Python
spark.read.option("responseFormat", "delta").table("catalog_name.schema_name.mv_name")

Se você estiver usando o compute clássico ao fazer o compartilhamento na mesma account Databricks ou o compute serverless em qualquer cenário, poderá consultar sem restrições.

Custos:

Para informações sobre como os custos de compartilhamento são calculados, consulte Como eu incorro e verifico os custos do OpenSharing?.

Materialized view specific exceptions
Streaming table specific exceptions

história:

Você não pode consultar a história.

refresh:

Não é possível acessar o status de refresh e o agendamento de refresh da view materializada.

Criação de view e tabelas de transmissão:

Você não pode criar tabelas de transmissão em views materializadas compartilhadas.

Ler UDFs Python compartilhadas

Ler Python UDFs compartilhados é o mesmo que ler tabelas compartilhadas. Depois de criar um novo catálogo para o compartilhamento ou montar o compartilhamento em um catálogo existente, você pode acessar e usar o Python UDF.

Ler Notebooks compartilhados

Para visualizar e clonar arquivos de notebook compartilhados, você pode usar o Catalog Explorer.

Limitação de armazenamento: Se seu armazenamento usar Endpoints Privados, não será possível ler Notebooks compartilhados.

Permissões necessárias: Proprietário do catálogo ou usuário com o privilégio USE CATALOG no catálogo criado a partir do compartilhamento.

No seu Databricks workspace, clique em Catálogo .
No painel esquerdo, expanda o menu **Catálogo**, encontre e selecione o catálogo criado a partir do compartilhamento.
Na tab Outros ativos , você verá quaisquer arquivos de Notebook compartilhados.
Clique no nome de um arquivo de notebook compartilhado para pré-visualizá-lo.
(Opcional) Clique no botão **Clonar** para importar o arquivo de Notebook compartilhado para seu workspace.
1. Na caixa de diálogo Clonar para , insira opcionalmente um Novo nome e selecione a pasta do workspace para a qual você deseja clonar o arquivo do Notebook.
2. Clique em Clonar .
3. Assim que o Notebook for clonado, uma caixa de diálogo é exibida para informar que a clonagem foi bem-sucedida. Clique em revelar no editor do Notebook na caixa de diálogo para visualizá-lo no editor do Notebook.
Consulte Notebooks Databricks.

unmount um compartilhamento

unmount um compartilhamento para remover o ativo de dados de seu catálogo.

Permissões necessárias: Usuário com os privilégios USE CATALOG e MANAGE no catálogo compartilhado.

No seu workspace do Databricks, clique em Catálogo para abrir o Catalog Explorer.
No topo do painel Catálogo , clique no ícone de engrenagem e selecione OpenSharing .

Alternativamente, no canto superior direito, clique em **Share > OpenSharing**.
Na tab **Compartilhados comigo**, localize e selecione o provedor.
Clique em na linha de compartilhamento.
Clique em Unmount compartilhamento .
Click unmount .

Como torno os dados compartilhados disponíveis para minha equipe?​

Permissões necessárias​

Acessar dados em uma tabela ou volume compartilhado​

Criar um catálogo a partir de um compartilhamento​

Gerenciar permissões para os esquemas, tabelas e volumes em um catálogo OpenSharing​

Ler dados em uma tabela compartilhada​

Ler dados em uma tabela externa compartilhada ou esquema externo​

Ler dados em uma tabela Iceberg externa compartilhada​

Ler dados em um volume compartilhado​

Leia dados protegidos por ABAC e aplique políticas ABAC​

Ler colunas de acompanhamento de linha em tabelas compartilhadas​

Carregar um modelo compartilhado para inferência​

Consultar dados da história de uma tabela​

Consultar uma tabela usando a transmissão estructurada do Apache Spark​

Consultas de exemplo de transmissão estructurada​

Aplicar filtros de linha e máscaras de coluna​

Ler tabelas com vetores de exclusão ou mapeamento de coluna habilitado​

Ler tabelas Iceberg gerenciadas compartilhadas​

Ler view compartilhadas​

Ler tabelas de transmissão compartilhadas e views materializadas​

Ler UDFs Python compartilhadas​

Ler Notebooks compartilhados​

unmount um compartilhamento​

Como torno os dados compartilhados disponíveis para minha equipe?

Permissões necessárias

Acessar dados em uma tabela ou volume compartilhado

Criar um catálogo a partir de um compartilhamento

Gerenciar permissões para os esquemas, tabelas e volumes em um catálogo OpenSharing

Ler dados em uma tabela compartilhada

Ler dados em uma tabela externa compartilhada ou esquema externo

Ler dados em uma tabela Iceberg externa compartilhada

Ler dados em um volume compartilhado

Leia dados protegidos por ABAC e aplique políticas ABAC

Ler colunas de acompanhamento de linha em tabelas compartilhadas

Carregar um modelo compartilhado para inferência

Consultar dados da história de uma tabela

Consultar uma tabela usando a transmissão estructurada do Apache Spark

Consultas de exemplo de transmissão estructurada

Aplicar filtros de linha e máscaras de coluna

Ler tabelas com vetores de exclusão ou mapeamento de coluna habilitado

Ler tabelas Iceberg gerenciadas compartilhadas

Ler view compartilhadas

Ler tabelas de transmissão compartilhadas e views materializadas

Ler UDFs Python compartilhadas

Ler Notebooks compartilhados

unmount um compartilhamento