Perguntas frequentes sobre o conector Confluence

Esta página responde às perguntas mais frequentes sobre o conector Confluence no Databricks LakeFlow Connect.

Perguntas frequentes gerais sobre conectores de gerenciamento

Consulte as perguntas frequentes sobre conectores de gerenciamento para obter informações que se aplicam a todos os conectores de gerenciamento LakeFlow Connect . Os itens a seguir são específicos para o Confluence.

Perguntas frequentes específicas sobre conectores

As respostas nesta seção são específicas para o conector Confluence.

Como o conector extrai dados do Confluence?

O conector do Confluence utiliza a API REST do Confluence para recuperar o conteúdo da página, metadados e anexos dos seus espaços do Confluence.

Posso importar páginas específicas ou espaços inteiros?

Não.

Como o conector lida com a hierarquia de páginas?

O conector mantém a estrutura hierárquica das páginas dentro de um espaço. As relações pai-filho entre as páginas são preservadas nos dados importados.

O conector suporta ingestão incremental?

O conector atualmente suporta as seguintes tabelas.

Ele ingere páginas, postagens de blog e anexos de forma incremental.
No entanto, ele ingere espaços, rótulo e níveis de classificação usando Snapshot. Isso significa que ele sobrescreve os dados a cada execução do pipeline.

Para informações sobre os esquemas resultantes, consulte Esquemas.

Como são gerenciados os anexos no Confluence?

Os metadados do anexo (nome do arquivo, tamanho, tipo de conteúdo, data de upload) são importados. Os arquivos anexos propriamente ditos não são importados por default. Se precisar importar conteúdo de anexos, entre em contato com o suporte da Databricks.

O que acontece se uma página for excluída no Confluence?

Ao usar o SCD tipo 2, as páginas excluídas são rastreadas e marcadas com um registro de data e hora da exclusão na tabela de destino. Com o SCD tipo 1, a página é removida da tabela de destino.

Posso importar espaços arquivados?

O conector só ingere espaços ativos. Os espaços arquivados não estão incluídos no pipeline de ingestão.

Que permissões o conector requer?

A account de usuário do Confluence deve ter acesso de leitura aos espaços e páginas que você deseja importar. Databricks recomenda o uso de uma account de serviço dedicada com as permissões apropriadas. Para obter mais informações, consulte Configurar OAuth U2M para ingestão do Confluence.

Como o conector lida com a formatação da página?

O conteúdo da página é inserido no formato de armazenamento do Confluence, que é um formato baseado em XHTML. Você pode analisar esse conteúdo em processamentos subsequentes para extrair texto simples ou convertê-lo para outros formatos. Consulte a seção Formato de armazenamento do Confluence na documentação do Confluence.

Os comentários da página são incorporados?

O conector não inclui comentários de página.

Posso filtrar páginas por rótulo ou tag?

Não, o conector processa todas as páginas.

Perguntas frequentes gerais sobre conectores de gerenciamento​

Perguntas frequentes específicas sobre conectores​

Como o conector extrai dados do Confluence?​

Posso importar páginas específicas ou espaços inteiros?​

Como o conector lida com a hierarquia de páginas?​

O conector suporta ingestão incremental?​

Como são gerenciados os anexos no Confluence?​

O que acontece se uma página for excluída no Confluence?​

Posso importar espaços arquivados?​

Que permissões o conector requer?​

Como o conector lida com a formatação da página?​

Os comentários da página são incorporados?​

Posso filtrar páginas por rótulo ou tag?​