Conectar-se ao Qlik Replicate
Visualização
Esse recurso está em Public Preview.
Qlik Replicate Ajuda o senhor a extrair dados de várias fontes de dados (Oracle, Microsoft SQL Server, SAP, mainframe e outros) para Delta Lake. A captura automatizada de dados de alterações (CDC) da Replicate (CDC) ajuda o senhor a evitar o trabalho pesado de extração manual de dados, transferência usando um script API, corte, preparação e importação. O Qlik Compose automatiza o CDC no Delta Lake.
Para obter informações sobre Qlik Sense, uma solução que ajuda o senhor a analisar dados em Delta Lake, consulte Connect to Qlik Sense.
Para uma demonstração geral do Qlik Replicate Replicate, assista ao seguinte vídeo do YouTube (14 minutos).
Para ver uma demonstração do pipeline de dados com o Qlik Replicate Replicate, assista ao seguinte vídeo do YouTube (6 minutos).
Aqui estão as etapas para usar o Qlik Replicate com o Databricks.
Etapa 1: Gerar um Databricks tokens de acesso pessoal
Qlik Replicate autentica-se em Databricks usando tokens de acesso pessoal Databricks.
Como prática recomendada de segurança ao se autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, a Databricks recomenda que você use tokens OAuth.
Se o senhor usar a autenticação de tokens de acesso pessoal, a Databricks recomenda usar o acesso pessoal tokens pertencente à entidade de serviço em vez de usuários workspace. Para criar tokens o site para uma entidade de serviço, consulte gerenciar tokens para uma entidade de serviço.
Etapa 2: Configurar um clustering para atender às necessidades de integração
Qlik Replicate gravará os dados em um bucket S3 e o clustering de integração Databricks lerá os dados desse local. Portanto, o clustering de integração exige acesso seguro ao bucket S3.
Acesso seguro a um bucket S3
Para acessar AWS recurso, o senhor pode iniciar o clustering de integração Databricks com um instance profile. O instance profile deve ter acesso ao bucket de preparação S3 e ao bucket de destino S3 onde o senhor deseja gravar as tabelas Delta. Para criar um instance profile e configurar o clustering de integração para usar a função, siga as instruções do tutorial: Configurar o acesso S3 com um instance profile.
Como alternativa, o senhor pode usar IAM credential passthrough, que permite o acesso específico do usuário aos dados de S3 de um cluster compartilhado.
Especificar a configuração de clustering
-
Defina o clustering Mode como Standard .
-
Defina Databricks Runtime Version como uma versão de tempo de execução de Databricks.
-
Ative as gravações otimizadas e a compactação automática adicionando as seguintes propriedades à sua configuração do Spark:
inispark.databricks.delta.optimizeWrite.enabled true
spark.databricks.delta.autoCompact.enabled true -
Configure seu clustering de acordo com suas necessidades de integração e dimensionamento.
Para obter detalhes sobre a configuração de clustering, consulte a referência de configuração de computação.
Consulte Obter detalhes da conexão para um recurso Databricks compute para saber as etapas para obter o URL JDBC e o caminho HTTP.
Etapa 3: Obtenha os detalhes da conexão JDBC e ODBC para se conectar a um clustering
Para conectar um clustering Databricks a Qlik Replicate, o senhor precisa das seguintes propriedades de conexão JDBC/ODBC:
- URL JDBC
- Caminho HTTP
Etapa 4: Configurar o Qlik Replicate com o Databricks
Vá para a página de login da Qlik e siga as instruções.