Pular para o conteúdo principal

Conecte-se a Matillion

O Matillion ETL é uma ferramenta ETL/ELT criada especificamente para plataformas de banco de dados em nuvem, incluindo a Databricks. O Matillion ETL tem uma interface de usuário moderna, baseada em navegador, com funcionalidade ETL/ELT avançada e push-down.

O senhor pode integrar seus armazéns Databricks SQL (anteriormente Databricks SQL endpoint) e Databricks clustering com Matillion.

Conecte-se à Matillion usando o Partner Connect

Esta seção descreve como usar Partner Connect para simplificar o processo de conexão de um SQL warehouse existente ou clusters em seu workspace Databricks para Matillion.

Requisitos

Consulte os requisitos para usar o Partner Connect.

Etapas para se conectar

Para se conectar ao Matillion usando o Partner Connect, siga as etapas desta seção.

dica

Se o senhor já tiver um Matillion account, o Databricks recomenda que se conecte ao Matillion manualmente. Isso ocorre porque a experiência de conexão em Partner Connect é otimizada para novas contas de parceiros.

  1. Na barra lateral, clique em Ícone do Marketplace marketplace .

  2. Em Partner Connect integrations , clique em view all .

  3. Clique no bloco Matillion .

    A caixa de e-mail exibe o endereço email do senhor Databricks account. Matillion usa esse endereço email para solicitar que o senhor crie um novo Matillion account ou faça login no seu Matillion account existente.

  4. Clique em Connect to Matillion ETL ou em Sign in .

    Um novo tab é aberto em seu navegador e exibe o Matillion Hub.

  5. Complete as instruções na tela em Matillion para criar sua avaliação de 14 dias Matillion account ou para entrar em sua conta existente Matillion account.

important

Se for exibido um erro informando que alguém da sua organização já criou um account com Matillion, entre em contato com um dos administradores da sua organização e peça que ele o adicione ao Matillion account da sua organização. Depois que eles adicionarem o senhor, faça login no site Matillion account.

  1. Complete as instruções na tela para fornecer os detalhes do seu trabalho e clique em Continue .

  2. Preencha as instruções na tela para criar uma organização e clique em Continuar .

  3. Clique na organização que o senhor criou e, em seguida, clique em Add Matillion ETL instance (Adicionar instância do Matillion ETL ).

  4. Clique em Continuar no AWS .

    O console do Amazon EC2 é aberto.

  5. Siga Launching Matillion ETL usando Amazon Machine Image na documentação Matillion ETL, começando com a passo 5. Em seguida, siga Accessing Matillion ETL no Amazon Web serviço (EC2) na documentação Matillion ETL.

  6. Siga as instruções da documentação do Matillion ETL.

    O Matillion ETL é aberto em seu navegador e a caixa de diálogo Create Project é exibida.

  7. Siga o projeto Create a Delta Lake on Databricks na documentação do Matillion.

    Para as configurações na seção Delta Lake Connection (Conexão ) destas instruções, insira as seguintes informações:

    • Para o ID do espaço de trabalho , digite o ID do seu Databricks workspace. Consulte nomes de instância de espaço de trabalho, URLs e IDs.
    • Em Nome de usuário , digite a palavra token.
    • Para Password (Senha ), digite o valor de um Databricks tokens de acesso pessoal.

    Para obter o ID do espaço de trabalho e gerar tokens de acesso pessoal, faça o seguinte:

    1. Retorne à tab Partner Connect em seu navegador.

    2. Anote o ID do espaço de trabalho .

    3. Clique em Generate a new tokens (Gerar novos tokens ).

    Uma nova página tab é aberta em seu navegador e exibe a página Settings (Configurações ) da UI Databricks. 4. Clique em Gerar novo token .

    1. Opcionalmente, insira uma descrição (comentário) e um período de expiração.

    2. Clique em Gerar .

    3. Copie os tokens de acesso pessoal gerados e armazene-os em um local seguro.

    4. Retorne ao site Matillion tab em seu navegador.

    Para as configurações na seção padrãoDelta Lake dentro destas instruções, para clustering , escolha o nome do SQL warehouse ou do clustering.

  8. Continue com as próximas etapas.

Conecte-se ao Matillion manualmente

Esta seção descreve como conectar manualmente um SQL warehouse ou clustering existente no seu Databricks workspace a Matillion.

nota

Você pode se conectar ao Matillion usando Partner Connect para simplificar a experiência.

Requisitos

Antes de fazer a integração manual com a Matillion, o senhor deve ter o seguinte:

nota

Como prática recomendada de segurança ao se autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, a Databricks recomenda que você use tokens OAuth.

Se o senhor usar a autenticação de tokens de acesso pessoal, a Databricks recomenda usar o acesso pessoal tokens pertencente à entidade de serviço em vez de usuários workspace. Para criar tokens o site para uma entidade de serviço, consulte gerenciar tokens para uma entidade de serviço.

Etapas para se conectar

Para se conectar ao Matillion manualmente, faça o seguinte:

  1. Obtenha o nome do recurso compute existente que o senhor deseja usar (um SQL warehouse ou clustering) em seu workspace. Posteriormente, o senhor escolherá esse nome para concluir a conexão entre o recurso compute e a instância Matillion ETL .

  2. Siga Conectar-se à sua instância Matillion ETL e log in a ela na documentação Matillion.

  3. Siga o projeto Create a Delta Lake on Databricks na documentação do Matillion.

    Para as configurações na seção Delta Lake Connection (Conexão ) destas instruções, insira as seguintes informações:

    Para as configurações na seção padrãoDelta Lake dentro destas instruções, para clustering , escolha o nome do SQL warehouse ou do clustering.

  4. Continue com as próximas etapas.

Próximas etapas

Explore um ou mais dos seguintes recursos no site Matillion: