Pular para o conteúdo principal

Conecte-se à nuvem Matillion Data Productivity

Matillion Data Productivity Cloud é uma ferramenta ETL/ELT criada especificamente para plataformas de banco de dados cloud , incluindo Databricks. A nuvem Matillion Data Productivity tem uma interface de usuário moderna, baseada em navegador, com funcionalidade ETL/ELT poderosa e push-down.

O senhor pode integrar seus armazéns Databricks SQL (anteriormente Databricks SQL endpoint) e Databricks clustering com Matillion.

Conecte-se à Matillion usando o Partner Connect

Esta seção descreve como usar Partner Connect para simplificar o processo de conexão de um SQL warehouse existente ou clusters em seu workspace Databricks para Matillion.

Requisitos

Consulte os requisitos para usar o Partner Connect.

Etapas para se conectar

Para se conectar ao Matillion usando o Partner Connect, siga as etapas desta seção.

  1. Na barra lateral, clique em Ícone do Marketplace marketplace .

  2. Em Partner Connect integrations , clique em view all .

  3. Clique no bloco de nuvemMatillion Data Productivity .

  4. Selecione um catálogo do Databricks para o Matillion gravar e clique em Avançar .

  5. Selecione um warehouse Databricks SQL existente para usar com Matillion. Este recurso compute é usado para executar seu pipeline.

  6. Escolha o esquema que Matillion deve usar para criar e gerenciar seu pipeline de dados. Clique em Adicionar .

  7. Clique em Avançar .

  8. Revise suas informações de conexão e clique em Avançar .

  9. Revise e aceite os termos e condições para usar Partner Connect e clique em Conectar à nuvem Matillion Data Productivity .

  10. A página da nuvem Matillion Data Productivity é carregada. Siga as instruções na tela para criar sua account de teste de 14 dias ou faça login na sua account Matillion existente.

    O Matillion pode levar alguns minutos para criar a infraestrutura necessária e se conectar com segurança ao seu ambiente Databricks.

  11. Depois que o Matillion conclui o processo de configuração, o Designer é carregado.

nota

Se você não estiver na página do Designer, volte para o Databricks e faça login no Matillion novamente.

Comece com Matillion

Após a configuração ser concluída, você será direcionado ao Designer, onde poderá começar a criar um pipeline de dados. pipeline é a maneira da nuvem de produtividade de dados projetar, organizar e executar fluxo de trabalho.

Para garantir que seu workspace Databricks esteja conectado ao Matillion, procure o seguinte:

  • Um projeto default com o logotipo Databricks no canto superior esquerdo.
  • Seu ambiente é nomeado usando a terminologia do Databricks.
  • Se você clicar em Esquemas no canto superior esquerdo, um painel será aberto e mostrará o esquema selecionado no Databricks, juntamente com quaisquer tabelas e visualizações.

Explore o conteúdo do Esquema para confirmar se Matillion está conectado com sucesso ao seu workspace Databricks .

Depois de verificar se você está conectado ao Databricks, comece a criar um pipeline no Matillion:

  • Crie seu primeiro pipeline de orquestração para mover dados de fontes para Databricks .
  • Crie seu primeiro pipeline de transformações para moldar, limpar e preparar dados que já existem diretamente no Databricks.
  • Use o Designer Visual para criar um fluxo de trabalho usando uma interface de tela de arrastar e soltar.

Próximas etapas

Explore um ou mais dos seguintes recursos no site Matillion: