Conecte-se à nuvem Matillion Data Productivity
Matillion Data Productivity Cloud é uma ferramenta ETL/ELT criada especificamente para plataformas de banco de dados cloud , incluindo Databricks. A nuvem Matillion Data Productivity tem uma interface de usuário moderna, baseada em navegador, com funcionalidade ETL/ELT poderosa e push-down.
O senhor pode integrar seus armazéns Databricks SQL (anteriormente Databricks SQL endpoint) e Databricks clustering com Matillion.
Conecte-se à Matillion usando o Partner Connect
Esta seção descreve como usar Partner Connect para simplificar o processo de conexão de um SQL warehouse existente ou clusters em seu workspace Databricks para Matillion.
Requisitos
Consulte os requisitos para usar o Partner Connect.
Etapas para se conectar
Para se conectar ao Matillion usando o Partner Connect, siga as etapas desta seção.
-
Na barra lateral, clique em
marketplace .
-
Em Partner Connect integrations , clique em view all .
-
Clique no bloco de nuvemMatillion Data Productivity .
-
Selecione um catálogo do Databricks para o Matillion gravar e clique em Avançar .
-
Selecione um warehouse Databricks SQL existente para usar com Matillion. Este recurso compute é usado para executar seu pipeline.
-
Escolha o esquema que Matillion deve usar para criar e gerenciar seu pipeline de dados. Clique em Adicionar .
-
Clique em Avançar .
-
Revise suas informações de conexão e clique em Avançar .
-
Revise e aceite os termos e condições para usar Partner Connect e clique em Conectar à nuvem Matillion Data Productivity .
-
A página da nuvem Matillion Data Productivity é carregada. Siga as instruções na tela para criar sua account de teste de 14 dias ou faça login na sua account Matillion existente.
O Matillion pode levar alguns minutos para criar a infraestrutura necessária e se conectar com segurança ao seu ambiente Databricks.
-
Depois que o Matillion conclui o processo de configuração, o Designer é carregado.
Se você não estiver na página do Designer, volte para o Databricks e faça login no Matillion novamente.
Comece com Matillion
Após a configuração ser concluída, você será direcionado ao Designer, onde poderá começar a criar um pipeline de dados. pipeline é a maneira da nuvem de produtividade de dados projetar, organizar e executar fluxo de trabalho.
Para garantir que seu workspace Databricks esteja conectado ao Matillion, procure o seguinte:
- Um projeto default com o logotipo Databricks no canto superior esquerdo.
- Seu ambiente é nomeado usando a terminologia do Databricks.
- Se você clicar em Esquemas no canto superior esquerdo, um painel será aberto e mostrará o esquema selecionado no Databricks, juntamente com quaisquer tabelas e visualizações.
Explore o conteúdo do Esquema para confirmar se Matillion está conectado com sucesso ao seu workspace Databricks .
Depois de verificar se você está conectado ao Databricks, comece a criar um pipeline no Matillion:
- Crie seu primeiro pipeline de orquestração para mover dados de fontes para Databricks .
- Crie seu primeiro pipeline de transformações para moldar, limpar e preparar dados que já existem diretamente no Databricks.
- Use o Designer Visual para criar um fluxo de trabalho usando uma interface de tela de arrastar e soltar.
Próximas etapas
Explore um ou mais dos seguintes recursos no site Matillion: