Conector de ingestão MySQL
Visualização
O conector MySQL está em versão prévia pública. Entre em contato com a equipe da sua account Databricks para solicitar acesso.
Esta página ajuda você a entender o fluxo de trabalho de ingestão MySQL , incluindo os fatores que determinam sua abordagem de configuração e os passos envolvidos para diferentes perfis de usuário.
O que você precisa saber antes de começar.
tópico | Por que isso importa |
|---|---|
O fluxo de trabalho depende do seu perfil de usuário do Databricks:
| |
A configuração do banco de dados de origem depende do ambiente de implantação MySQL (Amazon RDS, Aurora MySQL, Azure Database for MySQL, Google Cloud SQL for MySQL ou MySQL on EC2). | |
Os passos para criar uma conexão dependem do método de autenticação escolhido. | |
Os passos para criar uma conexão, um gateway e um pipeline dependem da interface. | |
A programação pipeline depende dos seus requisitos de latência e custo. | |
Dependendo das suas necessidades de ingestão, o pipeline pode usar configurações como acompanhamento de história, seleção de coluna e filtragem de linha. As configurações suportadas variam de acordo com o conector. Consulte a disponibilidade do recurso. |
Comece a ingerir dados do MySQL
A tabela a seguir fornece uma visão geral do fluxo de trabalho de ingestão de dados MySQL de ponta a ponta, com base no tipo de usuário:
Usuário | os passos |
|---|---|
Administrador |
|
Não administrativo | Utilize qualquer interface compatível para criar um gateway e um pipeline. Consulte Criar um pipeline de ingestão do MySQL. |
Disponibilidade do recurso
Recurso | Disponibilidade |
|---|---|
Criação pipeline baseada em interface de usuário |
|
Criação pipeline baseada em API |
|
Pacotes de Automação Declarativa |
|
Ingestão incremental |
|
Governança Unity Catalog |
|
orquestração usando Databricks Workflows |
|
SCD tipo 2 |
|
Seleção e deseleção de colunas baseadas em API |
|
Filtragem de linhas baseada em API |
|
Evolução automatizada do esquema: Colunas novas e excluídas |
|
Evolução automatizada do esquema: mudanças no tipo de dados |
|
Evolução automatizada do esquema: renomeação de colunas |
Tratada como uma nova coluna (novo nome) e coluna excluída (nome antigo). |
Evolução automatizada do esquema: Novas tabelas |
Se você ingerir todo o esquema. Veja as limitações quanto ao número de tabelas por pipeline. |
Número máximo de tabelas por pipeline | 250 |
Métodos de autenticação
Método de autenticação | Disponibilidade |
|---|---|
OAuth U2M |
|
OAuth M2M |
|
OAuth (tokens refresh manual) |
|
Autenticação básica (nome de usuário/senha) |
|
Autenticação básica ( key API ) |
|
Autenticação básica ( key JSON da account ) |
|