Conectar ao Stitch
Visualização
Este recurso está em visualização pública.
Stitch ajuda você a consolidar todos os seus dados de negócios de diferentes bancos de dados e aplicativos SaaS (Salesforce, Hubspot, Marketo e assim por diante) no Delta Lake.
Aqui estão os passos para usar Stitch com Databricks.
passo 1: Gerar access tokenspessoal do Databricks
Stitch autentica com Databricks usando access tokens pessoal Databricks.
Observação
Como prática recomendada de segurança ao se autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, a Databricks recomenda que você use tokens OAuth.
Se o senhor usar a autenticação pessoal access token, a Databricks recomenda o uso de pessoal access tokens pertencente à entidade de serviço em vez de usuários workspace. Para criar o site tokens para uma entidade de serviço, consulte gerenciar tokens para uma entidade de serviço.
passo 2: configurar clusters para dar suporte às necessidades de integração
O Stitch gravará dados em um bucket do S3 e os clusters de integração do Databricks lerão os dados desse local. Portanto, os clusters de integração requerem acesso seguro ao bucket do S3.
Acesso seguro a um bucket S3
Para acessar o recurso AWS, você pode iniciar os clusters de integração do Databricks com um instance profile. O instance profile deve ter acesso ao bucket S3 de preparação e ao bucket S3 de destino onde você deseja gravar as tabelas Delta. Para criar um instance profile e configurar os clusters de integração para usar a função, siga as instruções em Tutorial: Configurar o acesso ao S3 com um instance profile.
Como alternativa, você pode usar a passagem de credenciais do IAM, que permite acesso específico do usuário aos dados do S3 de clusters compartilhados.
Especifique a configuração clusters
Defina clusters Mode como Standard.
Defina Databricks Runtime Version como Runtime: 6.3 ouacima.
Habilite gravações otimizadas e compactação automática adicionando as seguintes propriedades à configuração do Spark:
spark.databricks.delta.optimizeWrite.enabled true spark.databricks.delta.autoCompact.enabled true
Configure seus clusters de acordo com suas necessidades de integração e dimensionamento.
Para obter detalhes sobre a configuração de clusters, consulte Referência de configuração de computação.
Consulte obter detalhes de ligação para um recurso de computação Databricks para obter os passos para obter o URL JDBC e o caminho HTTP.
Passo 3: configurar Stitch com Databricks
Vá para a página de login do Stitch e siga as instruções.