Conecte-se ao Dataiku
Dataiku é uma plataforma AI de ponta a ponta para preparação de dados, Mosaic AutoML e MLOps. O senhor pode integrar seus armazéns Databricks SQL e Databricks clusters com Dataiku.
Conecte-se ao Dataiku usando parceiros Connect
Observação
parceiros Connect suporta apenas SQL warehouse para Dataiku. Para conectar clusters ao Dataiku, conecte-se ao Dataiku manualmente.
Para conectar seu espaço de trabalho do Databricks ao Dataiku usando parceiros Connect, faça o seguinte:
Na barra lateral, clique em parceiros Conecte-se.
Clique no bloco parceiros.
Observação
Se o bloco do Dataiku tiver um ícone de marca de seleção dentro dele, um administrador já usou parceiros Connect para conectar o Dataiku ao seu workspace. Pule para o passo 5. Os parceiros usam o endereço de e-mail da sua account Databricks para solicitar que você faça login na sua account Dataiku existente.
Selecione um catálogo na lista suspensa e clique em Avançar.
Observação
Se o seu workspace estiver habilitado para Unity Catalog, mas os parceiros não oferecerem suporte Unity Catalog com Partner Connect, o catálogo default workspace será usado. Se seu workspace não for habilitado para Unity Catalog,
hive_metastore
será usado.Selecione um esquema na lista suspensa e clique em Adicionar. Você pode repetir este passo para adicionar vários esquemas.
Clique em Avançar.
Partner Connect cria os seguintes recursos em seu workspace:
Uma entidade de serviço Databricks chamada
<PARTNER>_USER
.Um Databricks pessoal access token que está associado à
<PARTNER>_USER
entidade de serviço.
O parceiro Connect também concede os seguintes privilégios à
<PARTNER>_USER
entidade de serviço:(Catálogo Unity)
USE CATALOG
: Necessário para interagir com objetos no catálogo selecionado.(Unity Catalog)
USE SCHEMA
: Concede a capacidade de ler os esquemas que o senhor selecionou.(Unity Catalog)
CREATE SCHEMA
: Concede a capacidade de criar esquemas no catálogo selecionado.(Legado Hive metastore)
USAGE
: Necessário para interagir com objetos emhive_metastore
e com os esquemas selecionados.(Legado Hive metastore)
CREATE
: Concede a capacidade de criar um esquema emhive_metastore
.( Hive metastore) READ_METADATA: concede a capacidade de ler metadados para os esquemas selecionados.
( Hive metastore) SELECT: concede a capacidade de ler os esquemas selecionados.
Clique em Avançar.
A caixa Email exibe o endereço de email da sua account do Databricks. A Dataiku usa este endereço email para solicitar que você crie uma nova account de parceiros ou faça login em sua account de parceiros existente.
Clique em Conectar ao Dataiku ou Entrar.
Uma nova tab é aberta em seu navegador, que exibe o site Dataiku.
Siga as instruções na tela no site da Dataiku para criar sua account de avaliação do Dataiku ou faça login em sua account Dataiku existente.
Conecte-se ao Dataiku manualmente
Esta seção descreve como conectar SQL warehouse clusters manualmente um armazém ou existentes em seu workspace do Databricks ao Dataiku.
Observação
Para armazéns Databricks SQL , você pode se conectar ao Dataiku usando parceiros Connect para simplificar a experiência.
Requisitos
Antes de se conectar ao Dataiku manualmente, você precisa do seguinte:
Um clusters ou SQL warehouse no seu workspace do Databricks.
Os detalhes de conexão para seus clusters ou SQL warehouse, especificamente os valores Server hostname, Port e HTTP Path .
Um site pessoal da Databricks access token. Para criar um access token pessoal, faça o seguinte:
Em seu Databricks workspace, clique em seu nome de usuário Databricks na barra superior e selecione Settings (Configurações ) no menu suspenso.
Clique em Desenvolvedor.
Ao lado do access token, clique em gerenciar.
Clique em Gerar novos tokens.
(Opcional) Insira um comentário que o ajude a identificar esse token no futuro e altere o tempo de vida padrão do token de 90 dias. Para criar um token sem vida útil (não recomendado), deixe a caixa Duração (dias) vazia (em branco).
Clique em Gerar.
Copie o token exibido em um local seguro e clique em Concluído.
Observação
Certifique-se de salvar os tokens copiados em um local seguro. Não compartilhe seus tokens copiados com outras pessoas. Se você perder os tokens copiados, não poderá regenerar exatamente os mesmos tokens. Em vez disso, você deve repetir este procedimento para criar novos tokens. Se você perder os tokens copiados ou acreditar que os tokens foram comprometidos, o Databricks recomenda fortemente que você exclua imediatamente esses tokens do seu workspace clicando no ícone da lixeira (Revogar) ao lado dos tokens na página access tokens .
Se o senhor não conseguir criar ou usar o site tokens no seu workspace, isso pode ocorrer porque o administrador do workspace desativou o tokens ou não lhe deu permissão para criar ou usar o tokens. Consulte o administrador do site workspace ou os tópicos a seguir:
Observação
Como prática recomendada de segurança ao se autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, a Databricks recomenda que você use tokens OAuth.
Se o senhor usar a autenticação pessoal access token, a Databricks recomenda o uso de pessoal access tokens pertencente à entidade de serviço em vez de usuários workspace. Para criar o site tokens para uma entidade de serviço, consulte gerenciar tokens para uma entidade de serviço.
os passos para conectar
Para conectar-se ao Dataiku manualmente, siga Databricks na documentação do Dataiku.