Conecte-se ao Dataiku

Dataiku é uma plataforma de IA ponta a ponta para preparação de dados, AutoML e MLOps. Você pode integrar seus armazéns Databricks SQL e clusters do Databricks com o Dataiku.

Conecte-se ao Dataiku usando parceiros Connect

Observação

parceiros Connect suporta apenas SQL warehouse para Dataiku. Para conectar clusters ao Dataiku, conecte-se ao Dataiku manualmente.

Para conectar seu espaço de trabalho do Databricks ao Dataiku usando parceiros Connect, faça o seguinte:

  1. Na barra lateral, clique em Botão Partner Connect parceiros Conecte-se.

  2. Clique no bloco parceiros.

    Observação

    Se o bloco do Dataiku tiver um ícone de marca de seleção dentro dele, um administrador já usou parceiros Connect para conectar o Dataiku ao seu workspace. Pule para o passo 5. Os parceiros usam o endereço de e-mail da sua account Databricks para solicitar que você faça login na sua account Dataiku existente.

  3. Selecione um catálogo na lista suspensa e clique em Avançar.

    Observação

    Se o seu workspace estiver habilitado para Unity Catalog, mas os parceiros não oferecerem suporte Unity Catalog com Partner Connect, o catálogo default workspace será usado. Se seu workspace não for habilitado para Unity Catalog, hive_metastore será usado.

  4. Selecione um esquema na lista suspensa e clique em Adicionar. Você pode repetir este passo para adicionar vários esquemas.

  5. Clique em Avançar.

    Partner Connect cria os seguintes recursos em seu workspace:

    O parceiro Connect também concede os seguintes privilégios à <PARTNER>_USER entidade de serviço:

    • (Catálogo Unity)USE CATALOG: Necessário para interagir com objetos no catálogo selecionado.

    • (Unity Catalog) USE SCHEMA: Concede a capacidade de ler os esquemas que o senhor selecionou.

    • (Unity Catalog)CREATE SCHEMA: Concede a capacidade de criar esquemas no catálogo selecionado.

    • (Legado Hive metastore) USAGE: Necessário para interagir com objetos em hive_metastore e com os esquemas selecionados.

    • (Legado Hive metastore) CREATE: Concede a capacidade de criar um esquema em hive_metastore.

    • ( Hive metastore) READ_METADATA: concede a capacidade de ler metadados para os esquemas selecionados.

    • ( Hive metastore) SELECT: concede a capacidade de ler os esquemas selecionados.

  6. Clique em Avançar.

    A caixa Email exibe o endereço de email da sua account do Databricks. A Dataiku usa este endereço email para solicitar que você crie uma nova account de parceiros ou faça login em sua account de parceiros existente.

  7. Clique em Conectar ao Dataiku ou Entrar.

    Uma nova tab é aberta em seu navegador, que exibe o site Dataiku.

  8. Siga as instruções na tela no site da Dataiku para criar sua account de avaliação do Dataiku ou faça login em sua account Dataiku existente.

Conecte-se ao Dataiku manualmente

Esta seção descreve como conectar SQL warehouse clusters manualmente um armazém ou existentes em seu workspace do Databricks ao Dataiku.

Observação

Para armazéns Databricks SQL , você pode se conectar ao Dataiku usando parceiros Connect para simplificar a experiência.

Requisitos

Antes de se conectar ao Dataiku manualmente, você precisa do seguinte:

  • Um clusters ou SQL warehouse no seu workspace do Databricks.

  • Os detalhes de conexão para seus clusters ou SQL warehouse, especificamente os valores Server hostname, Port e HTTP Path .

  • Um site pessoal da Databricks access token. Para criar um access token pessoal, faça o seguinte:

    1. No workspace do Databricks, clique no nome de usuário do Databricks na barra superior e selecione Configurações do usuário na lista suspensa.

    2. Clique em Desenvolvedor.

    3. Ao lado do access token, clique em gerenciar.

    4. Clique em Gerar novos tokens.

    5. (Opcional) Insira um comentário que o ajude a identificar esse token no futuro e altere o tempo de vida padrão do token de 90 dias. Para criar um token sem vida útil (não recomendado), deixe a caixa Duração (dias) vazia (em branco).

    6. Clique em Gerar.

    7. Copie o token exibido em um local seguro e clique em Concluído.

    Observação

    Certifique-se de salvar os tokens copiados em um local seguro. Não compartilhe seus tokens copiados com outras pessoas. Se você perder os tokens copiados, não poderá regenerar exatamente os mesmos tokens. Em vez disso, você deve repetir este procedimento para criar novos tokens. Se você perder os tokens copiados ou acreditar que os tokens foram comprometidos, o Databricks recomenda fortemente que você exclua imediatamente esses tokens do seu workspace clicando no ícone da lixeira (Revogar) ao lado dos tokens na página access tokens .

    Se não for possível criar ou usar tokens no seu workspace, isso pode ocorrer porque o administrador do workspace desativou os tokens ou não lhe deu permissão para criar ou usar tokens. Consulte o administrador do workspace ou o seguinte:

    Observação

    Como prática recomendada de segurança ao se autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, a Databricks recomenda que você use tokens OAuth.

    Se utilizar a autenticação access token pessoal, a Databricks recomenda a utilização access token pessoal pertencente à entidade de serviço em vez de utilizadores workspace . Para criar tokens para entidades de serviço, consulte gerenciar tokens para uma entidade de serviço.

os passos para conectar

Para conectar-se ao Dataiku manualmente, siga Databricks na documentação do Dataiku.

Recursos adicionais

Explore o seguinte recurso Dataiku: