Dataiku に接続する

Dataikuは、データ準備、AutoML、MLOpsのためのエンドツーエンドのAIプラットフォームです。 Databricks SQLウェアハウス クラスターと Databricks クラスターを Dataiku と統合できます。

Partner Connect を使用して Dataiku に接続する

注:

Partner Connect は Dataiku の SQLウェアハウスのみをサポートしています。 クラスターをデータイクに接続するには、手動でデータイクに接続します。

Partner Connectを使用して Databricks ワークスペースを Dataiku に接続するには、次の手順を実行します。

  1. サイドバーで、「 」をクリックしますPartner ConnectボタンPartner Connect

  2. パートナー タイルをクリックします。

    注:

    Dataikuタイルの内部にチェックマークアイコンがある場合、管理者は既に Partner Connect を使用してDataikuをワークスペースに接続しています。 ステップ 5 にスキップして下さい。 パートナーは、Databricks アカウントの電子メール アドレスを使用して、既存の Dataiku アカウントにサインインするように求めます。

  3. ドロップダウン リストからカタログを選択し、[ 次へ] をクリックします。

    注:

    ワークスペースがUnity Catalog 対応であるが、パートナーがUnity Catalog を使用したPartner Connect をサポートしていない場合は、ワークスペースの既定のカタログが使用されます。ワークスペースが Unity Catalogに対応していない場合は、 hive_metastore が使用されます。

  4. ドロップダウン リストからスキーマを選択し、[ 追加] をクリックします。 この手順を繰り返して、複数のスキーマを追加できます。

  5. 次へ」をクリックします。

    Partner Connect によって、ワークスペースに次のリソースが作成されます。

    Partner Connect は、 <PARTNER>_USER サービスプリンシパルに次の権限も付与します。

    • (Unity Catalog)USE CATALOG: 選択したカタログ内のオブジェクトを操作するために必要です。

    • (Unity Catalog) USE SCHEMA: 選択したスキーマを読み取る機能を付与します。

    • (Unity Catalog)CREATE SCHEMA: 選択したカタログにスキーマを作成する機能を付与します。

    • (レガシーHive metastore ) USAGE: hive_metastore 内のオブジェクトおよび選択したスキーマと対話するために必要です。

    • (Legacy Hive metastore ) CREATE: hive_metastore にスキーマを作成する機能を付与します。

    • (レガシー Hive metastore) READ_METADATA: 選択したスキーマのメタデータを読み取る権限を付与します。

    • (レガシー Hive metastore) SELECT: 選択したスキーマを読み取る権限を付与します。

  6. 次へ」をクリックします。

    [電子メール] ボックスには、Databricks アカウントの電子メール アドレスが表示されます。DataikuはこのEメールアドレスを使用して、新しいパートナーアカウントを作成するか、既存のパートナーアカウントにサインインするように求めます。

  7. [データに接続] または [サインイン] をクリックします。

    ウェブブラウザに新しいタブが開き、Dataikuのウェブサイトが表示されます。

  8. Dataikuウェブサイトの画面の指示に従って、試用版のDataikuアカウントを作成するか、既存のDataikuアカウントにサインインします。

データに手動で接続する

このセクションでは、Databricks ワークスペース内の既存の SQLウェアハウスまたはクラスターを Dataiku に手動で接続する方法について説明します。

注:

Databricks SQLウェアハウスの場合、 Partner Connect を使用してDataikuに接続し、エクスペリエンスを簡素化できます。

要件

Dataikuに手動で接続する前に、次のものが必要です。

  • Databricks ワークスペース内のクラスターまたは SQLウェアハウス。

  • クラスターまたは SQLウェアハウス の接続の詳細 (具体的には、 サーバーのホスト名ポートおよび HTTP パス の値)。

  • Databricksの個人的なアクセス権。 個人的なアクセスウイルスを作成するには、次の手順を実行します。

    1. Databricks ワークスペースで、上部のバーにある Databricks ユーザー名をクリックし、ドロップダウンから[設定]を選択します。

    2. [ 開発者] をクリックします。

    3. [アクセストークン] の横にある [管理] をクリックします。

    4. [ 新しいトークンの生成] をクリックします。

    5. (任意)今後このトークンを識別するのに役立つコメントを入力し、トークンのデフォルトの有効期間である90日を変更します。有効期間のないトークンを作成するには(非推奨)、[有効期間 (日) ] ボックスを空白のままにしてください。

    6. [生成] をクリックします。

    7. 表示されたトークンを安全な場所にコピーし、[完了] をクリックします。

    注:

    コピーしたトークンは、必ず安全な場所に保存してください。 コピーしたトークンを他のユーザーと共有しないでください。 コピーしたトークンを紛失した場合、まったく同じトークンを再生成することはできません。 代わりに、この手順を繰り返して新しいトークンを作成する必要があります。 コピーしたトークンを紛失した場合、またはトークンが侵害されたと思われる場合は、アクセストークン ページでトークンの横にあるごみ箱 (取り消し) アイコンをクリックして、ワークスペースからそのトークンをすぐに削除することを強くお勧めします。

    ワークスペースでトークンを作成または使用できない場合は、ワークスペース管理者がトークンを無効にしたか、トークンを作成または使用する権限を与えていないことが原因である可能性があります。ワークスペース管理者に問い合わせるか、以下をご覧ください。

    注:

    自動化されたツール、システム、スクリプト、アプリを使用して認証する場合のセキュリティのベスト プラクティスとして、Databricks ではOAuth トークンを使用することをお勧めします。

    個人のアクセス トークン認証を使用する場合、 Databricksでは、ワークスペース ユーザーではなく、サービスプリンシパルに属する個人のアクセス トークンを使用することをお勧めします。 サービスプリンシパルのトークンを作成するには、 「サービスプリンシパルのトークンの管理」を参照してください。

接続するステップ

Dataiku に手動で接続するには、Dataiku のドキュメントの Databricks に従ってください。

関連リソース

次の Dataiku リソースを探索します。