Dataiku に接続する
Dataikuは、データ準備、AutoML、MLOpsのためのエンドツーエンドのAIプラットフォームです。 Databricks SQL ウェアハウスと Databricks クラスターを Dataikuと統合できます。
Partner Connect を使用して Dataiku に接続する
Partner ConnectはSQL Dataiku用の ウェアハウスのみをサポートしています。クラスターを Dataikuに接続するには、手動で Dataiku に接続します。
Partner Connect を使用して Databricks ワークスペースを Dataiku に接続するには、次の操作を行います。
-
サイドバーで、
Marketplace をクリックします。
-
Partner Connect 統合で 、[ すべて表示 ] をクリックします。
-
パートナー タイルをクリックします。
Dataiku タイル内にチェック マーク アイコンが表示されている場合、管理者は既に Partner Connect を使用して Dataiku をワークスペースに接続しています。 ステップ 5 に進みます。 パートナーは、 Databricks アカウントのEメールアドレスを使用して、既存の Dataiku アカウントへのサインインを求めます。
- ドロップダウンリストからカタログを選択し、[ 次へ ] をクリックします。
ワークスペースが Unity Catalog対応であるが、パートナーが Partner Connect を使用した Unity Catalogをサポートしていない場合は、ワークスペースのデフォルト カタログが使用されます。ワークスペースが Unity Catalogに対応していない場合は、 hive_metastore
が使用されます。
-
ドロップダウンリストからスキーマを選択し、[ 追加 ] をクリックします。 この手順を繰り返して、複数のスキーマを追加できます。
-
「 次へ 」をクリックします。
Partner Connect は、ワークスペースに次のリソースを作成します。
- Databricksという名前の サービスプリンシパル
<PARTNER>_USER
。 - Databricksサービスプリンシパルに関連付けられている
<PARTNER>_USER
個人用アクセス トークン 。
また、Partner Connect は、
<PARTNER>_USER
サービスプリンシパルに次の権限を付与します。- (Unity Catalog)
USE CATALOG
: 選択したカタログ内のオブジェクトを操作するために必要です。 - (Unity Catalog)
USE SCHEMA
: 選択したスキーマを読み取る権限を付与します。 - (Unity Catalog)
CREATE SCHEMA
: 選択したカタログにスキーマを作成する権限を付与します。 - (レガシー Hive metastore)
USAGE
:hive_metastore
内のオブジェクトおよび選択したスキーマと対話するために必要です。 - (Legacy Hive metastore)
CREATE
:hive_metastore
でスキーマを作成する権限を付与します。 - (レガシー Hive metastore) READ_METADATA : 選択したスキーマのメタデータを読み取る権限を付与します。
- (レガシー Hive metastore) SELECT: 選択したスキーマを読み取る権限を付与します。
- Databricksという名前の サービスプリンシパル
-
「 次へ 」をクリックします。
[Eメール (Eメール )] ボックスには、Databricks アカウントの Eメール アドレスが表示されます。Dataiku は、この Eメール アドレスを使用して、新しいパートナー アカウントを作成するか、既存のパートナー アカウントにサインインするように求めます。
-
[ Connect to Dataiku ] または [Sign in ] をクリックします。
Webブラウザーで新しいタブが開き、DataikuのWebサイトが表示されます。
-
Dataiku の Web サイトの画面に表示される指示を完了して、試用版の Dataiku アカウントを作成するか、既存の Dataiku アカウントにサインインします。
Dataiku に手動で接続する
このセクションでは、SQL Databricksワークスペース内の既存の ウェアハウスまたはクラスターを手動Dataiku に接続する方法について説明します。
Databricks SQL ウェアハウスの場合、Partner Connect を使用して Dataiku に接続し、エクスペリエンスを簡素化できます。
必要条件
Dataiku に手動で接続する前に、次のものが必要です。
-
ワークスペース内のクラスターまたはSQL ウェアハウス。Databricks
-
クラスターまたはウェアハウス SQL接続の詳細、特に [Server Hostname ]、[ Port ]、 および [HTTP Path ] の値。
-
Databricks 個人用アクセス トークン。 個人用アクセス トークンを作成するには、「ワークスペース ユーザー向けの個人用アクセス トークンDatabricks」の手順に従います。
セキュリティのベストプラクティスとして、自動化されたツール、システム、スクリプト、アプリで認証する場合、Databricks では、ワークスペースユーザーではなく 、サービスプリンシパル に属する個人用アクセストークンを使用することをお勧めします。 サービスプリンシパルのトークンを作成するには、「 サービスプリンシパルのトークンの管理」を参照してください。
接続手順
Dataiku に手動で接続するには、Dataiku のドキュメントの Databricks に従ってください。
追加のリソース
次の Dataiku リソースをご覧ください。