Dataiku に接続する
Dataikuは、データ準備、Mosaic AutoML、MLOpsのためのエンドツーエンドのAIプラットフォームです。 Databricks SQL ウェアハウスと Databricks クラスターを Dataiku と統合できます。
Partner Connect を使用して Dataiku に接続する
注:
Partner Connect は Dataiku の SQLウェアハウスのみをサポートしています。 クラスターをデータイクに接続するには、手動でデータイクに接続します。
Partner Connectを使用して Databricks ワークスペースを Dataiku に接続するには、次の手順を実行します。
サイドバーで、「 」をクリックしますPartner Connect 。
パートナー タイルをクリックします。
注:
Dataikuタイルの内部にチェックマークアイコンがある場合、管理者は既に Partner Connect を使用してDataikuをワークスペースに接続しています。 ステップ 5 にスキップして下さい。 パートナーは、Databricks アカウントの電子メール アドレスを使用して、既存の Dataiku アカウントにサインインするように求めます。
ドロップダウン リストからカタログを選択し、[ 次へ] をクリックします。
注:
ワークスペースがUnity Catalog 対応であるが、パートナーがUnity Catalog を使用したPartner Connect をサポートしていない場合は、ワークスペースの既定のカタログが使用されます。ワークスペースが Unity Catalogに対応していない場合は、
hive_metastore
が使用されます。ドロップダウン リストからスキーマを選択し、[ 追加] をクリックします。 この手順を繰り返して、複数のスキーマを追加できます。
「次へ」をクリックします。
Partner Connect によって、ワークスペースに次のリソースが作成されます。
Databricksという名前の サービスプリンシパル
<PARTNER>_USER
。Databricksサービスプリンシパルに関連付けられている
<PARTNER>_USER
個人用アクセストークン 。
Partner Connect は、
<PARTNER>_USER
サービスプリンシパルに次の権限も付与します。(Unity Catalog)
USE CATALOG
: 選択したカタログ内のオブジェクトを操作するために必要です。(Unity Catalog)
USE SCHEMA
: 選択したスキーマを読み取る機能を付与します。(Unity Catalog)
CREATE SCHEMA
: 選択したカタログにスキーマを作成する機能を付与します。(レガシーHive metastore )
USAGE
:hive_metastore
内のオブジェクトおよび選択したスキーマと対話するために必要です。(Legacy Hive metastore )
CREATE
:hive_metastore
にスキーマを作成する機能を付与します。(レガシー Hive metastore) READ_METADATA: 選択したスキーマのメタデータを読み取る権限を付与します。
(レガシー Hive metastore) SELECT: 選択したスキーマを読み取る権限を付与します。
「次へ」をクリックします。
[電子メール] ボックスには、Databricks アカウントの電子メール アドレスが表示されます。DataikuはこのEメールアドレスを使用して、新しいパートナーアカウントを作成するか、既存のパートナーアカウントにサインインするように求めます。
[データに接続] または [サインイン] をクリックします。
ウェブブラウザに新しいタブが開き、Dataikuのウェブサイトが表示されます。
Dataikuウェブサイトの画面の指示に従って、試用版のDataikuアカウントを作成するか、既存のDataikuアカウントにサインインします。
データに手動で接続する
このセクションでは、Databricks ワークスペース内の既存の SQLウェアハウスまたはクラスターを Dataiku に手動で接続する方法について説明します。
注:
Databricks SQLウェアハウスの場合、 Partner Connect を使用してDataikuに接続し、エクスペリエンスを簡素化できます。
要件
Dataikuに手動で接続する前に、次のものが必要です。
Databricks ワークスペース内のクラスターまたは SQLウェアハウス。
クラスターまたは SQLウェアハウス の接続の詳細 (具体的には、 サーバーのホスト名、 ポート、 および HTTP パス の値)。
Databricksの個人アクセストークン。 個人アクセストークンを作成するには、次の手順を実行します。
Databricks ワークスペースで、上部のバーにある Databricks ユーザー名をクリックし、ドロップダウンから[設定]を選択します。
[ 開発者] をクリックします。
[アクセストークン] の横にある [管理] をクリックします。
[ 新しいトークンの生成] をクリックします。
(任意)今後このトークンを識別するのに役立つコメントを入力し、トークンのデフォルトの有効期間である90日を変更します。有効期間のないトークンを作成するには(非推奨)、[有効期間 (日) ] ボックスを空白のままにしてください。
[生成] をクリックします。
表示されたトークンを安全な場所にコピーし、[完了] をクリックします。
注:
コピーしたトークンは、必ず安全な場所に保存してください。 コピーしたトークンを他のユーザーと共有しないでください。 コピーしたトークンを紛失した場合、まったく同じトークンを再生成することはできません。 代わりに、この手順を繰り返して新しいトークンを作成する必要があります。 コピーしたトークンを紛失した場合、またはトークンが侵害されたと思われる場合は、アクセストークン ページでトークンの横にあるごみ箱 (取り消し) アイコンをクリックして、ワークスペースからそのトークンをすぐに削除することを強くお勧めします。
ワークスペースでトークンを作成または使用できない場合は、ワークスペース管理者がトークンを無効にしているか、トークンを作成または使用する権限を付与していない可能性があります。 ワークスペース管理者または次のトピックを参照してください。
注:
自動化されたツール、システム、スクリプト、アプリを使用して認証する場合のセキュリティのベスト プラクティスとして、Databricks ではOAuth トークンを使用することをお勧めします。
個人のアクセス トークン認証を使用する場合、 Databricksでは、ワークスペース ユーザーではなく、サービスプリンシパルに属する個人のアクセス トークンを使用することをお勧めします。 サービスプリンシパルのトークンを作成するには、 「サービスプリンシパルのトークンの管理」を参照してください。
接続するステップ
Dataiku に手動で接続するには、Dataiku のドキュメントの Databricks に従ってください。