Matillion に接続する
Matillion ETLは、Databricksを含むクラウドデータベースプラットフォーム用に特別に構築されたETL / ELTツールです。 Matillion ETLは、強力なプッシュダウンETL / ELT機能を備えた、最新のブラウザベースのUIを備えています。
Databricks SQLウェアハウス (以前の Databricks SQLエンドポイント) と Databricks クラスターを Matillion と統合できます。
Partner Connect を使用してMatillionに接続する
このセクションでは、 Partner Connect を使用して、Databricks ワークスペース内の既存の SQLウェアハウスまたはクラスターを Matillion に接続するプロセスを簡略化する方法について説明します。
要件
PartnerConnect を使用する ための要件 を参照してください。
接続するステップ
Partner Connectを使用してMatillionに接続するには、このセクションの手順に従ってください。
ヒント
既存のMatillionアカウントをお持ちの場合は Databricks 、手動でMatillionに接続することをお勧めします。 これは、 Partner Connect の接続エクスペリエンスが新しいパートナー アカウント用に最適化されているためです。
サイドバーで、「 Partner Connect 」をクリックします 。
[Matillion] タイルをクリックします。
[Eメール] ボックスには、Databricks アカウントの Eメール アドレスが表示されます。MatillionはこのEメールアドレスを使用して、新しいMatillionアカウントを作成するか、既存のMatillionアカウントにサインインするように求めます。
[ Matillion ETL に接続 ] または [ サインイン] をクリックします。
ブラウザに新しいタブが開き、Matillionハブが表示されます。
Matillionの画面の指示に従って、14日間のトライアルMatillionアカウントを作成するか、既存のMatillionアカウントにサインインします。
重要
組織の誰かがすでにMatillionのアカウントを作成しているというエラーが表示された場合は、組織の管理者の1人に連絡し、組織のMatillionアカウントに追加してもらいます。 彼らがあなたを追加したら、既存のMatillionアカウントにサインインします。
画面の指示に従ってジョブの詳細を入力し、[ 続行]をクリックします。
画面の指示に従って組織を作成し、[ 続行]をクリックします。
作成した組織をクリックし、[ Matillion ETL インスタンスの追加] をクリックします。
[ AWS で続行] をクリックします。
Amazon EC2 コンソールが開きます。
ステップ 5 から始まる Matillion ETL ドキュメントの「Amazon Machine Image を使用した Matillion ETL の起動 」に従ってください。次に、Matillion ETL ドキュメントの 「アマゾン ウェブ サービス (EC2) での Matillion ETL へのアクセス」 に従ってください。
Matillion ETL ドキュメントの指示に従ってください。
ブラウザーで Matillion ETL が開き、[ プロジェクトの作成 ] ダイアログ ボックスが表示されます。
Matillion ドキュメントの「Databricks プロジェクトで Delta Lake を作成する 」に従ってください。
これらの手順の [ Delta Lake 接続 ] セクションの設定については、次の情報を入力します。
[ワークスペース ID] に、Databricks ワークスペースの ID を入力します。「ワークスペースのインスタンス名、URL、および ID」を参照してください。
[ユーザー名] に「
token
」と入力します。[パスワード] に、Databricks 個人用アクセス トークンの値を入力します。
ワークスペース ID を取得して個人用アクセストークンを生成するには、次の手順を実行します。
ブラウザの [ Partner Connect ] タブに戻ります。
ワークスペース ID をメモします。
[ 新しいトークンの生成] をクリックします。
ブラウザに新しいタブが開き、Databricks UI の設定ページが表示されます。
[ 新しいトークンの生成] をクリックします。
必要に応じて、説明 (コメント) と有効期限を入力します。
[ 生成] をクリックします。
生成された個人用アクセストークンをコピーし、安全な場所に保存します。
ブラウザの[Matillion]タブに戻ります。
これらの手順の [Delta Lake デフォルト ] セクションの [クラスター] の設定では、SQLウェアハウスまたは クラスターの名前を選択します。
「次のステップ」に進みます。
Matillionに手動で接続する
このセクションでは、Databricks ワークスペース内の既存の SQLウェアハウスまたはクラスターを Matillion に手動で接続する方法について説明します。
注
Partner Connect を使用してMatillionに接続して、エクスペリエンスを簡素化できます。
要件
Matillionと手動で統合する前に、次のものが必要です。
Matillion ETL インスタンスは、AWS CloudFormation、 Amazon Machine Image (AMI)、または AWS Marketplace を使用して起動できます。
A Databricks personal accesstoken です。
注
自動化されたツール、システム、スクリプト、アプリを使用して認証する場合のセキュリティのベスト プラクティスとして、Databricks ではOAuth トークンを使用することをお勧めします。
個人のアクセス トークン認証を使用する場合、 Databricksでは、ワークスペース ユーザーではなく、サービスプリンシパルに属する個人のアクセス トークンを使用することをお勧めします。 サービスプリンシパルのトークンを作成するには、 「サービスプリンシパルのトークンの管理」を参照してください。
接続するステップ
Matillionに手動で接続するには、次の手順を実行します。
ワークスペース内で使用する既存のコンピュート リソース (SQLウェアハウスまたはクラスター) の名前を取得します。 後でその名前を選択して、コンピュート リソースと Matillion ETL インスタンス間の接続を完了します。
ワークスペースで SQLwarehouse を表示するには、サイドバーのSQLウェアハウス。 新しい SQL ウェアハウスを作成するには、 「SQL ウェアハウスの作成」を参照してください。
ワークスペース内のクラスターを表示するには、サイドバーのコンピュート。 クラスターを作成するには、 「コンピュート構成リファレンス」を参照してください。
Matillion ETL インスタンスに接続し、Matillion の ドキュメントでログインするに従ってください。
Matillion ドキュメントの「Databricks プロジェクトで Delta Lake を作成する 」に従ってください。
これらの手順の [ Delta Lake 接続 ] セクションの設定については、次の情報を入力します。
[ワークスペース ID] に、Databricks ワークスペースの ID を入力します。「ワークスペースのインスタンス名、URL、および ID」を参照してください。
[ユーザー名] に「
token
」と入力します。[パスワード] に、Databricks の個人用アクセストークンを入力します。
これらの手順の [Delta Lake デフォルト ] セクションの [クラスター] の設定では、SQLウェアハウスまたは クラスターの名前を選択します。
「次のステップ」に進みます。