Matillion Data Productivity クラウドに接続する
Matillion Data Productivity Cloud は、 Databricksなどのクラウド データベース プラットフォーム専用に構築されたETL /ELT ツールです。 Matillion Data Productivity Cloud には、強力なプッシュダウンETL /ELT 機能を備えた最新のブラウザベースの UI が備わっています。
Databricks SQL ウェアハウス (旧称 Databricks SQL エンドポイント) と Databricks クラスターを Matillionと統合できます。
Partner Connectを使用してMatillionに接続する
このセクションでは、Partner Connect SQLDatabricksMatillionを使用して、 ワークスペース内の既存の ウェアハウスまたはクラスターを に接続するプロセスを簡素化する方法について説明します。
必要条件
Partner Connect を使用するための 要件 を参照してください。
接続手順
Partner Connectを使用してMatillionに接続するには、このセクションの手順に従います。
-
サイドバーで、
Marketplace をクリックします。
-
Partner Connect 統合で 、[ すべて表示 ] をクリックします。
-
Matillion Data Productivity クラウド タイルをクリックします。
-
Matillion が書き込む Databricks カタログを選択し、 [次へ] をクリックします。
-
Matillion で使用する既存の Databricks SQL ウェアハウスを選択します。このコンピュート リソースは、パイプラインを実行するために使用されます。
-
Matillionデータパイプラインの作成と管理に使用するスキーマを選択します。 [追加]を クリックします。
-
次へ をクリックします。
-
接続情報を確認し、 「次へ」 をクリックします。
-
Partner Connect使用条件を確認して同意し、 Matillion Data Productivity クラウドに接続」 をクリックします。
-
Matillion Data Productivity クラウド ページがロードされます。 画面上の指示に従って 14 日間の試用アカウントを作成するか、既存の Matillion アカウントにサインインしてください。
Matillion が必要なインフラストラクチャを作成し、Databricks 環境に安全に接続するには数分かかる場合があります。
-
Matillion がセットアップ プロセスを完了すると、Designer が読み込まれます。
「デザイナー」ページが表示されていない場合は、Databricks に戻り、Matillion に再度サインインします。
Matillionを使い始める
セットアップが完了すると、デザイナーが表示され、データパイプラインの構築を開始できます。 パイプラインは、Data Productivity Cloud がワークフローを設計、編成、実行する方法です。
Databricks ワークスペースが Matillion に接続されていることを確認するには、次の点を確認します。
- 左上に Databricks ロゴがあるデフォルトのプロジェクト。
- 環境は、Databricks の用語を使用して名前が付けられます。
- 左上の [スキーマ] を クリックすると、パネルが開き、Databricks で選択したスキーマがテーブルやビューとともに表示されます。
スキーマの内容を調べて、Matillion が Databricks ワークスペースに正常に接続されていることを確認します。
Databricks に接続されていることを確認したら、Matillion でパイプラインの作成を開始します。
- 最初のオーケストレーション パイプラインを作成して、ソースから Databricks にデータを移動します。
- 最初の変換パイプラインを作成して、Databricks 内に既に存在するデータを直接整形、クリーンアップ、準備します。
- ビジュアル デザイナーを使用して、ドラッグ アンド ドロップ キャンバス インターフェイスでデータ ワークフローを構築します。
次のステップ
Matillion の Web サイトで、次のリソースの 1 つ以上を調べてください。