メインコンテンツまでスキップ

Stitchに接続

重要

このドキュメントは廃止されており、更新されない可能性があります。このコンテンツに記載されている製品、サービス、またはテクノロジはサポートされなくなりました。Stitch のドキュメントを参照してください。

Stitch は、さまざまなデータベースや SaaS アプリケーション (Salesforce、Hubspot、Marketo など) のすべてのビジネス データを Delta Lake に統合するのに役立ちます。

DatabricksでStitch使用するためのステップは次のとおりです。

ステップ 1: Databricksの個人アクセス墨を生成する

Stitch 、 Databricksの個人アクセス権を使用してDatabricksで認証します。

注記

自動化されたツール、システム、スクリプト、アプリで認証する際のセキュリティのベストプラクティスとして、DatabricksではOAuth トークンを使用することをお勧めします。

パーソナルアクセストークン認証 を使用する場合、 Databricks では、ワークスペース ユーザーではなく、サービスプリンシパル に属する パーソナルアクセストークン を使用することをお勧めします。 サービスプリンシパルのトークンを作成するには、「 サービスプリンシパルのトークンの管理」を参照してください。

ステップ 2: 統合のニーズをサポートするためのクラスターを設定する

Stitch は S3 バケットにデータを書き込み、 Databricks 統合クラスターはその場所からデータを読み取ります。 したがって、統合クラスターには、 S3 バケットへの安全なアクセスが必要です。

S3バケットへの安全なアクセス

AWSリソースにアクセスするには、インスタンスプロファイルを使用してDatabricks統合クラスターを起動します。インスタンスプロファイルは、ステージング S3 バケットと、Delta テーブルを書き込むターゲット S3 バケットにアクセスできる必要があります。 インスタンスプロファイルを作成し、ロールを使用するように統合クラスターを設定するには、 チュートリアル: インスタンスプロファイルを使用した S3 アクセスの設定の手順に従います。

別の方法として、 IAM 資格情報パススルーを使用して、共有クラスターから S3 データへのユーザー固有のアクセスを有効にすることもできます。

クラスター構成の指定

  1. クラスターモード標準 に設定します。

  2. Databricks Runtimeバージョン をRuntime : 6.3 以上に設定します。

  3. 最適化された書き込みと自動圧縮を有効にするには、次のプロパティをSpark 構成に追加します。

    ini
    spark.databricks.delta.optimizeWrite.enabled true
    spark.databricks.delta.autoCompact.enabled true
  4. クラスターは、統合とスケーリングのニーズに応じて構成します。

クラスター構成の詳細については、 コンピュート構成リファレンスを参照してください。

JDBCのURL と HTTP パスを取得する手順については、「 Databricksコンピュート リソースの接続の詳細を取得する 」を参照してください。

ステップ 3: DatabricksでStitchを構成する

Stitchログイン ページに移動し、指示に従います。

追加のリソース

サポート