メインコンテンツまでスキップ

Zoho Booksからデータを取り込む

備考

ベータ版

この機能はベータ版です。ワークスペース管理者は、 プレビュー ページからこの機能へのアクセスを制御できます。Databricksのプレビューを管理するを参照してください。

このページでは、Lakeflow Connect を使用してマネージド Zoho Books インジェスト パイプラインを作成する方法について説明します。

要件

  • 取り込みパイプラインを作成するには、まず次の要件を満たす必要があります。

    • ワークスペースでUnity Catalogが有効になっている必要があります。

    • サーバレス コンピュートがワークスペースで有効になっている必要があります。サーバレス コンピュートの要件を参照してください。

    • 新しい接続を作成する予定がある場合は、メタストアに対する CREATE CONNECTION 特権が必要です。Unity Catalog での特権の管理を参照してください。

      コネクタが UI ベースのパイプライン オーサリングをサポートしている場合、管理者はこのページのステップを完了することで、接続とパイプラインを同時に作成できます。 ただし、パイプラインを作成するユーザーが API ベースのパイプライン オーサリングを使用している場合、または管理者以外のユーザーである場合、管理者はまずカタログ エクスプローラーで接続を作成する必要があります。 「管理対象取り込みソースへの接続」を参照してください。

    • 既存の接続を使用する場合:接続オブジェクトに対してUSE CONNECTIONまたはALL PRIVILEGESの権限が必要です。

    • ターゲットカタログに対するUSE CATALOG権限が必要です。

    • 既存のスキーマに対するUSE SCHEMAおよびCREATE TABLE権限、またはターゲットカタログに対するCREATE SCHEMA権限を持っている必要があります。

  • Zoho Booksから取り込むには、まずDatabricksで認証を構成し、接続を作成します。Zoho Booksへの認証を構成するおよびZoho Books接続を作成するを参照してください。

取り込みパイプラインを作成

サポートされているソーステーブルの一覧については、「サポートされているソーステーブル」を参照してください。

  1. Databricksワークスペースのサイドバーで、 データ取り込み をクリックします。
  2. データの追加 ページで、 Databricksコネクタ の下にある Zoho Books をクリックします。
  3. インジェストウィザードの [接続] ページで、Zoho Booksの資格情報を保存する接続を選択します。メタストアでCREATE CONNECTION権限がある場合は、 プラスアイコン。 [接続を作成] をクリックして、Zoho Booksへの認証を構成するにある資格情報で接続を作成します。
  4. 次へ をクリックします。
  5. 「Ingestion setup」ページで、パイプラインの名前を入力します。
  6. イベントログを書き込むカタログとスキーマを選択してください。カタログでUSE CATALOGおよびCREATE SCHEMA権限がある場合は、ドロップダウンメニューの プラスアイコン。 [スキーマを作成] をクリックしてスキーマを作成します。
  7. パイプラインの作成および続行 をクリックします。
  8. **ソース**ページで、取り込むテーブルを選択します。
  9. 保存して続行 をクリックします。
  10. 宛先 ページで、データを取り込むカタログとスキーマを選択します。カタログに対する USE CATALOG および CREATE SCHEMA 権限がある場合は、ドロップダウンメニューの プラスアイコン。 スキーマを作成 をクリックしてスキーマを作成します。
  11. 保存して続行 をクリックします。
  12. (オプション) スケジュールと通知 ページで、 プラスアイコン。 スケジュールを作成 をクリックします。宛先テーブルを更新する頻度を設定します。
  13. (オプション) プラスアイコン。 通知の追加 をクリックして、パイプライン操作の成功または失敗に関するEメール通知を設定し、次に パイプラインを保存して実行 をクリックします。

Zoho Booksコネクタは、 defaultソーススキーマ内の16個のソーステーブルを利用可能にします。個々のテーブルまたはスキーマ全体を取り込みます。

取り込むテーブルを指定する

このオプションを使用して、特定のテーブルのサブセットを取り込むか、テーブルごとに宛先名をカスタマイズします。

次のパイプライン定義ファイルは、個別のZoho Booksテーブルを取り込みます。

YAML
resources:
pipelines:
zoho_books_pipeline:
name: zoho_books_pipeline
catalog: 'main'
target: 'zoho_books_data'
ingestion_definition:
connection_name: zoho_books_connection
objects:
- table:
source_schema: 'default'
source_table: 'invoices'
destination_catalog: 'main'
destination_schema: 'zoho_books_data'
destination_table: 'invoices'
- table:
source_schema: 'default'
source_table: 'bills'
destination_catalog: 'main'
destination_schema: 'zoho_books_data'
destination_table: 'bills'
- table:
source_schema: 'default'
source_table: 'contacts'
destination_catalog: 'main'
destination_schema: 'zoho_books_data'
destination_table: 'contacts'

スキーマ全体を取り込む

このオプションを使用して、すべての Zoho Books ソース テーブルを単一の宛先スキーマに 1 つの宣言で取り込みます。

以下のパイプライン定義ファイルは、サポートされているすべての Zoho Books テーブルを宛先スキーマに取り込みます。

YAML
resources:
pipelines:
zoho_books_pipeline:
name: zoho_books_pipeline
catalog: 'main'
target: 'zoho_books_data'
ingestion_definition:
connection_name: zoho_books_connection
objects:
- schema:
source_schema: 'default'
destination_catalog: 'main'
destination_schema: 'zoho_books_data'

宣言型オートメーションバンドル ジョブ定義ファイル

以下は、宣言型オートメーションバンドルで使用するジョブ定義ファイルの例です。ジョブは毎日実行されます。

YAML
resources:
jobs:
zoho_books_job:
name: zoho_books_job
schedule:
quartz_cron_expression: '0 0 0 * * ?'
timezone_id: 'UTC'
tasks:
- task_key: zoho_books_ingestion
pipeline_task:
pipeline_id: ${resources.pipelines.zoho_books_pipeline.id}

一般的なパターン

高度なパイプライン構成については、「マネージド取り込みパイプラインの一般的なパターン」を参照してください。

次のステップ

パイプラインの開始、スケジュール、アラートを設定する共通パイプラインメンテナンス タスクを参照してください。

その他のリソース