メインコンテンツまでスキップ

Google スプレッドシートでデータ更新をスケジュールする

備考

プレビュー

この機能は パブリック プレビュー段階です。

このページでは、インポートしたデータを最新の状態に保つために、 Google Sheets 用 Databricks コネクタ で自動データ更新をスケジュールする方法について説明します。スケジュールされた更新では、保存されたクエリが定期的に実行され、対応するシートが更新されます。

要件

Unity Catalog接続を作成する

メタストア管理者は、まず Google スプレッドシートで接続を作成し、Google スプレッドシートでスケジュールされた更新を作成するユーザーにアクセス権を付与する必要があります。スケジュールされた更新にはUnity Catalog内のdatabricks_google_connectionと呼ばれる接続が必要です。

  1. Databricks メタストア管理者として、Google スプレッドシートで、Google スプレッドシート用 Databricks コネクタ サイドバーを起動します。
  2. [インポート] タブをクリックします。
  3. 右上のカレンダーをクリックします。
  4. [接続の設定] をクリックします。
  5. 接続に対するMANAGE権限を持つユーザーは、スケジュールされた更新を作成または管理するユーザーにUSE CONNECTION権限を付与する必要があります。接続の管理の詳細については、 「レイクハウスフェデレーションの接続の管理」を参照してください。

スケジュールを作成する

各インポートは 1 つのスケジュールにのみ割り当てることができます。既存のインポートに新しいスケジュールを作成するには:

  1. Google スプレッドシートの Databricks コネクタ サイドバーで、 [インポート] タブをクリックします。

  2. カレンダーアイコンをクリックし、 [新しいスケジュール] をクリックします。

  3. スケジュールを作成するインポートを選択します。

  4. スケジュールの名前を入力します。

  5. スケジュールの 頻度 を選択します:

    • 「時間別」 の場合は、更新を実行する時間(分)を選択します。
    • 「毎日」 の場合は、更新を実行する時刻を選択します。
    • 毎週 の場合は、更新を実行する曜日と時刻を選択します。

    スケジュールではローカルタイムゾーンが使用されます。

  6. スケジュールされたクエリに使用するSQLウェアハウスを選択します。

  7. [スケジュールの作成] をクリックします。

スケジュールを管理する

スケジュールされた更新を表示または削除するには、次の手順を実行します。

  1. Google スプレッドシートの Databricks コネクタ サイドバーで、 [インポート] タブをクリックします。
  2. カレンダーアイコンをクリックし、 スケジュールの管理を クリックします。
  3. スケジュールを選択すると、含まれるクエリやスケジュール構成などのスケジュールの詳細が表示されます。
    • 他のユーザーが作成したスケジュールを表示している場合、表示される時間は作成者のローカルタイムゾーンの時間になります。
    • スケジュールを削除するには、 [削除] をクリックします。

制限事項

  • スケジュールされた更新は編集できません。既存のスケジュールを表示または削除することのみ可能です。スケジュールを変更するには、スケジュールを削除して新しいスケジュールを作成します。
  • スケジュールに含まれているクエリを編集する場合は、スケジュールを削除し、更新されたクエリでスケジュールを再作成して、スケジュールが更新されたクエリ テキストを使用するようにする必要があります。
  • ピボット テーブルの更新をスケジュールすることはできません。Google API は生のクエリ データのみを更新し、クエリ結果のスキーマが変更されてもピボット構成を変更することはできません。