Google スプレッドシートでデータ更新をスケジュールする
備考
プレビュー
この機能は パブリック プレビュー段階です。
このページでは、インポートしたデータを最新の状態に保つために、 Google Sheets 用 Databricks コネクタ で自動データ更新をスケジュールする方法について説明します。スケジュールされた更新では、保存されたクエリが定期的に実行され、対応するシートが更新されます。
要件
Unity Catalog接続を作成する
メタストア管理者は、まず Google スプレッドシートで接続を作成し、Google スプレッドシートでスケジュールされた更新を作成するユーザーにアクセス権を付与する必要があります。スケジュールされた更新にはUnity Catalog内のdatabricks_google_connectionと呼ばれる接続が必要です。
- Databricks メタストア管理者として、Google スプレッドシートで、Google スプレッドシート用 Databricks コネクタ サイドバーを起動します。
- [インポート] タブをクリックします。
- 右上のカレンダーをクリックします。
- [接続の設定] をクリックします。
- 接続に対する
MANAGE権限を持つユーザーは、スケジュールされた更新を作成または管理するユーザーにUSE CONNECTION権限を付与する必要があります。接続の管理の詳細については、 「レイクハウスフェデレーションの接続の管理」を参照してください。
スケジュールを作成する
各インポートは 1 つのスケジュールにのみ割り当てることができます。既存のインポートに新しいスケジュールを作成するには:
-
Google スプレッドシートの Databricks コネクタ サイドバーで、 [インポート] タブをクリックします。
-
カレンダーアイコンをクリックし、 [新しいスケジュール] をクリックします。
-
スケジュールを作成するインポートを選択します。
-
スケジュールの名前を入力します。
-
スケジュールの 頻度 を選択します:
- 「時間別」 の場合は、更新を実行する時間(分)を選択します。
- 「毎日」 の場合は、更新を実行する時刻を選択します。
- 毎週 の場合は、更新を実行する曜日と時刻を選択します。
スケジュールではローカルタイムゾーンが使用されます。
-
スケジュールされたクエリに使用するSQLウェアハウスを選択します。
-
[スケジュールの作成] をクリックします。
スケジュールを管理する
スケジュールされた更新を表示または削除するには、次の手順を実行します。
- Google スプレッドシートの Databricks コネクタ サイドバーで、 [インポート] タブをクリックします。
- カレンダーアイコンをクリックし、 スケジュールの管理を クリックします。
- スケジュールを選択すると、含まれるクエリやスケジュール構成などのスケジュールの詳細が表示されます。
- 他のユーザーが作成したスケジュールを表示している場合、表示される時間は作成者のローカルタイムゾーンの時間になります。
- スケジュールを削除するには、 [削除] をクリックします。
制限事項
- スケジュールされた更新は編集できません。既存のスケジュールを表示または削除することのみ可能です。スケジュールを変更するには、スケジュールを削除して新しいスケジュールを作成します。
- スケジュールに含まれているクエリを編集する場合は、スケジュールを削除し、更新されたクエリでスケジュールを再作成して、スケジュールが更新されたクエリ テキストを使用するようにする必要があります。
- ピボット テーブルの更新をスケジュールすることはできません。Google API は生のクエリ データのみを更新し、クエリ結果のスキーマが変更されてもピボット構成を変更することはできません。