Google スプレッドシートでデータ更新をスケジュールする
このページでは、インポートしたデータを最新の状態に保つために、 Google Sheets 用 Databricks コネクタ で自動データ更新をスケジュールする方法について説明します。スケジュールされた更新では、保存されたクエリが定期的に実行され、対応するシートが更新されます。
要件
Unity Catalog接続を作成する
スケジュールされた更新には、以下のものが必要です。
- Google スプレッドシートでメタストア管理者が作成した、
databricks_google_connectionという名前のUnity Catalog接続。 - 接続に対する
USE CONNECTION権限は、スケジュールされた更新を作成または管理する必要があるユーザーに付与されます。
- Databricksメタストア管理者として、Googleスプレッドシートで、Databricks Connector for Google Sheetsサイドバーを開きます。
- 「保存済みインポート」 タブをクリックします。
- 右上のカレンダーをクリックします。
- [接続の設定] をクリックします。
Databricksで接続を共有する
接続が確立されたら、スケジュールされた更新を作成または管理する必要のあるユーザーにUSE CONNECTION権限を付与します。メタストア管理者、または接続に対してMANAGE権限を持つユーザーは、この権限を付与できます。接続の管理の詳細については、 「レイクハウスフェデレーションの接続の管理」を参照してください。
スケジュールを作成する
各インポートは 1 つのスケジュールにのみ割り当てることができます。既存のインポートに新しいスケジュールを作成するには:
-
Google スプレッドシートの Databricks コネクタのサイドバーで、 「保存済みインポート」 タブをクリックします。
-
カレンダーアイコンをクリックし、 [新しいスケジュール] をクリックします。
-
スケジュールを作成するインポートを選択してください。
-
スケジュールの名前を入力します。
-
スケジュールの 頻度 を選択します:
- 「毎時」 の場合は、更新を実行する分を選択してください。
- 「毎日」 の場合は、更新を実行する時刻を選択します。
- 毎週 の場合は、更新を実行する曜日と時刻を選択します。
スケジュールではローカルタイムゾーンが使用されます。
-
スケジュールされたクエリに使用するSQLウェアハウスを選択します。
-
[スケジュールの作成] をクリックします。
実行履歴とスケジュールの詳細を表示する
スケジュールされたすべての更新の実行履歴を確認するには、次の手順を実行します。
- Google スプレッドシートの Databricks コネクタのサイドバーで、 「保存済みインポート」 タブをクリックします。
- カレンダーアイコンをクリックし、 「実行履歴を表示」 をクリックします。
- 特定の実行をクリックして、スケジュールの詳細を表示します。
スケジュールされた更新の実行履歴と構成の詳細を表示するには、次の手順を実行します。
-
「実行履歴の表示」 ペインから、表示したいスケジュールの名前を選択します。 [最近の実行] の下に、各実行のステータスが表示されます。
-
ステータス アイコンにカーソルを置くと、実行の 実行 ID 、 開始時刻 、および 実行ステータスが 表示されます。
![[最近の実行] の実行ステータス アイコンにカーソルを合わせると、個々の実行の詳細が表示されます](/aws/ja/assets/images/individual-runs-112635a374c4e3805b23939718118a13.png)
-
「設定を表示」 をクリックすると、選択したインポートとスケジュール設定を含むスケジュールの詳細が表示されます。
- 他のユーザーが作成したスケジュールを表示している場合、表示される時間は作成者のローカルタイムゾーンの時間になります。
スケジュールされた更新を削除する
スケジュールされた更新を削除するには、次の手順を実行します。
- Google スプレッドシートの Databricks コネクタのサイドバーで、 「保存済みインポート」 タブをクリックします。
- カレンダーアイコンをクリックし、 スケジュールの管理を クリックします。
- 削除したいスケジュールを選択してください。
- 「設定の表示」 をクリックし、次に 「削除」 をクリックします。
トラブルシューティング
スケジュールされた更新に問題が発生した場合は、Google スプレッドシートのスケジュールと、 Databricks上の対応するUnity Catalog接続を削除し、スケジュールを再作成してください。 Unity Catalog接続の詳細については、 「レイクハウスフェデレーションの接続の管理」を参照してください。
制限事項
- スケジュールされた更新は編集できません。既存のスケジュールを表示または削除することのみ可能です。スケジュールを変更するには、スケジュールを削除して新しいスケジュールを作成します。
- スケジュールで使用されているクエリを編集しても、スケジュールは自動的に変更内容を反映しません。更新されたクエリテキストを適用するには、スケジュールを削除して再作成してください。
- ピボットテーブルでは、更新をスケジュールすることはできません。Google APIは生のクエリデータのみを更新するため、クエリ結果のスキーマが変更されてもピボット構成を変更することはできません。
- 1つのスケジュールには、最大20件の輸入を含めることができます。
- スケジュールされた更新で使用されるインポートのクエリテキストには、4,096文字の制限があります。