メインコンテンツまでスキップ

Google スプレッドシートで Databricks データをクエリする

備考

プレビュー

この機能は パブリック プレビュー段階です。

このページでは、Databricks ワークスペースからデータをクエリし、 Google スプレッドシート用の Databricks コネクタ を使用して Google スプレッドシートにインポートする方法について説明します。テーブルを直接選択し、 SQLクエリを作成し、追加し、ピボット テーブルを作成できます。 コネクタはすべてのクエリを自動的にインポートとして保存するため、結果を更新して既存のクエリを再利用できます。

前提条件

インポート方法を選択する

テーブルを選択するか、SQL クエリを記述することで、Databricks から Google スプレッドシートにデータをインポートできます。データがインポートされると、クエリがシートに関連付けられます。シート名を変更するとマッピングが壊れます。名前の変更を処理する方法については、 「制限事項」を参照してください。

重要

「データの選択」を使用してUnity Catalogメトリクス ビューをインポートする場合、 Unity Catalogメトリクスはピボットされたデータを表すため、ビューはピボット テーブルとしてのみインポートできます。

開始するには、インポート方法を選択してください:

Databricks のテーブルからデータをインポートするには、次の手順を実行します。

  1. Google Sheets Databricks コネクタ サイドバーの [データ][インポート方法] で、 [データの選択] を選択します。

  2. [カタログ] の下で、カタログ、スキーマ、およびテーブルのドロップダウン メニューを使用して、インポートするテーブルを検索します。

  3. 必要に応じて、 アセット名 を更新してこのインポートの名前を変更します。

  4. オプションで、 [フィールド] で、含める列または除外する列を選択します。

  5. オプションでピボット テーブルとしてインポートすることもできます。

  6. フィルターを追加するには、 [フィルター] の下の [+ フィルター] をクリックします。フィルターを適用する フィルター タイプ を選択します。

  7. 必要に応じて、 「行数を制限する」 をチェックして、インポートする行数の制限を設定します。

  8. [出力先] で、クエリ結果を新しいシートに保存するか、現在のシートに保存するかを選択します。

    • 現在のシートを選択した場合は、データの追加を開始するセルを指定します。
  9. シートにデータを入力するには、 [保存してインポート] をクリックします。

注記

クエリ実行は 3 分後にタイムアウトします。クエリがこの制限を超えると、自動的にキャンセルされます。結果セットが大きい場合、最初の 1,000 行が直ちに書き込まれ、残りのデータは段階的に取得されます。データの取得が中断された場合、部分的な結果がシートに残りますが、クエリを再実行することでクリアできます。

クエリ結果が入力されたシート

クエリの追加 (オプション)

SQLクエリにクエリを追加するには:

  1. クエリに:parameter_nameの形式のクエリが少なくとも 1 つ含まれていることを確認してください。 クエリのパラメーターの詳細については、 クエリのパラメーターの操作を参照してください。

  2. [+追加] をクリックします。

  3. 最初のボックスにパラメーターを入力します。 パラメーター名がクエリ エディターに入力したものと一致していることを確認してください。

  4. 2 番目のボックスに、シート名の後の感嘆符を含めて、シート名の値のセル位置を入力します。

  5. さらにクエリを追加するには、 [+ 追加] を再度クリックします。

    たとえば、次のクエリには、シートsheet_1のセル H1 で定義されているクエリ パラメーター:trip_distanceが含まれています。

    クエリにはクエリがある

ピボットテーブルとしてインポート(オプション)

データをピボット テーブルとしてインポートするには、次の手順を実行します。

  1. データの選択 方法を使用してデータをインポートするには、 ピボット テーブル チェックボックスをオンにします。
  2. [ピボット構成] で、ピボット テーブルのディメンションの を選択します。
  3. 集計する値を指定します。 [+ 値の追加] をクリックし、列と集計方法を選択します。
  4. 必要に応じて、 「+ フィルターを追加」を クリックして フィルターの種類 を選択し、フィルターを追加します。
  5. [保存してインポート] をクリックして、結果をピボット テーブルとしてインポートします。インポート ピボット テーブルは新しいシートに自動的にインポートされます。

Databricksコネクタでピボットテーブルを構成する

インポートしたデータの管理

Databricks からインポートしたデータを管理するには、次の手順を実行します。

  1. コネクタ サイドバーの [インポート] タブをクリックします。
  2. インポートを更新するには、クエリ名の横にある更新アイコンをクリックします。
  3. インポートが接続されているシートを確認するには、ケバブメニューアイコン。 > クエリ名の横にあるシートに移動します
  4. インポートを編集するには、クエリ名の横にあるケバブメニューアイコン。 > [編集] をクリックします。
  5. インポートを削除するには、クエリ名の横にあるケバブメニューアイコン。 > [削除] をクリックします。これにより、Google スプレッドシートにインポートされたデータではなく、クエリが削除されます。インポートしたデータは手動で削除する必要があります。

Google スプレッドシートでインポートした Databricks データを管理する

共有の意味

アドオンは、Google スプレッドシートを共有する機能には影響しません。ただし、ファイルを共有する方法によって、受信者がアドオンを使用して実行できるアクションが影響を受けます。

  • 閲覧者またはコメント投稿者の役割を持つ受信者はアドオンにアクセスできません。
  • 編集者の役割と同等のデータアセットアクセス権を持つ受信者は、Google アカウントでアドオンを使用できます。所有者と同じようにコネクタを使用できます。
  • 編集者ロールを持ち、基礎となるリソースへの同じアクセス権を持つ受信者は、同じ Databricks ワークスペースにログインしている場合、インポートを更新できます。

制限事項

  • 既存のインポートに添付されているシートの名前を変更したり削除したりすると、インポートを更新できなくなります。これを修正するには、次の いずれか を実行します。

    • まったく同じ名前でシートを再作成します。
    • ソースとして クエリを選択 を選択し、インポートを再利用して、 新規として保存 をクリックして、新しいインポートを作成します。
  • 2 つのクエリが同じ範囲または重複する範囲にマップされている場合、アドオンは最後に実行されたクエリの結果を表示します。これにより、以前にインポートされたデータが上書きされます。

次のステップ