メインコンテンツまでスキップ

Google スプレッドシートから Databricks に接続する

備考

プレビュー

この機能は パブリック プレビュー段階です。

このページでは、 Google スプレッドシート用の Databricks コネクタ を使用して Google スプレッドシートから Databricks に接続する方法について説明します。Databricks アドオンは、Google スプレッドシート内から Databricks データをクエリし、さらなる分析を可能にします。

始める前に

Databricks データを Google スプレッドシートにインポートする

Databricks ワークスペースに接続し、クエリを作成またはインポートすることで、Google スプレッドシート用の Databricks コネクタを使用して Databricks から Google スプレッドシートにデータをインポートします。

ステップ 1: Databricks Workspaceに接続する

  1. Google スプレッドシートで、 [拡張機能] > [Databricks コネクタ] > [サイドバーの起動] を選択してコネクタを開きます。

    Google スプレッドシートで Databricks コネクタを起動する

  2. ログイン ダイアログで、Databricks ワークスペースの URL を入力します。ワークスペース URL を見つける方法については、 ワークスペース オブジェクトの識別子を取得するを参照してください。

    • ワークスペース URL の形式は次のとおりです: https://<instance-name>.<number>.gcp.databricks.com
  3. [ サインイン ] をクリックします。

  4. ダイアログが表示され、サインインを求めるか、ログイン ステータスが表示されます。

ステップ 2: Google スプレッドシート用のDatabricksコネクタを使用する

Google スプレッドシート用の Databricks アドオンは、Unity Catalog でアクセスできるデータに対してクエリを実行し、そのデータを Google スプレッドシートにインポートします。コネクタはすべてのクエリを自動的にインポートとして保存します。Google スプレッドシートでは、結果を更新したり、既存のクエリを再利用したり、データのソースを追跡したりできます。

  1. (オプション) [データ] タブで、コネクタ サイドバーの右上にある円をクリックし、希望する Databricks SQL ウェアハウスを選択して、Databricks SQL ウェアハウスを選択します。コネクタは、選択したSQLウェアハウスを起動します。

    Google Sheets コネクタで DBSQL ウェアハウスを切り替える

  2. 新しい SQL クエリを記述するには:

    1. コネクタ サイドバーの [ソース] で、 [新しいクエリの作成] を 選択します。
    2. Databricks では、クエリを識別できるように名前を入力することをお勧めします。
    3. カタログ、スキーマ、テーブルを参照できます。
    4. クエリ テキスト に SQL クエリを入力します。
    5. [詳細オプション] で、クエリ結果を新しいシートに保存するか、現在のシートに保存するかを選択します。
      • 現在のシートを選択した場合は、データの追加を開始するセルを指定します。
  3. 既存の SQL クエリから新しいクエリを更新または作成するには:

    1. コネクタ サイドバーの [ソース] で、 [クエリの選択] を選択します。
    2. [クエリ] で、使用するクエリを選択します。
    3. 必要に応じてクエリを編集します。
  4. (オプション) クエリにクエリを追加するには、次の手順を実行します。

    1. クエリに:parameter_nameの形式のクエリが少なくとも 1 つ含まれていることを確認してください。 クエリの問題の詳細については、 「クエリの問題の操作」を参照してください。
    2. [+追加]を クリックします。
    3. 最初のボックスに「問題」を入力します。 問題名がクエリ エディターに入力したものと一致していることを確認してください。
    4. 2 番目のボックスに、シート名の後の感嘆符を含めて、シート名の値のセル位置を入力します。
    5. さらにクエリを追加するには、 [+ 追加] を再度クリックします。

    たとえば、次のクエリには、シートsheet_1セル H1 で定義されているクエリ パラメーター:trip_distanceが含まれています。

    クエリにはクエリがある

  5. クエリを実行するには:

    • 新しいクエリの場合は、 [保存してインポート] をクリックしてクエリを実行し、シートに入力します。
    • 既存のクエリの場合は、 [更新とインポート] をクリックします。更新されたクエリを新しいクエリとして保存する場合は、 [更新とインポート] の横にある下矢印をクリックし、 [新規として保存] をクリックします。

    Databricksコネクタサイドバーの完全な例

  6. シートにクエリ結果が入力されます。

    クエリ結果が入力されたシート

注記

データがインポートされると、クエリがシートに関連付けられます。シート名を変更するとマッピングが壊れます。名前の変更を処理する方法については、 「制限事項」を参照してください。

インポートしたデータの管理

Databricks からインポートしたデータを管理するには:

  1. コネクタ サイドバーの [インポート] タブを選択します。
  2. インポートを更新するには、クエリ名の横にある更新アイコンをクリックします。
  3. インポートが接続されているシートを確認するには、ケバブメニューアイコン。 > クエリ名の横にあるシートに移動します
  4. インポートを編集するには、クエリ名の横にあるケバブメニューアイコン。 > [編集] をクリックします。
  5. インポートを削除するには、クエリ名の横にあるケバブメニューアイコン。 > [削除] をクリックします。これにより、Google スプレッドシートにインポートされたデータではなく、クエリが削除されます。インポートしたデータは手動で削除する必要があります。

Google スプレッドシートでインポートした Databricks データを管理する

Databricksワークスペースの変更

接続している Databricks ワークスペースを変更するには:

  1. 拡張機能 > Databricks コネクタ > ワークスペースの変更を 選択します。
  2. 新しいワークスペースの URL を入力し、ワークスペースに認証します。

共有の影響

アドオンは、Google スプレッドシートを共有する機能には影響しません。ただし、ファイルを共有する方法によって、受信者がアドオンを使用して実行できるアクションが影響を受けます。

  • 閲覧者またはコメント投稿者の役割を持つ受信者はアドオンにアクセスできません。
  • 編集者の役割と同等のデータアセットアクセス権を持つ受信者は、Google アカウントでアドオンを使用できます。所有者と同じようにコネクタを使用できます。
  • 編集者ロールを持ち、基礎となるリソースへの同じアクセス権を持つ受信者は、同じ Databricks ワークスペースにログインしている場合、インポートを更新できます。

制限事項

  • 既存のインポートに添付されているシートの名前を変更したり、削除したりすることはできません。そうすると、インポートを更新できなくなります。これを修正するには、次の いずれか を実行します。

    • まったく同じ名前でシートを再作成します。
    • ソースとして クエリを選択 を選択し、インポートを再利用して、 新規として保存 をクリックして、新しいインポートを作成します。
  • 2 つのクエリが同じ範囲または重複する範囲にマップされている場合、アドオンは最後に実行されたクエリの結果を表示します。これにより、以前にインポートされたデータが上書きされます。