Google スプレッドシートから Databricks に接続する
プレビュー
この機能は パブリック プレビュー段階です。
このページでは 、Google スプレッドシート用の Databricks コネクタ を使用して Google スプレッドシートから Databricks に接続する方法について説明します。Databricks アドオンは、Google スプレッドシート内から Databricks データをクエリし、さらなる分析を可能にします。
始める前に
- Databricks ワークスペースを作成します。ワークスペースを作成するを参照してください。
- Databricks SQL ウェアハウスを作成します。SQLウェアハウスを作成するを参照してください。
- Google スプレッドシートにアクセスできる。
- Databricks Connector for Google スプレッドシートをインストールします。
- Databricks ワークスペースで IP アクセス リストが有効になっている場合、アカウント管理者は Google Cloud IP リストを許可リストに追加する必要があります。
- IP アクセスリストの詳細については、「 アカウントコンソールの IP アクセスリストの設定」を参照してください。
- Google クラウドの IP リストについては、この IP リストを参照してください。
Databricks データを Google スプレッドシートにインポートする
Databricks ワークスペースに接続し、クエリを作成またはインポートすることで、Google スプレッドシート用の Databricks コネクタを使用して Databricks から Google スプレッドシートにデータをインポートします。
ステップ 1: Databricks Workspaceに接続する
-
Google スプレッドシートで、 [拡張機能] > [Databricks コネクタ] > [サイドバーの起動] を選択してコネクタを開きます。
-
ログイン ダイアログで、Databricks ワークスペースの URL を入力します。ワークスペース URL を見つける方法については、 「ワークスペース オブジェクトの識別子を取得する」を参照してください。
- ワークスペース URL の形式は次のとおりです:
https://<instance-name>.cloud.databricks.com
。
- ワークスペース URL の形式は次のとおりです:
-
[ サインイン ] をクリックします。
-
ダイアログが表示され、サインインを求めるか、ログイン ステータスが表示されます。
ステップ 2: Google スプレッドシート用のDatabricksコネクタを使用する
Google スプレッドシート用の Databricks アドオンは、Unity Catalog でアクセスできるデータに対してクエリを実行し、そのデータを Google スプレッドシートにインポートします。コネクタはすべてのクエリを自動的にインポートとして保存します。Google スプレッドシートでは、結果を更新したり、既存のクエリを再利用したり、データのソースを追跡したりできます。
-
(オプション) [データ] タブで、コネクタ サイドバーの右上にある円をクリックし、希望する Databricks SQL ウェアハウスを選択して、Databricks SQL ウェアハウスを選択します。コネクタは、選択したSQLウェアハウスを起動します。
-
新しい SQL クエリを記述するには:
-
コネクタ サイドバーの [ソース] で、 [新しいクエリの作成] を 選択します。
-
Databricks では、クエリを識別できるように名前を入力することをお勧めします。
-
カタログ、スキーマ、テーブルを参照できます。
-
クエリ テキスト に SQL クエリを入力します。
-
[詳細オプション] で、クエリ結果を新しいシートに保存するか、現在のシートに保存するかを選択します。
- 現在のシートを選択した場合は、データの追加を開始するセルを指定します。
-
[保存してインポート] をクリックしてクエリを実行し、シートに入力します。
-
-
既存の SQL クエリから新しいクエリを更新または作成するには:
- コネクタ サイドバーの [ソース] で、 [クエリの選択] を選択します。
- [クエリ] で、使用するクエリを選択します。
- 必要に応じてクエリを編集します。
- 既存のインポートを更新するか、新しいインポートを作成するかを選択します。
- クエリを実行するには、 [更新とインポート] をクリックします。更新されたクエリを新しいクエリとして保存する場合は、 [更新とインポート] の横にある下矢印をクリックし、 [新規として保存] をクリックします。
データがインポートされると、クエリがシートに関連付けられます。シート名を変更するとマッピングが壊れます。名前の変更を処理する方法については、 「制限事項」を参照してください。
インポートしたデータの管理
Databricks からインポートしたデータを管理するには:
- コネクタ サイドバーの [インポート] タブを選択します。
- インポートを更新するには、クエリ名の横にある更新アイコンをクリックします。
- インポートが接続されているシートを確認するには、
> クエリ名の横にあるシートに移動します 。
- インポートを編集するには、
> クエリ名の横にある [編集] をクリックします 。
- インポートを削除するには、
> クエリ名の横にある [削除] をクリックします 。これにより、Google スプレッドシートにインポートされたデータではなく、クエリが削除されます。インポートしたデータは手動で削除する必要があります。
Change Databricksワークスペース
接続している Databricks ワークスペースを変更するには:
- 拡張機能 > Databricks コネクタ > ワークスペースの変更を 選択します。
- 新しいワークスペースの URL を入力し、ワークスペースに認証します。
共有の意味
アドオンは、Google スプレッドシートを共有する機能には影響しません。ただし、ファイルを共有する方法によって、受信者がアドオンを使用して実行できるアクションが影響を受けます。
- 閲覧者またはコメント投稿者の役割を持つ受信者はアドオンにアクセスできません。
- 編集者の役割と同等のデータアセットアクセス権を持つ受信者は、Google アカウントでアドオンを使用できます。所有者と同じようにコネクタを使用できます。
- 編集者ロールを持ち、基礎となるリソースへの同じアクセス権を持つ受信者は、同じ Databricks ワークスペースにログインしている場合、インポートを更新できます。
制限事項
-
既存のインポートに添付されているシートの名前を変更したり、削除したりすることはできません。そうすると、インポートを更新できなくなります。これを修正するには、次の いずれか を実行します。
- まったく同じ名前でシートを再作成します。
- ソースとして 「クエリを選択」を 選択し、インポートを再利用して、 「新規として保存」 をクリックして、新しいインポートを作成します。
-
2 つのクエリが同じ範囲または重複する範囲にマップされている場合、アドオンは最後に実行されたクエリの結果を表示します。これにより、以前にインポートされたデータが上書きされます。