メインコンテンツまでスキップ

DBeaver と Databricks の統合

注記

この記事では、サードパーティによって開発されたDBeaverについて説明します。 プロバイダーに問い合わせるには、GitHub の dbeaver/dbeaver リポジトリの問題 ページを参照してください。

DBeaver は、開発者、データベース管理者、データアナリスト、データエンジニア、およびデータベースを操作する必要があるその他の人々向けのローカルのマルチプラットフォームデータベースツールです。 DBeaver は、Databricks だけでなく、他の一般的なデータベースもサポートしています。

この記事では、ローカルの開発マシンを使用して、無料のオープンソース DBeaver Community Edition (CE) をインストール、構成、および使用し、 Databricksでデータベースを操作する方法について説明します。

注記

この記事は、macOS、 Databricks JDBC ドライバー バージョン 2.6.36、 DBeaver CE バージョン 23.3.0 でテストされました。

必要条件

DBeaver をインストールする前に、ローカル開発マシンが次の要件を満たしている必要があります。

  • Linux 64 ビット、macOS、または Windows 64 ビット オペレーティング システム。 (Linux 32 ビットはサポートされていますが、推奨されません。
  • Databricks JDBC ドライバーをローカル開発マシンに読み込み、ダウンロードした DatabricksJDBC42-<version>.zip ファイルから DatabricksJDBC42.jar ファイルを抽出します。

また、 に接続するには、Databricksクラスター またはSQL ウェアハウス も必要です。DBeaver

ステップ1:DBeaverをインストールする

DBeaver CE を次のようにダウンロードしてインストールします。

  • Linux : DBeaver Web サイトの Download ページから Linux インストーラーの 1 つをダウンロードして実行します。 このページには、snapおよびflatpakのインストールオプションも記載されています。
  • macOS: Homebrewを使用してbrew install --cask dbeaver-communityを実行するか、MacPortsを使用してsudo port install dbeaver-communityを実行します。macOSインストーラーは、DBeaver Webサイトの ダウンロード ページからも入手できます。
  • Windows : Chocolatey を使用して choco install dbeaverを実行します。 Windowsインストーラーは、DBeaver Webサイトの ダウンロード ページからも入手できます。

手順 2: DBeaver の Databricks JDBC ドライバーを構成する

前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DBeaver を設定します。

  1. DBeaverを起動します。
  2. 新しいデータベースを作成するように求められたら、「 いいえ 」をクリックしてください。
  3. データベースへの接続またはデータベースの選択を求められた場合は、[ キャンセル] をクリックします。
  4. [データベース] > [ドライバー マネージャー ] をクリックします。
  5. [ドライバー マネージャー ] ダイアログ ボックスで、[ 新規] をクリックします。
  6. [ 新しいドライバーの作成 ] ダイアログ ボックスで、[ ライブラリ] タブをクリックします。
  7. ファイルを追加 」をクリックします。
  8. Databricks JDBC ドライバーを抽出したフォルダーに移動します。
  9. 1 つ下のレベルに移動して、 .jar ファイルを見つけます。
  10. .jarファイルを強調表示し、[ 開く ]をクリックします。
  11. [ 設定 ] タブの [ドライバー名 ] に「 Databricks」と入力します。
  12. [設定 ] タブの [クラス名 ] に「com.databricks.client.jdbc.Driver」と入力します。
  13. OK 」をクリックします。
  14. [ドライバー マネージャー ] ダイアログ ボックスで、[ 閉じる] をクリックします。

ステップ 3: DBeaver を Databricks データベースに接続する

DBeaver を使用してクラスターまたはSQLウェアハウスに接続し、Databricks ワークスペース内のデータベースにアクセスします。

  1. DBeaver で、[ データベース] > [新しいデータベース接続 ] をクリックします。

  2. [ データベースへの接続 ] ダイアログ ボックスの [すべて ] タブで、[ Databricks ] をクリックし、[ 次へ ] をクリックします。

  3. [ メイン ] タブをクリックし、Databricks リソースの [JDBC URL ] フィールドに値を入力します。 JDBC URL フィールドの構文については、「Databricks JDBC ドライバーの認証設定」を参照してください。

  4. [ テスト接続 ] をクリックします。

ヒント

接続をテストする前に、Databricks リソースを開始する必要があります。 そうしないと、リソースが開始するまでにテストが完了するまでに数分かかる場合があります。

  1. 接続が成功した場合は、[ 接続テスト ] ダイアログ ボックスで [OK] をクリックします。

  2. [ データベースへの接続 ] ダイアログ ボックスで、[ 完了] をクリックします。

「データベース・ナビゲータ」 ウィンドウに、 Databricks エントリが表示されます。接続の名前を変更して識別しやすくするには:

  1. [Databricks ] を右クリックし、[ 接続の編集] をクリックします。
  2. [接続構成 ] ダイアログ ボックスで、[ 全般] をクリックします。
  3. [ Connection name ] で、 Databricks を別の接続名に置き換えます。
  4. OK 」をクリックします。

DBeaver がアクセスする各リソースについて、この手順の手順を繰り返します。

ステップ 4: DBeaver を使用してデータ オブジェクトを参照する

DBeaver を使用して、テーブルとテーブルのプロパティ、ビュー、インデックス、データ型、その他のデータ オブジェクトの種類など、Databricks ワークスペース内のデータ オブジェクトにアクセスします。

  1. DBeaver の [Database Navigator] ウィンドウで、使用する接続を右クリックします。

  2. [接続 ] が有効になっている場合は、クリックします。( Connect が無効になっている場合は、すでに接続されています。

ヒント

リソースに接続する前に、リソースを開始してください。 そうしないと、リソースの開始中に接続が完了するまでに数分かかる場合があります。

  1. 接続した接続を展開します。

  2. 使用可能なデータ・オブジェクトを展開して参照します。 データ オブジェクトをダブルクリックして、そのオブジェクトに関する詳細情報を取得します。

他のデータオブジェクトにアクセスするには、このステップの指示を繰り返してください。

ステップ 5: DBeaver を使用して SQL ステートメントを実行する

DBeaver を使用して、samples カタログのnyctaxiスキーマからサンプル trips テーブルを読み込みます。

  1. DBeaver の [Database Navigator] ウィンドウで、使用する接続を右クリックします。

  2. [接続 ] が有効になっている場合は、クリックします。( Connect が無効になっている場合は、すでに接続されています。

ヒント

リソースに接続する前に、リソースを開始してください。 そうしないと、リソースの開始中に接続が完了するまでに数分かかる場合があります。

  1. 「SQL エディター」>「新規 SQL スクリプト 」をクリックします。

  2. [(connection-name) Script-1 ] タブで、次の SQL ステートメントを入力します。

    SQL
    SELECT * FROM samples.nyctaxi.trips;
  3. 「SQL エディター」>「SQL スクリプトの実行 」をクリックします。

次のステップ

追加のリソース