DBeaver と Databricks の統合

この記事では、サードパーティによって開発されたDBeaverについて説明します。 プロバイダーに問い合わせるには、GitHub の dbeaver/dbeaver リポジトリ の問題 ページを参照してください。

DBeaver は、開発者、データベース管理者、データアナリスト、データエンジニア、およびデータベースを操作する必要があるその他の人々のためのローカルのマルチプラットフォームデータベースツールです。 DBeaverは、 Databricks だけでなく、他の一般的なデータベースもサポートしています。

この記事では、ローカル開発コンピューターを使用して、無料の オープンソース DBeaver コミュニティ エディション (CE) をインストール、構成、および使用して Databricks のデータベースを操作する方法について説明します。

この記事は、macOS、 Databricks JDBC ドライバー バージョン 2.6.36、 DBeaver CE バージョン 23.3.0 でテストされました。

要件

DBeaverをインストールする前に、ローカル開発マシンが次の要件を満たしている必要があります。

  • Linux 64 ビット、macOS、または Windows 64 ビットのオペレーティング システム。 (Linux 32 ビットはサポートされていますが、推奨されません。

  • Databricks JDBC ドライバー をローカルの開発コンピューターにインストールし、ダウンロードした DatabricksJDBC42-<version>.zip ファイルから DatabricksJDBC42.jar ファイルを抽出します。

に接続するには、Databricks クラスター または SQL Server DBeaverも必要です。

ステップ1:DBeaver をインストールする

次のように DBeaver CE をダウンロードしてインストールします。

  • Linux: DBeaver Web サイトの ダウンロード ページから Linux インストーラーの 1 つをダウンロードして実行します。 snap および flatpak インストールオプションもこのページで提供されています。

  • macOS: 自作 を使用して brew install --cask dbeaver-communityを実行するか、 MacPorts を使用して sudo port install dbeaver-communityを実行します。 macOS インストーラーは、DBeaver Web サイトの ダウンロード ページからも入手できます。

  • Windows: チョコレート を使用して choco install dbeaverを実行します。 Windows インストーラは、DBeaver Web サイトの ダウンロード ページからも入手できます。

ステップ 2: DBeaver 用の JDBC ドライバ Databricks を設定する

以前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DBeaver をセットアップします。

  1. DBeaverを起動します。

  2. 新しいデータベースを作成するかどうかを確認するメッセージが表示されたら、[ いいえ] をクリックします。

  3. データベースへの接続またはデータベースの選択を求めるメッセージが表示されたら、[ キャンセル] をクリックします。

  4. [ データベース > ドライバー マネージャー] をクリックします。

  5. [ドライバー マネージャー] ダイアログ ボックスで、[新規作成] をクリックします。

  6. [ 新しいドライバーの作成 ] ダイアログ ボックスで、[ ライブラリ] タブをクリックします。

  7. [ ファイルの追加] をクリックします。

  8. Databricks JDBC ドライバーを抽出したフォルダーに移動します。

  9. 1 つ下のレベルに移動して、 .jar ファイルを見つけます。

  10. .jarファイルをハイライト表示し、[開く]をクリックします。

  11. [設定] タブの [ドライバー名] に「 Databricks」と入力します。

  12. [設定] タブの [クラス名] に「 com.databricks.client.jdbc.Driver」と入力します。

  13. OK をクリックします。

  14. [ドライバー マネージャー] ダイアログ ボックスで、[閉じる] をクリックします。

ステップ 3: DBeaver を Databricks データベースに接続する

DBeaver を使用してクラスターに接続するか、SQLウェアハウスを使用して Databricks ワークスペース内のデータベースにアクセスします。

  1. DBeaver で、[ データベース] > [新しいデータベース接続] をクリックします。

  2. [ データベースへの接続 ] ダイアログ ボックスの [ すべて ] タブで、[ Databricks] をクリックし、[ 次へ] をクリックします。

  3. [ メイン ] タブをクリックし、Databricks リソースの [JDBC URL ] フィールドに値を入力します。 JDBC URL フィールドの構文については、「Databricks JDBC ドライバーの認証設定」を参照してください。

  4. [ 接続のテスト] をクリックします。

    ヒント

    接続をテストする前に、Databricks リソースを開始する必要があります。 そうしないと、リソースの開始中にテストが完了するまでに数分かかる場合があります。

  5. 接続に成功したら、[ 接続テスト ] ダイアログ ボックスで [OK] をクリックします。

  6. [ データベースへの接続 ] ダイアログ ボックスで、[ 完了] をクリックします。

データベースナビゲータ ウィンドウに、 Databricks エントリが表示されます。接続の名前を変更して識別しやすくするには:

  1. [Databricks] を右クリックし、[接続の編集] をクリックします。

  2. [ 接続構成 ] ダイアログ ボックスで、[ 全般] をクリックします。

  3. [ 接続名] で、 Databricks を別の接続名に置き換えます。

  4. OK をクリックします。

DBeaver がアクセスするリソースごとに、この手順の手順を繰り返します。

ステップ 4: DBeaver を使用してデータオブジェクトを参照する

DBeaver を使用して、Databricks ワークスペース内のデータ オブジェクト (テーブルとテーブル プロパティ、ビュー、インデックス、データ型、その他のデータ オブジェクトの種類など) にアクセスします。

  1. DBeaver の [データベースナビゲータ ] ウィンドウで、使用する接続を右クリックします。

  2. [接続] が有効になっている場合は、それをクリックします。(接続が無効になっている場合は、既に 接続 されています)。

    ヒント

    リソースに接続する前に、リソースを開始する必要があります。 そうしないと、リソースの開始中に接続が完了するまでに数分かかる場合があります。

  3. 接続した接続を展開します。

  4. 使用可能なデータオブジェクトを展開して参照します。 データ オブジェクトをダブルクリックすると、その詳細情報が表示されます。

このステップの手順を繰り返して、追加のデータオブジェクトにアクセスします。

ステップ 5: DBeaver を使用して SQL ステートメントを実行する

DBeaver を使用して、samplesカタログのnyctaxiスキーマからサンプルtripsテーブルをロードします。

  1. DBeaver の [データベースナビゲータ ] ウィンドウで、使用する接続を右クリックします。

  2. [接続] が有効になっている場合は、それをクリックします。(接続が無効になっている場合は、既に 接続 されています)。

    ヒント

    リソースに接続する前に、リソースを開始する必要があります。 そうしないと、リソースの開始中に接続が完了するまでに数分かかる場合があります。

  3. [SQL エディタ] > [新しい SQL スクリプト] をクリックします。

  4. [(connection-name) Script-1] タブで、次の SQL ステートメントを入力します。

    SELECT * FROM samples.nyctaxi.trips;
    
  5. 「SQL エディター」>「SQL スクリプトの実行」をクリックします。

次のステップ