DBeaver と Databricks の統合
この記事では、サードパーティによって開発されたDBeaverについて説明します。 プロバイダーに問い合わせるには、GitHub の dbeaver/dbeaver リポジトリの問題 ページを参照してください。
DBeaver は、開発者、データベース管理者、データアナリスト、データエンジニア、およびデータベースを操作する必要があるその他の人々向けのローカルのマルチプラットフォームデータベースツールです。 DBeaver は、Databricks だけでなく、他の一般的なデータベースもサポートしています。
この記事では、ローカルの開発マシンを使用して、無料のオープンソース DBeaver Community Edition (CE) をインストール、構成、および使用し、 Databricksでデータベースを操作する方法について説明します。
この記事は、macOS、 Databricks JDBC ドライバー バージョン 2.6.36、 DBeaver CE バージョン 23.3.0 でテストされました。
必要条件
DBeaver をインストールする前に、ローカル開発マシンが次の要件を満たしている必要があります。
- Linux 64 ビット、macOS、または Windows 64 ビット オペレーティング システム。 (Linux 32 ビットはサポートされていますが、推奨されません。
- Databricks JDBC ドライバーをローカル開発マシンに読み込み、ダウンロードした
DatabricksJDBC42-<version>.zip
ファイルからDatabricksJDBC42.jar
ファイルを抽出します。
また、 に接続するには、Databricksクラスター またはSQL ウェアハウス も必要です。DBeaver
ステップ1:DBeaverをインストールする
DBeaver CE を次のようにダウンロードしてインストールします。
- Linux : DBeaver Web サイトの Download ページから Linux インストーラーの 1 つをダウンロードして実行します。 このページには、
snap
およびflatpak
のインストールオプションも記載されています。 - macOS: Homebrewを使用して
brew install --cask dbeaver-community
を実行するか、MacPortsを使用してsudo port install dbeaver-community
を実行します。macOSインストーラーは、DBeaver Webサイトの ダウンロード ページからも入手できます。 - Windows : Chocolatey を使用して
choco install dbeaver
を実行します。 Windowsインストーラーは、DBeaver Webサイトの ダウンロード ページからも入手できます。
手順 2: DBeaver の Databricks JDBC ドライバーを構成する
前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DBeaver を設定します。
- DBeaverを起動します。
- 新しいデータベースを作成するように求められたら、「 いいえ 」をクリックしてください。
- データベースへの接続またはデータベースの選択を求められた場合は、[ キャンセル] をクリックします。
- [データベース] > [ドライバー マネージャー ] をクリックします。
- [ドライバー マネージャー ] ダイアログ ボックスで、[ 新規] をクリックします。
- [ 新しいドライバーの作成 ] ダイアログ ボックスで、[ ライブラリ] タブをクリックします。
- 「 ファイルを追加 」をクリックします。
- Databricks JDBC ドライバーを抽出したフォルダーに移動します。
- 1 つ下のレベルに移動して、
.jar
ファイルを見つけます。 .jar
ファイルを強調表示し、[ 開く ]をクリックします。- [ 設定 ] タブの [ドライバー名 ] に「
Databricks
」と入力します。 - [設定 ] タブの [クラス名 ] に「
com.databricks.client.jdbc.Driver
」と入力します。 - 「 OK 」をクリックします。
- [ドライバー マネージャー ] ダイアログ ボックスで、[ 閉じる] をクリックします。
ステップ 3: DBeaver を Databricks データベースに接続する
DBeaver を使用してクラスターまたはSQLウェアハウスに接続し、Databricks ワークスペース内のデータベースにアクセスします。
-
DBeaver で、[ データベース] > [新しいデータベース接続 ] をクリックします。
-
[ データベースへの接続 ] ダイアログ ボックスの [すべて ] タブで、[ Databricks ] をクリックし、[ 次へ ] をクリックします。
-
[ メイン ] タブをクリックし、Databricks リソースの [JDBC URL ] フィールドに値を入力します。 JDBC URL フィールドの構文については、「Databricks JDBC ドライバーの認証設定」を参照してください。
-
[ テスト接続 ] をクリックします。
接続をテストする前に、Databricks リソースを開始する必要があります。 そうしないと、リソースが開始するまでにテストが完了するまでに数分かかる場合があります。
-
接続が成功した場合は、[ 接続テスト ] ダイアログ ボックスで [OK] をクリックします。
-
[ データベースへの接続 ] ダイアログ ボックスで、[ 完了] をクリックします。
「データベース・ナビゲータ」 ウィンドウに、 Databricks エントリが表示されます。接続の名前を変更して識別しやすくするには:
- [Databricks ] を右クリックし、[ 接続の編集] をクリックします。
- [接続構成 ] ダイアログ ボックスで、[ 全般] をクリックします。
- [ Connection name ] で、
Databricks
を別の接続名に置き換えます。 - 「 OK 」をクリックします。
DBeaver がアクセスする各リソースについて、この手順の手順を繰り返します。
ステップ 4: DBeaver を使用してデータ オブジェクトを参照する
DBeaver を使用して、テーブルとテーブルのプロパティ、ビュー、インデックス、データ型、その他のデータ オブジェクトの種類など、Databricks ワークスペース内のデータ オブジェクトにアクセスします。
-
DBeaver の [Database Navigator] ウィンドウで、使用する接続を右クリックします。
-
[接続 ] が有効になっている場合は、クリックします。( Connect が無効になっている場合は、すでに接続されています。
リソースに接続する前に、リソースを開始してください。 そうしないと、リソースの開始中に接続が完了するまでに数分かかる場合があります。
-
接続した接続を展開します。
-
使用可能なデータ・オブジェクトを展開して参照します。 データ オブジェクトをダブルクリックして、そのオブジェクトに関する詳細情報を取得します。
他のデータオブジェクトにアクセスするには、このステップの指示を繰り返してください。
ステップ 5: DBeaver を使用して SQL ステートメントを実行する
DBeaver を使用して、samples
カタログのnyctaxi
スキーマからサンプル trips
テーブルを読み込みます。
-
DBeaver の [Database Navigator] ウィンドウで、使用する接続を右クリックします。
-
[接続 ] が有効になっている場合は、クリックします。( Connect が無効になっている場合は、すでに接続されています。
リソースに接続する前に、リソースを開始してください。 そうしないと、リソースの開始中に接続が完了するまでに数分かかる場合があります。
-
「SQL エディター」>「新規 SQL スクリプト 」をクリックします。
-
[(connection-name) Script-1 ] タブで、次の SQL ステートメントを入力します。
SQLSELECT * FROM samples.nyctaxi.trips;
-
「SQL エディター」>「SQL スクリプトの実行 」をクリックします。
次のステップ
- データベース・オブジェクト・エディタを使用して、データベース・オブジェクトのプロパティ、データ、およびエンティティ関係図を操作します。
- データ エディターを使用して、データベース テーブルまたはビュー内のデータを表示および編集します。
- SQL エディターを使用して、SQL スクリプトを操作します。
- DBeaver でエンティティ関係図 (ERD) を操作します。
- DBeaver との間でデータをインポートおよびエクスポートします。
- DBeaverを使用してデータを移行します。
- DBeaver の JDBC ドライバーの問題をトラブルシューティングします。