DBeaver と Databricks の統合
注
この記事では、サードパーティによって開発されたDBeaverについて説明します。 プロバイダーに問い合わせるには、GitHub の dbeaver/dbeaver リポジトリ の問題 ページを参照してください。
DBeaver は、開発者、データベース管理者、データアナリスト、データエンジニア、およびデータベースを操作する必要があるその他の人々のためのローカルのマルチプラットフォームデータベースツールです。 DBeaverは、 Databricks だけでなく、他の一般的なデータベースもサポートしています。
この記事では、ローカル開発コンピューターを使用して、無料の オープンソース DBeaver コミュニティ エディション (CE) をインストール、構成、および使用して Databricks のデータベースを操作する方法について説明します。
注
この記事は、macOS、 Databricks JDBC ドライバー バージョン 2.6.36、 DBeaver CE バージョン 23.3.0 でテストされました。
要件
DBeaverをインストールする前に、ローカル開発マシンが次の要件を満たしている必要があります。
Linux 64 ビット、macOS、または Windows 64 ビットのオペレーティング システム。 (Linux 32 ビットはサポートされていますが、推奨されません。
Databricks JDBC ドライバー をローカルの開発コンピューターにインストールし、ダウンロードした
DatabricksJDBC42-<version>.zip
ファイルからDatabricksJDBC42.jar
ファイルを抽出します。
に接続するには、Databricks クラスター または SQL Server DBeaverも必要です。
ステップ1:DBeaver をインストールする
次のように DBeaver CE をダウンロードしてインストールします。
Linux: DBeaver Web サイトの ダウンロード ページから Linux インストーラーの 1 つをダウンロードして実行します。
snap
およびflatpak
インストールオプションもこのページで提供されています。macOS: 自作 を使用して
brew install --cask dbeaver-community
を実行するか、 MacPorts を使用してsudo port install dbeaver-community
を実行します。 macOS インストーラーは、DBeaver Web サイトの ダウンロード ページからも入手できます。Windows: チョコレート を使用して
choco install dbeaver
を実行します。 Windows インストーラは、DBeaver Web サイトの ダウンロード ページからも入手できます。
ステップ 2: DBeaver 用の JDBC ドライバ Databricks を設定する
以前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DBeaver をセットアップします。
DBeaverを起動します。
新しいデータベースを作成するかどうかを確認するメッセージが表示されたら、[ いいえ] をクリックします。
データベースへの接続またはデータベースの選択を求めるメッセージが表示されたら、[ キャンセル] をクリックします。
[ データベース > ドライバー マネージャー] をクリックします。
[ドライバー マネージャー] ダイアログ ボックスで、[新規作成] をクリックします。
[ 新しいドライバーの作成 ] ダイアログ ボックスで、[ ライブラリ] タブをクリックします。
[ ファイルの追加] をクリックします。
Databricks JDBC ドライバーを抽出したフォルダーに移動します。
1 つ下のレベルに移動して、
.jar
ファイルを見つけます。.jar
ファイルをハイライト表示し、[開く]をクリックします。[設定] タブの [ドライバー名] に「
Databricks
」と入力します。[設定] タブの [クラス名] に「
com.databricks.client.jdbc.Driver
」と入力します。OK をクリックします。
[ドライバー マネージャー] ダイアログ ボックスで、[閉じる] をクリックします。
ステップ 3: DBeaver を Databricks データベースに接続する
DBeaver を使用してクラスターに接続するか、SQLウェアハウスを使用して Databricks ワークスペース内のデータベースにアクセスします。
DBeaver で、[ データベース] > [新しいデータベース接続] をクリックします。
[ データベースへの接続 ] ダイアログ ボックスの [ すべて ] タブで、[ Databricks] をクリックし、[ 次へ] をクリックします。
[ メイン ] タブをクリックし、Databricks リソースの [JDBC URL ] フィールドに値を入力します。 JDBC URL フィールドの構文については、「Databricks JDBC ドライバーの認証設定」を参照してください。
[ 接続のテスト] をクリックします。
ヒント
接続をテストする前に、Databricks リソースを開始する必要があります。 そうしないと、リソースの開始中にテストが完了するまでに数分かかる場合があります。
接続に成功したら、[ 接続テスト ] ダイアログ ボックスで [OK] をクリックします。
[ データベースへの接続 ] ダイアログ ボックスで、[ 完了] をクリックします。
データベースナビゲータ ウィンドウに、 Databricks エントリが表示されます。接続の名前を変更して識別しやすくするには:
[Databricks] を右クリックし、[接続の編集] をクリックします。
[ 接続構成 ] ダイアログ ボックスで、[ 全般] をクリックします。
[ 接続名] で、
Databricks
を別の接続名に置き換えます。OK をクリックします。
DBeaver がアクセスするリソースごとに、この手順の手順を繰り返します。
ステップ 4: DBeaver を使用してデータオブジェクトを参照する
DBeaver を使用して、Databricks ワークスペース内のデータ オブジェクト (テーブルとテーブル プロパティ、ビュー、インデックス、データ型、その他のデータ オブジェクトの種類など) にアクセスします。
DBeaver の [データベースナビゲータ ] ウィンドウで、使用する接続を右クリックします。
[接続] が有効になっている場合は、それをクリックします。(接続が無効になっている場合は、既に 接続 されています)。
ヒント
リソースに接続する前に、リソースを開始する必要があります。 そうしないと、リソースの開始中に接続が完了するまでに数分かかる場合があります。
接続した接続を展開します。
使用可能なデータオブジェクトを展開して参照します。 データ オブジェクトをダブルクリックすると、その詳細情報が表示されます。
このステップの手順を繰り返して、追加のデータオブジェクトにアクセスします。
ステップ 5: DBeaver を使用して SQL ステートメントを実行する
DBeaver を使用して、samples
カタログのnyctaxi
スキーマからサンプルtrips
テーブルをロードします。
DBeaver の [データベースナビゲータ ] ウィンドウで、使用する接続を右クリックします。
[接続] が有効になっている場合は、それをクリックします。(接続が無効になっている場合は、既に 接続 されています)。
ヒント
リソースに接続する前に、リソースを開始する必要があります。 そうしないと、リソースの開始中に接続が完了するまでに数分かかる場合があります。
[SQL エディタ] > [新しい SQL スクリプト] をクリックします。
[(connection-name) Script-1] タブで、次の SQL ステートメントを入力します。
SELECT * FROM samples.nyctaxi.trips;
「SQL エディター」>「SQL スクリプトの実行」をクリックします。
次のステップ
データベース オブジェクト エディター を使用して、データベース オブジェクトのプロパティ、データ、およびエンティティ関係図を操作します。
データ ・エディター を使用して、データベース表またはビュー内のデータを表示および編集します。
SQL スクリプトを操作するには、 SQL エディター を使用します。
DBeaverで エンティティ関係図 (ERD)を操作します。
DBeaverとの間でデータをインポートおよびエクスポート します。
DBeaverを使用してデータを移行します 。
DBeaver の JDBC ドライバの問題をトラブルシューティングします 。