DataGripとDatabricksの統合
この記事では、サードパーティによって開発されたDataGripについて説明します。 プロバイダーに問い合わせるには、 DataGrip サポートを参照してください。
DataGrip は、クエリコンソール、スキーマナビゲーション、説明プラン、スマートコード補完、リアルタイム分析とクイックフィックス、リファクタリング、バージョン管理統合などの機能を提供するデータベース開発者向けの統合開発環境(IDE)です。
この記事では、ローカルの開発マシンを使用して DataGrip をインストール、構成、および使用し、Databricks でデータベースを操作する方法について説明します。
この記事は、macOS、 Databricks JDBC ドライバー バージョン 2.6.36、 DataGrip バージョン 2023.3.1 でテストされました。
必要条件
DataGripをインストールする前に、ローカルの開発マシンが次の要件を満たしている必要があります。
- Linux、macOS、または Windows オペレーティング システム。
- Databricks JDBC ドライバーをローカル開発マシンにダウンロードし、ダウンロードした
DatabricksJDBC42-<version>.zip
ファイルからDatabricksJDBC42.jar
ファイルを抽出します。 - Databricksクラスター またはSQL ウェアハウス DataGripで に接続します。
ステップ1:DataGripのインストール
- Linux :
.zip
ファイルをダウンロードし、その内容を抽出して、Install-Linux-tar.txt
ファイルの指示に従ってください。 - macOS:
.dmg
ファイルをダウンロードして実行します。 - Windows :
.exe
ファイルをダウンロードして実行します。
DataGrip詳細については、DataGrip Web サイトの「 のインストール 」を参照してください。
ステップ 2: DataGrip の Databricks JDBC ドライバーを構成する
前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DataGrip を設定します。
- DataGripを起動します。
- 「File > データソース 」をクリックします。
- [データソースとドライバー] ダイアログ ボックスで、[ ドライバー] タブをクリックします。
- + ( ドライバー ) ボタンをクリックしてドライバーを追加します。
- [名前] に
Databricks
と入力します。 - [全般 ] タブの [ドライバー ファイル ] の一覧で、[ + ] ( 追加 ) ボタンをクリックします。
- 「カスタム JAR」をクリックします 。
- 前に抽出した
DatabricksJDBC42.jar
ファイルを参照して選択し、[ 開く ] をクリックします。 - [クラス ] で [
com.databricks.client.jdbc.Driver
] を選択します。 - 「 OK 」をクリックします。
ステップ3:DataGripをDatabricksデータベースに接続する
-
DataGripで、[ファイル] > [データソース ] をクリックします。
-
「データソース」 タブで、「 + 」( 追加 )ボタンをクリックします。
-
前の手順で追加した Databricks ドライバーを選択します。
-
[ 全般 ] タブの [URL ] に、Databricks リソースの [JDBC URL ] フィールドの値を入力します。 JDBC URL フィールドの構文については、「Databricks JDBC ドライバーの認証設定」を参照してください。
ConnCatalog
ドライバー機能の設定を JDBC URL で指定しないと、スキーマを識別できません。
- [ テスト接続 ] をクリックします。
接続をテストする前に、リソースを開始してください。 そうしないと、リソースが開始するまでにテストが完了するまでに数分かかる場合があります。
-
接続が成功した場合は、[ スキーマ ] タブで、アクセスを許可するスキーマ ( [すべてのスキーマ ] など) のチェックボックスをオンにします。
-
「 OK 」をクリックします。
DataGripがアクセスする各リソースについて、この手順の手順を繰り返します。
ステップ4:DataGripを使用してテーブルを参照する
DataGrip を使用して、Databricks ワークスペース内のテーブルにアクセスします。
- DataGripの データベース ウィンドウで、リソースノードを展開し、参照するスキーマを展開し、 次にテーブル を展開します。
- テーブルをダブルクリックします。 テーブルの最初の行セットが表示されます。
この手順を繰り返して、追加のテーブルにアクセスします。
他のスキーマのテーブルにアクセスするには、 データベース ウィンドウのツールバーで「 データソースのプロパティ 」アイコンをクリックします。 [データソースとドライバー] ダイアログ ボックスの [スキーマ ] タブで、アクセスする追加の各スキーマのチェック ボックスをオンにし、[ OK] をクリックします。
ステップ5:DataGripを使用してSQLステートメントを実行する
DataGripを使用して、samples
カタログのnyctaxi
スキーマからサンプルtrips
テーブルをロードします。
-
DataGripで、[ファイル] >[新規>SQLファイル ]をクリックします。
-
ファイルの名前を入力します (例:
select_trips
. -
「
select_trips.sql
ファイル」タブで、次の SQL ステートメントを入力します。SQLSELECT * FROM samples.nyctaxi.trips;
-
SELECT
ステートメントを選択します。 -
[ファイル] タブのツールバーで、[ 実行 ] アイコンをクリックします。
次のステップ
- DataGripの クエリコンソール の詳細については、こちらをご覧ください。
- DataGripのデータ エディタ について学習します。
- DataGripのさまざまな ツールウィンドウ の詳細については、こちらをご覧ください。
- DataGripで検索する方法を学びます。
- DataGripでデータをエクスポートする方法については、こちらをご覧ください。
- DataGripで 正規表現を使用してテキストを検索し、置換 する方法を学びます。