DataGrip と Databricks の統合
注
この記事では、サードパーティによって開発されたDataGripについて説明します。 プロバイダーに問い合わせるには、 DataGrip サポートを参照してください。
DataGrip は、データベース開発者向けの統合開発環境 (IDE) であり、クエリーコンソール、スキーマナビゲーション、実行計画、スマートコード補完、リアルタイム分析とクイックフィックス、リファクタリング、バージョン管理の統合、およびその他の機能を提供します。
この記事では、ローカル開発コンピューターを使用して DataGrip をインストール、構成、および使用して Databricks のデータベースを操作する方法について説明します。
注
この記事は、macOS、 Databricks JDBC ドライバー バージョン 2.6.36、 DataGrip バージョン 2023.3.1 でテストされています。
要件
DataGrip をインストールする前に、ローカル開発マシンが以下の要件を満たしている必要があります。
Linux、macOS、または Windows オペレーティング システム。
Databricks JDBC ドライバー をローカルの開発コンピューターにダウンロードし、ダウンロードした
DatabricksJDBC42-<version>.zip
ファイルからDatabricksJDBC42.jar
ファイルを抽出します。Databricksに接続するための クラスター または SQL ウェアハウス DataGrip。
ステップ1: DataGrip をインストールする
Linux:
.zip
ファイルをダウンロードし、その内容を抽出して、Install-Linux-tar.txt
ファイルの指示に従います。macOS:
.dmg
ファイルをダウンロードして実行します。Windows:
.exe
ファイルをダウンロードして実行します。
詳細については、DataGrip Web サイトで DataGrip をインストールする を参照してください。
ステップ 2: DataGrip 用の Databricks JDBC ドライバーを構成する
以前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DataGrip をセットアップします。
DataGripを起動します。
[ ファイル] > [データソース] をクリックします。
[データソースとドライバ]ダイアログ ボックスで、[ドライバ]タブをクリックします。
+(ドライバ)ボタンをクリックしてドライバを追加します。
[名前] に「
Databricks
」と入力します。[全般] タブの [ドライバー ファイル] リストで、[+ (追加)] ボタンをクリックします。
「 カスタム JAR」をクリックします。
前に抽出した
DatabricksJDBC42.jar
ファイルを参照して選択し、[ 開く] をクリックします。[クラス] で [
com.databricks.client.jdbc.Driver
] を選択します。OK をクリックします。
ステップ 3: DataGrip を Databricks データベースに接続する
DataGrip で、[ ファイル > データソース] をクリックします。
[データソース] タブで、[+ (追加)] ボタンをクリックします。
前の手順で追加した Databricks ドライバーを選択します。
[全般] タブの [URL] に、Databricks リソースの [JDBC URL] フィールドの値を入力します。JDBC URL フィールドの構文については、「Databricks JDBC ドライバーの認証設定」を参照してください。
注
ConnCatalog
ドライバー機能の設定を JDBC URL で指定しないと、スキーマを識別できません。[ 接続のテスト] をクリックします。
ヒント
接続をテストする前に、リソースを開始する必要があります。 そうしないと、リソースの開始中にテストが完了するまでに数分かかる場合があります。
接続が成功した場合は、[ スキーマ ] タブで、アクセスできるようにするスキーマのボックス ( [すべてのスキーマ] など) をオンにします。
OK をクリックします。
DataGrip がアクセスするリソースごとに、この手順を繰り返します。
ステップ 4: DataGrip を使用してテーブルを参照する
DataGrip を使用して、Databricks ワークスペース内のテーブルにアクセスします。
DataGrip の データベース ウィンドウで、リソース ノードを展開し、参照するスキーマを展開して、 テーブルを展開します。
テーブルをダブルクリックします。 テーブルの最初の行セットが表示されます。
このステップ の手順を繰り返して、追加のテーブルにアクセスします。
他のスキーマのテーブルにアクセスするには、 データベース ウィンドウのツール バーで [データソースのプロパティ ] アイコンをクリックします。 [データソースとドライバー] ダイアログ ボックスの [スキーマ] タブで、アクセスする追加の各スキーマのチェック ボックスをオンにし、[OK ] をクリックします。
ステップ 5: DataGripを使用して SQL ステートメントを実行する
DataGripを使用して、samples
カタログのnyctaxi
スキーマからサンプルtrips
テーブルをロードします。
DataGripで、[ファイル]>[ 新規>SQLファイル]をクリックします。
ファイルの名前を入力します(例:
select_trips
)。「
select_trips.sql
ファイル」タブで、次のSQL文を入力します。SELECT * FROM samples.nyctaxi.trips;
SELECT
ステートメントを選択します。ファイルタブのツールバーで、[ 実行] アイコンをクリックします。
次のステップ
DataGrip のクエリ コンソールの詳細については、こちらをご覧ください。
DataGrip のデータ エディター について説明します。
DataGrip のさまざまな ツール ウィンドウ の詳細については、こちらをご覧ください。
DataGripで検索する方法を学びます。
DataGrip でデータをエクスポートする方法を学びます。
DataGrip で 正規表現を使用してテキストを検索して置換 する方法について説明します。