メインコンテンツまでスキップ

DataGripとDatabricksの統合

注記

この記事では、サードパーティによって開発されたDataGripについて説明します。 プロバイダーに問い合わせるには、 DataGrip サポートを参照してください。

DataGrip は、クエリコンソール、スキーマナビゲーション、説明プラン、スマートコード補完、リアルタイム分析とクイックフィックス、リファクタリング、バージョン管理統合などの機能を提供するデータベース開発者向けの統合開発環境(IDE)です。

この記事では、ローカルの開発マシンを使用して DataGrip をインストール、構成、および使用し、Databricks でデータベースを操作する方法について説明します。

注記

この記事は、macOS、 Databricks JDBC ドライバー バージョン 2.6.36、 DataGrip バージョン 2023.3.1 でテストされました。

必要条件

DataGripをインストールする前に、ローカルの開発マシンが次の要件を満たしている必要があります。

  • Linux、macOS、または Windows オペレーティング システム。
  • Databricks JDBC ドライバーをローカル開発マシンにダウンロードし、ダウンロードした DatabricksJDBC42-<version>.zip ファイルから DatabricksJDBC42.jar ファイルを抽出します。
  • Databricksクラスター またはSQL ウェアハウス DataGripで に接続します。

ステップ1:DataGripのインストール

DataGripをダウンロードしてインストールします

  • Linux : .zip ファイルをダウンロードし、その内容を抽出して、 Install-Linux-tar.txt ファイルの指示に従ってください。
  • macOS: .dmg ファイルをダウンロードして実行します。
  • Windows : .exe ファイルをダウンロードして実行します。

DataGrip詳細については、DataGrip Web サイトの「 のインストール 」を参照してください。

ステップ 2: DataGrip の Databricks JDBC ドライバーを構成する

前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DataGrip を設定します。

  1. DataGripを起動します。
  2. 「File > データソース 」をクリックします。
  3. [データソースとドライバー] ダイアログ ボックスで、[ ドライバー] タブをクリックします。
  4. + ( ドライバー ) ボタンをクリックしてドライバーを追加します。
  5. [名前]Databricks と入力します。
  6. [全般 ] タブの [ドライバー ファイル ] の一覧で、[ + ] ( 追加 ) ボタンをクリックします。
  7. 「カスタム JAR」をクリックします
  8. 前に抽出した DatabricksJDBC42.jar ファイルを参照して選択し、[ 開く ] をクリックします。
  9. [クラス ] で [com.databricks.client.jdbc.Driver] を選択します。
  10. OK 」をクリックします。

ステップ3:DataGripをDatabricksデータベースに接続する

  1. DataGripで、[ファイル] > [データソース ] をクリックします。

  2. 「データソース」 タブで、「 + 」( 追加 )ボタンをクリックします。

  3. 前の手順で追加した Databricks ドライバーを選択します。

  4. [ 全般 ] タブの [URL ] に、Databricks リソースの [JDBC URL ] フィールドの値を入力します。 JDBC URL フィールドの構文については、「Databricks JDBC ドライバーの認証設定」を参照してください。

注記

ConnCatalog ドライバー機能の設定を JDBC URL で指定しないと、スキーマを識別できません。

  1. [ テスト接続 ] をクリックします。
ヒント

接続をテストする前に、リソースを開始してください。 そうしないと、リソースが開始するまでにテストが完了するまでに数分かかる場合があります。

  1. 接続が成功した場合は、[ スキーマ ] タブで、アクセスを許可するスキーマ ( [すべてのスキーマ ] など) のチェックボックスをオンにします。

  2. OK 」をクリックします。

DataGripがアクセスする各リソースについて、この手順の手順を繰り返します。

ステップ4:DataGripを使用してテーブルを参照する

DataGrip を使用して、Databricks ワークスペース内のテーブルにアクセスします。

  1. DataGripの データベース ウィンドウで、リソースノードを展開し、参照するスキーマを展開し、 次にテーブル を展開します。
  2. テーブルをダブルクリックします。 テーブルの最初の行セットが表示されます。

この手順を繰り返して、追加のテーブルにアクセスします。

他のスキーマのテーブルにアクセスするには、 データベース ウィンドウのツールバーで「 データソースのプロパティ 」アイコンをクリックします。 [データソースとドライバー] ダイアログ ボックスの [スキーマ ] タブで、アクセスする追加の各スキーマのチェック ボックスをオンにし、[ OK] をクリックします。

ステップ5:DataGripを使用してSQLステートメントを実行する

DataGripを使用して、samplesカタログのnyctaxiスキーマからサンプルtripsテーブルをロードします。

  1. DataGripで、[ファイル] >[新規>SQLファイル ]をクリックします。

  2. ファイルの名前を入力します (例: select_trips.

  3. select_trips.sql ファイル」タブで、次の SQL ステートメントを入力します。

    SQL
    SELECT * FROM samples.nyctaxi.trips;
  4. SELECT ステートメントを選択します。

  5. [ファイル] タブのツールバーで、[ 実行 ] アイコンをクリックします。

次のステップ

追加のリソース