外部システムへの接続
Databricks は、多くのクラウドネイティブデータシステムへの組み込み統合と、他のデータシステムに接続するための拡張可能な JDBC サポートを提供します。
このセクションで説明するコネクタは、主に外部データ システム内の 1 つのテーブルへの接続の構成に重点を置いています。 これらのドライバーの一部を使用して、データを外部システムに書き戻すこともできます。
読み取り専用のデータ接続の場合、 Databricks では、データベース全体を外部システムからの Databricks に同期でき、 Unity Catalogによって管理されるレイクハウスフェデレーションを使用することをお勧めします。 「レイクハウスフェデレーションとは」を参照してください。
Partner Connectは、多くの一般的なエンタープライズデータシステムへの統合も提供します。 多くの Partner Connect ソリューションは、データソースに接続するだけでなく、レイクハウス内のデータを最新の状態に保つための簡単な ETL を促進します。 「Databricks Partner Connect とは」を参照してください。
JDBC を使用して Databricks に接続するデータソースは何ですか?
JDBC を使用して、多くのデータソースに接続できます。Databricks Runtime には、多数の JDBC データベース用のドライバーが含まれていますが、優先データベースに接続するには、ドライバーまたは別のドライバー バージョンをインストールする必要がある場合があります。 サポートされているデータベースには、次のものがあります。
- Databricksを用いたPostgreSQLのクエリー
- Databricksを用いたMySQLのクエリー
- Databricksを用いたMariaDBのクエリー
- Databricksを用いたSQL Serverのクエリー
- Databricksコネクタを使用した別のDatabricksワークスペースへの接続
Databricks はどのデータサービスと統合しますか?
次のデータサービスでは、接続設定、セキュリティ認証情報、およびネットワーク設定を構成する必要があります。 AWS アカウントまたは Databricks ワークスペースの管理者権限またはパワーユーザー権限が必要な場合があります。 一部のライブラリでは、 Databricks ライブラリ を作成し、それをクラスタにインストールする必要があります。