Databricksインテグレーションの概要

ここに記載されている記事は、Databricksと併せて使用できる様々なデータソース、BIツール、開発者ツールに接続する方法についての情報を提供するものです。これらの多くは、パートナーシステムと Partner Connectハブを通じて利用できます。

Partner Connect

Partner Connectは、検証済みのソリューションとDatabricksクラスターやSQLウェアハウスの統合を、より迅速かつ簡単に実行することを可能にするユーザーインターフェイスです。

詳細については、「Databricks Partner Connectとは」 を参照してください。

データソース

Databricksでは、CSV、Delta Lake、JSON、Parquet、XML、等様々なデータ形式からデータを読み込み、書き込むことができます。また、Amazon S3、Google BigQuery、Cloud Storage、Snowflake等のデータストレージプロバイダーからもデータを読み書きすることが可能です。

データの取り込み」、「データソースに接続」、および「データ形式のオプション」を参照してください。

BIツール

Databricksは、Power BIやTableauなどといったユーザーに人気のあるBIツールとの統合を検証済です。DatabricksのクラスターやSQLウェアハウスを介し、多くの場合ローコードまたはノーコードでデータを操作できます。

接続手順を含む包括的な一覧については、「 BI と可視化」を参照してください。

その他のETLツール

Databricks は、あらゆる種類の データソース へのアクセスに加えて、dbt、Prophecy、Azure Data Factory などの ETL/ELT ツール、Airflow などのデータパイプラインオーケストレーションツール、DataGrip、DBeaver、SQL Workbench/J などのSQLデータベース ツールとの統合を提供します。

接続手順については、以下を参照してください。

IDEおよびその他の開発者ツール

Databricksは、DataGrip、IntelliJ、PyCharm、Visual Studio Codeなどの開発者ツールをサポートしており、DatabricksクラスターSQLウェアハウスを通してコードを書くことでデータを操作できます。

接続手順を含む総合的なリストについては、開発者ツールとガイダンスを参照してください。

Git

Databricks Git フォルダーは、お気に入りのGit プロバイダーとのリポジトリレベルの統合を提供します。それにより、Databricks ノートブックでコードを開発し、リモートGitリポジトリと同期することが可能です。 「Databricks Git フォルダーと Git の統合」を参照してください。