Databricksインテグレーションの概要
ここに記載されている記事は、Databricksと併せて使用できる様々なデータソース、BIツール、開発者ツールに接続する方法についての情報を提供するものです。これらの多くは、パートナーシステムと Partner Connectハブを通じて利用できます。
Partner Connect
Partner Connectは、検証済みのソリューションとDatabricksクラスターやSQLウェアハウスの統合を、より迅速かつ簡単に実行することを可能にするユーザーインターフェイスです。
詳細については、Databricks Partner Connectとは を参照してください。
データソース
Databricksでは、CSV、Delta Lake、JSON、Parquet、XML、その他の形式や、Amazon S3、Google BigQuery、Cloud Storage、Snowflake、その他のデータストレージプロバイダーなど、様々なデータ形式を対象にデータの読み込みや書き込みを実行できます。
「 データ取り込み」、「 データソースに接続」、および「 データ形式のオプション」を参照してください。
BIツール
Databricksは、Power BI、Tableauなど、ユーザーに人気のあるBIツールとの統合を検証しており、多くの場合はローコードおよびノーコードのエクスペリエンスで、DatabricksクラスターやSQLウェアハウスを介してデータを操作できるようになります。
接続手順を含む包括的な一覧については、「 BI と可視化」を参照してください。
その他のETLツール
Databricks は、あらゆる種類の Databricks へのアクセスに加えて、dbt、Prophecy、Azure Data Factory などの ETL/ELT ツール、Airflow などのデータパイプライン オーケストレーション ツール、DataGrip、DBeaver、SQL Workbench/J などの SQL データベース ツールとの統合を提供します。
接続手順については、以下を参照してください。
ETL ツール: データの準備と変換
SQLデータベースツール: SQL データベースツールを使用する
IDEおよびその他の開発者ツール
Databricksは、DataGrip、IntelliJ、PyCharm、Visual Studio Codeなどの開発者ツールをサポートしており、Databricksクラスター SQLウェアハウスを通してコードを書くことでデータを操作できます。
接続手順を含む総合的なリストについては、開発者ツールとガイダンスを参照してください。
Git
Databricks Git フォルダーは、お気に入りの Git プロバイダーとのリポジトリ レベルの統合を提供するため、Databricks ノートブックでコードを開発し、それをリモート Git リポジトリと同期できます。 「Databricks Git フォルダーと Git の統合」を参照してください。