Databricks 統合の概要
Databricksは、さまざまなデータソースやBIツールに接続するための統合機能を提供しています。さらに、Databricks開発者ツールを使用すると、ローカルマシンからDatabricksに接続して、ワークフローの自動化、カスタムソリューションの構築などを行うことができます。
Partner Connect
Partner Connectは、検証済みのソリューションとDatabricksクラスターやSQLウェアハウスの統合を、より迅速かつ簡単に実行することを可能にするユーザーインターフェイスです。
詳細については、Databricks Partner Connectとはを参照してください。
データソース
Databricks は、CSV、 Delta Lake、JSON、Parquet、XML などのさまざまなデータ形式や、Amazon S3、Google BigQuery、Cloud Storage、Snowflake などのデータ ストレージ プロバイダーとの間でデータの読み取りと書き込みを行うことができます。
データ取り込み、データソースと外部サービスへの接続、およびデータ形式のオプションを参照してください。
BI ツール
Databricksは、Power BIやTableauなどの、ユーザーに人気のあるBIツールとの統合を検証済みです。DatabricksのクラスターやSQLウェアハウスを介し、多くの場合ローコードまたはノーコードでデータを操作できます。
接続手順を含む包括的なリストについては、BI と視覚化を参照してください。
その他のETLツール
Databricksは、あらゆる種類のデータソースへのアクセスに加えて、dbt、Prophecy、Azure Data FactoryなどのETL/ELTツール、Airflowなどのデータパイプラインオーケストレーションツール、DataGrip、DBeaver、SQL Workbench/JなどのSQLデータベースツールとの統合を提供します。
接続手順については、 「データの準備と変換」およびSQLコネクタ、ライブラリ、ドライバー、 APIs 、およびツール」を参照してください。
Databricks Apps
Databricks Appsを活用すると、開発者は安全なデータおよびAIアプリケーションをDatabricksプラットフォーム上で直接構築および展開できるため、別のインフラストラクチャが不要になります。 アプリはサーバーレス プラットフォーム上で実行され、データガバナンスのUnity Catalog 、データのクエリ用のDatabricks SQL 、認証用のOAuthなどの主要なプラットフォーム サービスと統合されます。
詳細については、 Databricks Appsを参照してください。
Gitフォルダ
Databricks Git フォルダーは、お気に入りの Git プロバイダーとのリポジトリ レベルの統合を提供するため、Databricks ノートブックでコードを開発し、それをリモート Git リポジトリと同期することができます。Databricks Git フォルダーを参照してください。
開発者ツール
Databricks、DatabricksCLI やDatabricks Connect などの開発者ツールを提供します。これらを使用すると、ワークフローをプログラムで実行し、DatabricksSQL ウェアハウス などの コンピュートにアクセスし、お気に入りのDatabricks IDE で と統合するカスタム ソリューションを構築できます。
開発者をサポートするツールの包括的な一覧については、 Databricks での開発を参照してください。