Databricks 統合の概要
Databricksは、さまざまなデータソースやBIツールに接続するための統合機能を提供しています。さらに、Databricks開発者ツールを使用すると、ローカルマシンからDatabricksに接続して、ワークフローの自動化、カスタムソリューションの構築などを行うことができます。
パートナー
技術パートナー ソリューションを使用すると、 DatabricksクラスターおよびSQLをより迅速かつ簡単に統合できます。
詳細については、 「パートナー」を参照してください。
データソース
Databricks は、CSV、 Delta Lake、JSON、Parquet、XML などのさまざまなデータ形式や、Amazon S3、Google BigQuery、Cloud Storage、Snowflake などのデータ ストレージ プロバイダーとの間でデータの読み取りと書き込みを行うことができます。
接続手順を含む包括的なリストについては、「 データソースと外部サービスへの接続 」および 「データ形式のオプション」を参照してください。
BI ツール
Databricksは、Power BIやTableauなどの、ユーザーに人気のあるBIツールとの統合を検証済みです。DatabricksのクラスターやSQLウェアハウスを介し、多くの場合ローコードまたはノーコードでデータを操作できます。
接続手順を含む包括的なリストについては、BI と視覚化を参照してください。
その他のETLツール
Databricksは、あらゆる種類のデータソースへのアクセスに加えて、dbt、Prophecy、Azure Data FactoryなどのETL/ELTツール、Airflowなどのデータパイプラインオーケストレーションツール、DataGrip、DBeaver、SQL Workbench/JなどのSQLデータベースツールとの統合を提供します。
接続手順については、 「データの準備と変換」およびSQLコネクタ、ライブラリ、ドライバー、 APIs 、およびツール」を参照してください。
Databricks Apps
Databricks Appsを活用すると、開発者は安全なデータおよびAIアプリケーションをDatabricksプラットフォーム上で直接構築および展開できるため、別のインフラストラクチャが不要になります。 アプリはサーバーレス プラットフォーム上で実行され、データガバナンスのUnity Catalog 、データのクエリ用のDatabricks SQL 、認証用のOAuthなどの主要なプラットフォーム サービスと統合されます。
詳細については、 Databricks Appsを参照してください。
Gitフォルダ
Databricks Git フォルダーは、お気に入りの Git プロバイダーとのリポジトリ レベルの統合を提供するため、Databricks ノートブックでコードを開発し、それをリモート Git リポジトリと同期することができます。Databricks Git フォルダーを参照してください。
開発者ツール
Databricks 、 Databricks CLIやDatabricks Connectなどの開発者ツールを提供します。これらを使用すると、ワークフローをプログラムで実行してDatabricksコンピュートにアクセスし、お気に入りの IDE でDatabricksと統合するカスタム ソリューションを構築できます。
開発者をサポートするツールの包括的な一覧については、 Databricks での開発を参照してください。