LakeFlow Connectのコミュニティ コネクタ
備考
ベータ版
この機能はベータ版です。ワークスペース管理者は、 プレビュー ページからこの機能へのアクセスを制御できます。Databricksのプレビューを管理するを参照してください。
コミュニティ コネクタは、マネージド コネクタのサポートなしでLakeFlow Connectソースに拡張するオープンソース コネクタです。 コミュニティがそれらを構築し、維持します。 以下の選択肢があります。
-
- 登録済みのコミュニティコネクタを使用する
- 登録済みのコミュニティコネクタを使用して、サポートされているソースからDatabricksにデータを取り込みます。
-
- カスタムコネクタを作成する
- コミュニティフレームワークとテンプレートを使用して、新しいソース用のカスタムコネクタを作成します。
コミュニティコネクターの仕組み
コミュニティ コネクタは、 Spark PythonデータソースAPIをラップするLakeflowConnectインターフェイス上に構築されています。 各コネクタは認証、スキーマ検出、および増分データの読み取りを処理するため、 LakeFlow Spark宣言型パイプラインをサポートする取り込みパイプラインを作成、構成、実行できます。
コミュニティ コネクタを使用すると、 Databricksコネクタのソース コードをGitHubリポジトリから指定したワークスペース ディレクトリに複製します。 次に、パイプラインはランタイム時にコネクタのソース コードを読み取り、構成されたソースに対して取り込みロジックを実行します。
サポートされているソース
コミュニティは定期的に新しいコネクタを登録します。 サポートされているソースの最新リストについては、 Databricksワークスペースのデータ追加 UI (データ 取り込み ) またはGitHubのLakeFlowコミュニティ コネクタリポジトリを参照してください。
考慮事項
- コミュニティコネクターは現在、積極的に開発中です。インターフェースおよび動作は変更される場合があります。
- Databricksはコミュニティコネクタを管理していません。これらはDatabricksのSLA(サービスレベル契約)の対象ではなく、将来の互換性も保証されません。
フィードバックを送信する
LakeFlowコミュニティコネクタリポジトリでバグを報告し、機能リクエストを送信してください。