Databricks Gitフォルダーの概念
Databricks Git フォルダーは、ワークスペース内に Git リポジトリを統合するビジュアル Git クライアントおよび API です。Git フォルダーを使用してノートブックやファイルでコードを開発し、バージョン管理、コラボレーション、CI/CD に Git を使用するソフトウェア開発のベスト プラクティスに従います。Git フォルダーは、リポジトリのクローン作成、コミットとプッシュ、プル、ブランチ管理、コミット時の差分の視覚的な比較などの一般的な Git 操作をサポートします。
このページの内容:
Gitフォルダの機能
Databricks Git フォルダーは、Git プロバイダーと統合することで、データおよび AI プロジェクトのソース管理を提供します。
Databricks ワークスペースの Git 機能を使用して、次の操作を行います。
- リモートGitリポジトリのクローン作成、プッシュ、プルを行います。
- マージ、リベース、競合の解決などの開発作業のためのブランチの作成と管理を行います。
- ipynbノートブックなどのノートブックを作成し、それらや他のファイルを編集します。
- コミット時に差異を視覚的に比較し、マージの競合を解決します。
詳細な手順については、 「Databricks Git フォルダーでの Git 操作の実行」を参照してください。
Git フォルダー API
Databricks Git フォルダーには、CI/CD パイプラインと統合するためのAPIがあります。たとえば、ワークスペースの Git フォルダーをプログラムで更新して、常に最新バージョンのコードが含まれるようにします。Databricks Gitフォルダーを使用したコード開発のベスト プラクティスについては、 「 Databricks Gitフォルダーを使用したCI/CDを参照してください。
Gitプロバイダー
Git プロバイダーは、Git ベースのソース管理システムをホストするサービスです。これらのプラットフォームには、ベンダーがホストするクラウド サービスと、組織が独自のハードウェアにインストールして管理するオンプレミス サービスの 2 つの主要な形式があります。GitHub、Microsoft、GitLab、Atlassian などの多くのプロバイダーは、クラウド SaaS とオンプレミス (多くの場合「セルフマネージド」と呼ばれる) の両方のオプションを提供しています。
Databricks Git フォルダーは統合された Git リポジトリを使用します。次のセクションにリストされているクラウドまたはエンタープライズ Git プロバイダーのいずれかがリポジトリをホストできます。
構成中に Git プロバイダーを選択するときは、クラウド (SaaS) システムとオンプレミス システムの違いを理解していることを確認してください。組織は多くの場合、VPN の背後に自己管理プロバイダーをホストしており、パブリック インターネットからアクセスできなくなる可能性があります。これらのバージョンの名前には、多くの場合「サーバー」または「セルフマネージド」が含まれます。組織でどちらを使用しているかわからない場合は、プロバイダーのドキュメントを確認するか、会社の管理者に問い合わせてください。
クラウド Git プロバイダーがサポートされているプロバイダー リストに表示されない場合は、 GitHub を 選択するとフォールバックとして機能する可能性がありますが、保証はされません。
GitHub をプロバイダーとして使用していて、クラウド バージョンとオンプレミス バージョンのどちらを使用しているかまだ不明な場合は、GitHub ドキュメントの「GitHub Enterprise Server について」を参照してください。
サポートされているクラウド Git プロバイダー
Databricks Git フォルダーは、次のクラウドベースの Git プロバイダーと統合されます。
-
GitHub 、 GitHub Advanced Enterprise、およびGitHub Enterprise クラウド
-
アトラシアン Bitbucket クラウド
-
GitLab と GitLab エンタープライズエディション
-
Microsoft Azure DevOps ( Azure Repos )
-
AWS CodeCommit
サポートされているオンプレミス Git プロバイダー
Databricks Git フォルダーは、次のオンプレミス Git プロバイダーと統合されます。
- GitHubエンタープライズサーバー
- Atlassian Bitbucket Server およびデータセンター
- GitLabセルフマネージド
- Microsoft Azure DevOps Server: URL が
dev.azure.com/*またはvisualstudio.com/*と一致しない場合、ワークスペース管理者は Microsoft Azure DevOps Server の URL ドメイン プレフィックスを明示的に許可リストに登録する必要があります。「許可リスト内の URL のみの使用を制限する」を参照してください。
インターネットからアクセスできないオンプレミスの Git リポジトリを統合する場合は、会社の VPN 内に Git 認証リクエスト用のプロキシもインストールする必要があります。Databricks Gitフォルダー ( Repos ) のプライベートGit接続を設定する」を参照してください。
Gitプロバイダーでアクセス人権を使用する方法については、 Git資格情報を構成し、リモート リポジトリをDatabricksに接続する」を参照してください。