Git フォルダーと Databricks 拡張機能 for Visual Studio Code の使用
Databricks では、Visual Studio Code の Databricks 拡張機能を構成するときに、ワークスペース ファイルを使用することをお勧めします。
このドキュメントは廃止されており、更新されない可能性があります。 このコンテンツに記載されている製品、サービス、またはテクノロジはサポートされなくなりました。 ここで説明するドキュメントでは、Visual Studio Code の Databricks 拡張機能の Git フォルダーの構成の詳細についてのみ説明します。 完全なドキュメントについては、「 Visual Studio Code の Databricks 拡張機能」を参照してください。
Visual Studio Code の Databricks 拡張機能では、Databricks ワークスペース内の Databricks Git フォルダー内のファイルの操作がサポートされています。Databricks Git フォルダーは、バージョン 0.3.15 より前のデフォルトの同期でした。しかし、もはや推奨されません。
Gitフォルダ内のファイルは、すべてのDatabricksワークスペースでデフォルトによって有効になりますが、管理者はREST APIを使用して無効にすることができます。この機能にアクセスできない場合は、ワークスペース管理者に問い合わせてください。
Visual Studio Code の Databricks 拡張機能は、作成したリポジトリでのみ機能します。 コードを実行するための Databricks クラスターの実行権限と、 Databricks Git フォルダにリポジトリを作成するための権限が必要です。
リポジトリを設定する
Databricks ワークスペースでワークスペース ディレクトリではなく Databricks Git フォルダーを使用する場合は、拡張機能とコード プロジェクトを開き、Databricks 構成プロファイルが既に設定されている状態で、Visual Studio Code の Databricks 拡張機能を使用して Databricks Git フォルダーに新しいリポジトリを作成して使用するか、Visual Studio Code の Databricks 拡張機能を使用して前に作成した Databricks Git フォルダー内の既存のリポジトリを選択します代わりに再利用したい。
Visual Studio Code の Databricks 拡張機能は、作成したリポジトリでのみ機能します。 ワークスペース内の既存のリポジトリを使用することはできません。
Visual Studio Code の Databricks 拡張機能で Databricks ワークスペース内の Databricks Git フォルダー内のリポジトリを使用できるようにするには、まず、次のように拡張機能の [同期: 宛先の種類 ] 設定を repo に設定する必要があります。
- 拡張機能とコード プロジェクトを開き、Databricks 構成プロファイルを既に設定している状態で、コマンド パレット ( [表示] > [コマンド パレット ]) に「
Preferences: Open User Settings
」と入力し、[ 基本設定: ユーザー設定を開く ] をクリックします。 - [ユーザー ] タブで [拡張機能 ] を展開し、[ Databricks ] をクリックします。
- [Sync: Destination Type ] で [ repo ] を選択します。
- Visual Studio Code を終了して再起動します。
新しいリポジトリを作成する
新しいリポジトリを作成するには、次の操作を行います。
-
[構成 ] ペインの [同期先] の横にある歯車 ( 同期先の構成 ) アイコンをクリックします。
-
コマンド パレット で、[ 新しい同期先の作成 ] をクリックします。
-
Databricks Git フォルダーに新しいリポジトリの名前を入力し、 Enter キーを押します。
この拡張機能は、リポジトリの名前の末尾に文字 の
.ide
を追加し、リポジトリのワークスペース パスをコード プロジェクトの.databricks/project.json
ファイルに追加します (例:"workspacePath": "/Workspace/Repos/someone@example.com/my-repo.ide"
.
リモート リポジトリの名前がローカル コード プロジェクトの名前と一致しない場合は、警告アイコンが表示され、次のメッセージが表示されます: リモート同期先の名前が現在の Visual Studio Code ワークスペース名と一致しません。名前を一致させる必要がない場合は、この警告を無視できます。
-
リポジトリを設定したら、[ 同期先] の横にある矢印の円 ( [同期の開始 ]) アイコンをクリックして、リポジトリとの同期を開始します。
Visual Studio Code の Databricks 拡張機能は、ローカルの Visual Studio Code プロジェクトからリモートの Databricks ワークスペース内の関連リポジトリへのファイル変更の一方向の自動同期のみを実行します。 これらのリモート・リポジトリ・ファイルは、一時的なものとして意図されています。 これらのファイルに対する変更は、ローカル プロジェクトに同期されないため、リモート リポジトリ内から開始しないでください。
既存のリポジトリを再利用する
以前に Visual Studio Code の Databricks 拡張機能を使用して作成した Databricks Git フォルダーに既存のリポジトリがあり、現在の Visual Studio Code プロジェクトで再利用する場合は、次の操作を行います。
-
[構成 ] ペインの [同期先] の横にある歯車 ( 同期先の構成 ) アイコンをクリックします。
-
コマンド パレット で、リストからリポジトリの名前を選択します。
この拡張機能は、リポジトリのワークスペース パスをコード プロジェクトの
.databricks/project.json
ファイル ("workspacePath": "/Workspace/Repos/someone@example.com/my-repo.ide"
など) に追加します。
リモート リポジトリの名前がローカル コード プロジェクトの名前と一致しない場合は、警告アイコンが表示され、次のメッセージが表示されます: リモート同期先の名前が現在の Visual Studio Code ワークスペース名と一致しません。名前を一致させる必要がない場合は、この警告を無視できます。
-
リポジトリを設定したら、[ 同期先] の横にある矢印の円 ( [同期の開始 ]) アイコンをクリックして、リポジトリとの同期を開始します。
Visual Studio Code の Databricks 拡張機能は、ローカルの Visual Studio Code プロジェクトからリモートの Databricks ワークスペース内の関連リポジトリへのファイル変更の一方向の自動同期のみを実行します。 これらのリモート・リポジトリ・ファイルは、一時的なものとして意図されています。 これらのファイルに対する変更は、ローカル プロジェクトに同期されないため、リモート リポジトリ内から開始しないでください。