メインコンテンツまでスキップ

Databricks Reposはどうなりましたか?

ReposはGitフォルダーと呼ばれるようになりました。 Repos と同様に、Git フォルダーを使用すると、バージョン管理のためにワークスペース フォルダーをリモート Git リポジトリと同期できます。

この変更は私にとって何を意味しますか?

コア機能は変更されておらず、用語のみが変更になっています。UI 操作では、「 Repos 」ではなく「 Gitフォルダー」が参照されるようになりました。

以前は、 [新規] > [リポジトリ] を選択して Git ベースのフォルダーを作成しました。

" リポジトリ " を参照するのに使用される " New " メニューオプション

次に、 「新規 > Git フォルダー」 を選択します。

「新規」メニューオプションで、「Gitフォルダ」を作成するように求められます

この変更により、バージョン管理されたフォルダーでの作業が簡素化されます。

  • 柔軟なフォルダー構成 : ワークスペース ファイル ツリーの任意のレベルで Git フォルダーを作成します。たとえば、 /Workspace/Users/<user email>/level_1/level_2/level_3/<Git folder name> 。Repos /Workspace/Repos/<user email>/<Repo name>のような固定レベルでのみ存在できます。
注記

GitフォルダーにはDatabricks SQLアセットやMLflowエクスペリメントなど、 Reposサポートしていないアセット タイプを含めることができます。 Databricks は、時間の経過とともに追加のアセットのシリアル化サポートを追加します。

  • 簡素化された UI : 別のRepos領域に移動せずに、ワークスペースでGitを直接操作できます。

何が変わったのでしょうか?

  • Git フォルダーは/Reposディレクトリの外部に存在することができます。
  • Git フォルダーを作成するには、 [新規] > [Git フォルダー] を選択します。新しい Git フォルダーが/Workspace/Users/<user-email>/の下に表示されます。
  • Git フォルダーは/Workspace/Users/<user-email>/の下の任意の深さに存在でき、複数の Git フォルダーを持つことができます。
  • Git フォルダーは、Repos ではサポートされないアセット タイプをサポートします。Databricks では、今後さらに多くの資産タイプに対するシリアル化サポートが追加される予定です。
  • Git フォルダーにはリモート リポジトリ URL が必要です。Reposこの要件はありませんでした。

現在のReposはどうなりますか?

Repos 、別のトップレベルの リポジトリ ノードではなく、 /Workspace/Reposの下のワークスペース UI に統合されるようになりました。

  • 既存の/Reposパスは引き続き機能します。/Repos/Workspace/Repos両方とも同じフォルダーを参照するため、 jobsdbutils.notebook.run 、および%run参照内のパスを変更する必要はありません。
  • まれに、このリダイレクトを機能させるためにワークスペースを 1 回変更する必要がある場合もあります。「ワークスペース オブジェクトへの参照」を参照してください。

Databricks では、Repos の代わりに新しい Git フォルダーを作成することをお勧めします。Git リポジトリを他のワークスペース アセットと同じ場所に配置すると、それらの検出と管理が容易になります。

Gitフォルダの権限

Git フォルダーは、他のワークスペース フォルダーと同じワークスペース フォルダー権限を使用します。ほとんどの Git 操作にはCAN_MANAGE権限が必要です。

Git フォルダーでコードを実行するための Databricks Runtime バージョン

Gitフォルダーと従来のRepos間の動作の一貫性を保つには、 Databricks Runtime 15.0 以降を使用してください。

現在の作業ディレクトリ(CWD)の動作

Databricks Runtime 14.0 以降では相対パスがサポートされており、すべてのノートブックに一貫したCWD エクスペリエンスが提供されます。以前のバージョンの Databricks Runtime では、Git フォルダーと非 Git フォルダー間で CWD 動作に一貫性がない可能性があります。

Python sys.path の動作

Databricks Runtime 14.3 以降では、従来のReposと同じsys.path動作がGitフォルダーで提供されます。 以前のバージョンでは、Git フォルダーのルート リポジトリ ディレクトリがsys.pathに自動的に追加されません。回避策として、フォルダー パスをsys.pathに手動で追加します。

例については、 「Python および R モジュールのインポート」を参照してください。

Pythonライブラリの優先順位

Databricks Runtime 14.3 以降では、 Gitフォルダー内で従来のReposと同じPythonライブラリの優先順位が提供されます。