Unity Catalog ボリュームにファイルをアップロードする
ボリュームへのアップロード UI を使用すると、構造化データ、半構造化データ、非構造化データなど、任意の形式のファイルを Unity Catalog ボリュームにアップロードできます。Unity Catalogボリュームとはを参照してください。
アップロードできるファイルは 5 ギガバイトを超えることはできません。
-
Databricks Runtime 13.3 LTS 以降ではDatabricks、専用または標準アクセスモード (以前のシングルユーザーおよび共有) でコンピュートのライブラリ
.whl
格納するためにボリュームを使用することをお勧めします。 -
Databricks Runtime 13.3 LTS 以降では、Databricks は、専用または標準アクセスモード (以前のシングルユーザーおよび共有) でコンピュートの JAR と init スクリプトを格納するためにボリュームを使用することをお勧めします。
アップロードしたファイルから Unity Catalog マネージドテーブルを作成できます。 ボリューム内のデータからのテーブルの作成を参照してください。
また、ボリュームにアップロードされたファイルに対して、さまざまな機械学習およびデータサイエンスのワークロードを実行することもできます。 さらに、ライブラリ、証明書、および任意の形式のその他の構成ファイル (.whl など) をアップロードできます または.txt、 クラスター ライブラリ、ノートブック スコープのライブラリ、またはジョブの依存関係を構成するために使用するもの。
ボリュームにファイルをアップロードするためのUIには、どこからアクセスできますか?
この UI には、次の方法でアクセスできます。
- サイドバーで、「 新規 」> 「データを追加」 >「 ファイルをボリュームにアップロード 」をクリックします。
- カタログエクスプローラーで、「 ボリュームに追加 」> 「アップロード」 をクリックします。 また、カタログエクスプローラーでボリュームを参照しながら、ファイルをボリュームまたはボリューム内のディレクトリに直接アップロードすることもできます。
- ノートブック内から、[ ファイル ] > [ ファイルをボリュームにアップロード ] をクリックします。
ボリュームは、Databricks Runtime 13.3 LTS 以降でのみサポートされます。 Databricks Runtime 12.2 LTS 以前では、/Volumes
パスに対する操作は成功する可能性がありますが、コンピュート クラスターにアタッチされたエフェメラル ストレージ ディスクにデータを書き込むのではなく、期待どおりに Unity Catalog ボリュームにデータを永続化する可能性があります。
始める前に
Unity Catalog ボリュームにファイルをアップロードする前に、次のものが必要です。
- Unity Catalog が有効になっているワークスペース。 詳しくは、「Unity Catalogの設定と管理」を参照してください。
- ファイルのアップロード先のボリュームに対する
WRITE VOLUME
権限。 - 親スキーマに対する
USE SCHEMA
権限 - 親カタログの
USE CATALOG
特典。
詳細については、「 Unity Catalog 特権とセキュリティ保護可能なオブジェクト」を参照してください。
ボリュームにファイルをアップロードする手順
Unity Catalog ボリュームにファイルをアップロードするには、次の操作を行います。
-
[新規 ] > [データの追加 ] をクリックします。
-
「 ファイルをボリュームにアップロード 」をクリックします。
-
ボリュームまたはボリューム内のディレクトリを選択するか、ボリュームパスを貼り付けます。
- ターゲット・スキーマにボリュームが存在しない場合は、ダイアログを使用して新しいボリュームを作成できます。
- オプションで、ターゲット・ディレクトリーへの絶対パスを指定して、ターゲット・ボリューム内に新しいディレクトリーを作成できます。
-
参照ボタンをクリックするか、ファイルをドロップゾーンに直接ドラッグアンドドロップします。
Unity Catalogにファイルをアップロードするその他の方法については、「Unity Catalog ボリューム内のファイルの操作」を参照してください。