Unity Catalog ボリュームへのファイルのアップロード
ボリュームへのアップロード UI を使用すると、構造化データ、半構造化データ、非構造化データなど、任意の形式のファイルを Unity Catalog ボリュームにアップロードできます。Unity Catalogボリュームとはを参照してください。
アップロードできるファイルは 5 ギガバイトを超えることはできません。
Databricks Runtime 13.3 LTS 以降では、Databricks は、割り当て済みまたは共有アクセス モードを持つコンピュートの
.whl
ライブラリを格納するためにボリュームを使用することをお勧めします。Databricks Runtime 13.3 LTS 以降では、Databricks は JAR の格納にボリュームを使用し、割り当てアクセスモードまたは共有アクセスモードのコンピュートの initスクリプトを使用することをお勧めします。
アップロードされたファイルから Unity Catalog マネージドテーブルを作成できます。 「ボリューム内のデータからテーブルを作成する」を参照してください。
また、ボリュームにアップロードされたファイルに対して、さまざまな機械学習およびデータサイエンスワークロードを実行することもできます。 さらに、ライブラリ、証明書、および任意の形式のその他の構成ファイル (.whl など) をアップロードできます または.txt、 クラスター・ライブラリー、ノートブック・スコープ・ライブラリー、またはジョブの依存関係を構成するために使用するもの。
ボリュームにファイルをアップロードするためのUIには、どこからアクセスできますか?
この UI には、次の方法でアクセスできます。
サイドバーで、「 新規 」> 「データを追加」 >「 ファイルをボリュームにアップロード」をクリックします。
カタログエクスプローラーで、「 ボリュームに追加 」> 「アップロード」をクリックします。 また、カタログエクスプローラーでボリュームを参照しながら、ファイルをボリュームまたはボリューム内のディレクトリに直接アップロードすることもできます。
ノートブック内から、[ ファイル ] > [ ファイルをボリュームにアップロード] をクリックします。
注:
ボリュームは、Databricks Runtime 13.3 LTS 以降でのみサポートされます。 Databricks Runtime 12.2 LTS 以前では、/Volumes
パスに対する操作は成功する可能性がありますが、コンピュート クラスターにアタッチされたエフェメラル ストレージ ディスクにデータを書き込むのではなく、期待どおりに Unity Catalog ボリュームにデータを永続化する可能性があります。
始める前に
Unity Catalog ボリュームにファイルをアップロードする前に、次のものが必要です。
Unity Catalog が有効になっているワークスペース。 詳細については、「 Unity Catalog の設定と管理」を参照してください。
ファイルのアップロード先のボリュームに対する
WRITE VOLUME
権限。親スキーマに対する
USE SCHEMA
権限親カタログに対する
USE CATALOG
権限。
詳細については、「 Unity Catalog 特権とセキュリティ保護可能なオブジェクト」を参照してください。
ボリュームにファイルをアップロードするためのステップ
Unity Catalog ボリュームにファイルをアップロードするには、次の操作を行います。
[新規] > [データの追加] をクリックします。
「 ファイルをボリュームにアップロード」をクリックします。
ボリュームまたはボリューム内のディレクトリを選択するか、ボリュームパスを貼り付けます。
ターゲット・スキーマにボリュームが存在しない場合は、ダイアログを使用して新しいボリュームを作成できます。
オプションで、ターゲット・ディレクトリーへの絶対パスを指定して、ターゲット・ボリューム内に新しいディレクトリーを作成できます。
参照ボタンをクリックするか、ファイルをドロップゾーンに直接ドラッグアンドドロップします。
Unity Catalogにファイルをアップロードするその他の方法については、「Unity Catalog ボリューム内のファイルの操作」を参照してください。