メインコンテンツまでスキップ

Unity Catalog ボリュームにファイルをアップロードする

ボリュームへのアップロード UI を使用すると、構造化データ、半構造化データ、非構造化データなど、任意の形式のファイルを Unity Catalog ボリュームにアップロードできます。Unity Catalogボリュームとはを参照してください

アップロードできるファイルは 5 ギガバイトを超えることはできません。

  • Databricks Runtime 13.3 LTS 以降ではDatabricks、専用または標準アクセスモード (以前のシングルユーザーおよび共有) でコンピュートのライブラリ.whl格納するためにボリュームを使用することをお勧めします。

  • Databricks Runtime 13.3 LTS 以降では、Databricks は、専用または標準アクセスモード (以前のシングルユーザーおよび共有) でコンピュートの JAR と init スクリプトを格納するためにボリュームを使用することをお勧めします。

アップロードしたファイルから Unity Catalog マネージドテーブルを作成できます。 ボリューム内のデータからのテーブルの作成を参照してください。

また、ボリュームにアップロードされたファイルに対して、さまざまな機械学習およびデータサイエンスのワークロードを実行することもできます。 さらに、ライブラリ、証明書、および任意の形式のその他の構成ファイル (.whl など) をアップロードできます または.txt、 クラスター ライブラリ、ノートブック スコープのライブラリ、またはジョブの依存関係を構成するために使用するもの。

ボリュームにファイルをアップロードするためのUIには、どこからアクセスできますか?

この UI には、次の方法でアクセスできます。

  • サイドバーで、「 新規 」> 「データを追加」 >「 ファイルをボリュームにアップロード 」をクリックします。
  • カタログエクスプローラーで、「 ボリュームに追加 」> 「アップロード」 をクリックします。 また、カタログエクスプローラーでボリュームを参照しながら、ファイルをボリュームまたはボリューム内のディレクトリに直接アップロードすることもできます。
  • ノートブック内から、[ ファイル ] > [ ファイルをボリュームにアップロード ] をクリックします。
注記

ボリュームは、Databricks Runtime 13.3 LTS 以降でのみサポートされます。 Databricks Runtime 12.2 LTS 以前では、/Volumesパスに対する操作は成功する可能性がありますが、コンピュート クラスターにアタッチされたエフェメラル ストレージ ディスクにデータを書き込むのではなく、期待どおりに Unity Catalog ボリュームにデータを永続化する可能性があります。

始める前に

Unity Catalog ボリュームにファイルをアップロードする前に、次のものが必要です。

  • Unity Catalog が有効になっているワークスペース。 詳しくは、「Unity Catalogの設定と管理」を参照してください。
  • ファイルのアップロード先のボリュームに対する WRITE VOLUME 権限。
  • 親スキーマに対する USE SCHEMA 権限
  • 親カタログの USE CATALOG 特典。

詳細については、「 Unity Catalog 特権とセキュリティ保護可能なオブジェクト」を参照してください。

ボリュームにファイルをアップロードする手順

Unity Catalog ボリュームにファイルをアップロードするには、次の操作を行います。

  1. [新規 ] > [データの追加 ] をクリックします。

  2. ファイルをボリュームにアップロード 」をクリックします。

  3. ボリュームまたはボリューム内のディレクトリを選択するか、ボリュームパスを貼り付けます。

    • ターゲット・スキーマにボリュームが存在しない場合は、ダイアログを使用して新しいボリュームを作成できます。
    • オプションで、ターゲット・ディレクトリーへの絶対パスを指定して、ターゲット・ボリューム内に新しいディレクトリーを作成できます。
  4. 参照ボタンをクリックするか、ファイルをドロップゾーンに直接ドラッグアンドドロップします。

Unity Catalogにファイルをアップロードするその他の方法については、「Unity Catalog ボリューム内のファイルの操作」を参照してください。