メインコンテンツまでスキップ

DBFS でのテーブルの探索と作成

important

このドキュメントは廃止されており、更新されない可能性があります。 このコンテンツに記載されている製品、サービス、またはテクノロジはサポートされなくなりました。 「Databricks へのファイルのアップロード」、「ファイルのアップロードを使用したテーブルの作成または変更」、および「カタログ エクスプローラーとは」を参照してください。

従来の DBFS ファイルのアップロードおよびテーブル作成 UI には、 データの追加 UI からアクセスします。 新しいアイコン [DBFS > New > Data (新しいデータ)] をクリックします。

ノートブックから UI にアクセスするには、[ ファイル] > [データの追加 ] をクリックします。

Databricks では、データ オブジェクトの表示と ACL の管理のエクスペリエンスを向上させるために カタログ エクスプローラー を使用し、小さなファイルを Delta Lake に簡単に取り込むために [ ファイルのアップロードからテーブルを作成または変更 する] ページを使用することをお勧めします。

注記

この記事で説明する一部の要素の可用性は、ワークスペースの構成によって異なります。 ワークスペース管理者または Databricks アカウント チームにお問い合わせください。

データのインポート

Databricks で分析する小さなデータ ファイルがローカル マシンにある場合は、UI を使用して それらを DBFS にインポートできます。

注記

ワークスペース管理者はこの機能を無効にすることができます。 詳細については、「 データ アップロードの管理」を参照してください。

テーブルの作成

DBFS テーブル作成 UI新しいアイコン を起動するには、サイドバーの [ 新規] をクリックするか データ追加 UI の[DBFS] ボタンをクリックします。DBFS のファイルからテーブルにデータを取り込むことも、ファイルをアップロードすることもできます。

UI では、 外部テーブルのみを作成できます。

  1. データソースを選択し、対応するセクションの手順に従ってテーブルを設定します。

    Databricks ワークスペース管理者が [ファイルのアップロード] オプションを無効にしている場合、ファイルをアップロードするオプションはありません。テーブルは、他のデータソースのいずれかを使用して作成できます。

    ファイルのアップロードの手順

    1. ファイルを [ ファイル ] ドロップゾーンにドラッグするか、ドロップゾーンをクリックしてファイルを参照して選択します。 アップロード後、ファイルごとにパスが表示されます。 パスは /FileStore/tables/<filename>-<integer>.<file-type>のようになります。 ノートブックでこのパスを使用して、データを読み取ることができます。
    2. 「UI を使用してテーブルを作成 」をクリックします。
    3. [クラスター] ドロップダウンで、クラスターを選択します。

    DBFS の手順

    1. ファイルを選択します。
    2. 「UI を使用してテーブルを作成 」をクリックします。
    3. [クラスター] ドロップダウンで、クラスターを選択します。
  2. プレビュー・テーブル 」をクリックして、テーブルを表示します。

  3. [テーブル名 ] フィールドで、必要に応じてデフォルトのテーブル名を上書きします。テーブル名には、小文字の英数字とアンダースコアのみを含めることができ、小文字またはアンダースコアで始める必要があります。

  4. データベースで作成 」フィールドで、選択した default データベースをオプションで上書きします。

  5. [ファイルの種類 ] フィールドで、必要に応じて、推論されたファイルの種類を上書きします。

  6. ファイルタイプが CSV の場合:

    1. [列区切り記号 ] フィールドで、推論された区切り記号を上書きするかどうかを選択します。
    2. 最初の行を列のタイトルとして使用するかどうかを示します。
    3. スキーマを推論するかどうかを示します。
  7. ファイルの種類が JSON の場合は、ファイルが複数行であるかどうかを示します。

  8. [ テーブルを作成 ] をクリックします。

データベースとテーブルの表示

注記

Catalog Explorer が有効になっているワークスペースは、以下で説明する従来の動作にアクセスできません。

サイドバーカタログアイコン カタログ をクリックします。Databricks 、アクセス権を持つ稼働中のクラスターを選択します。 [データベース] フォルダには、 default データベースが選択されているデータベースの一覧が表示されます。 「テーブル」フォルダには、 default データベース内のテーブルのリストが表示されます。

テーブル リストの作成

クラスターは、[データベース] メニューから変更したり、 テーブル UI を作成したりテーブル UI を表示したりできます。 たとえば、[データベース] メニューから次のようにします。

  1. [データベース] フォルダの上部にある ダウンキャレット 下矢印をクリックします。

  2. クラスターを選択します。

    クラスターの選択

テーブルの詳細の表示

テーブルの詳細ビューには、テーブルスキーマとサンプルデータが表示されます。

  1. サイドバーカタログアイコン カタログ をクリックします。

  2. [データベース] フォルダで、データベースをクリックします。

  3. [テーブル] フォルダで、テーブル名をクリックします。

  4. クラスタードロップダウンで、オプションで別のクラスターを選択して、テーブルプレビューをレンダリングします。

    テーブルの詳細

注記

テーブルのプレビューを表示するには、Spark SQL クラスター ドロップダウンで選択したクラスターに対してクエリを実行します。クラスターですでにワークロードが実行されている場合、テーブルプレビューの読み込みに時間がかかることがあります。

UI を使用したテーブルの削除

  1. サイドバーカタログアイコン カタログ をクリックします。
  2. テーブル名の横にある メニュードロップダウン をクリックし、[ 削除 ] を選択します。