DBFS でのテーブルの探索と作成
このドキュメントは廃止されており、更新されない可能性があります。 このコンテンツに記載されている製品、サービス、またはテクノロジはサポートされなくなりました。 「Databricks へのファイルのアップロード」、「ファイルのアップロードを使用したテーブルの作成または変更」、および「カタログ エクスプローラーとは」を参照してください。
従来の DBFS ファイルのアップロードおよびテーブル作成 UI には、 データの追加 UI からアクセスします。 [DBFS > New > Data (新しいデータ)] をクリックします。
ノートブックから UI にアクセスするには、[ ファイル] > [データの追加 ] をクリックします。
Databricks では、データ オブジェクトの表示と ACL の管理のエクスペリエンスを向上させるために カタログ エクスプローラー を使用し、小さなファイルを Delta Lake に簡単に取り込むために [ ファイルのアップロードからテーブルを作成または変更 する] ページを使用することをお勧めします。
この記事で説明する一部の要素の可用性は、ワークスペースの構成によって異なります。 ワークスペース管理者または Databricks アカウント チームにお問い合わせください。
データのインポート
Databricks で分析する小さなデータ ファイルがローカル マシンにある場合は、UI を使用して それらを DBFS にインポートできます。
ワークスペース管理者はこの機能を無効にすることができます。 詳細については、「 データ アップロードの管理」を参照してください。
テーブルの作成
DBFS テーブル作成 UI を起動するには、サイドバーの [ 新規] をクリックするか データ追加 UI の[DBFS] ボタンをクリックします。DBFS のファイルからテーブルにデータを取り込むことも、ファイルをアップロードすることもできます。
UI では、 外部テーブルのみを作成できます。
-
データソースを選択し、対応するセクションの手順に従ってテーブルを設定します。
Databricks ワークスペース管理者が [ファイルのアップロード] オプションを無効にしている場合、ファイルをアップロードするオプションはありません。テーブルは、他のデータソースのいずれかを使用して作成できます。
ファイルのアップロードの手順
- ファイルを [ ファイル ] ドロップゾーンにドラッグするか、ドロップゾーンをクリックしてファイルを参照して選択します。 アップロード後、ファイルごとにパスが表示されます。 パスは
/FileStore/tables/<filename>-<integer>.<file-type>
のようになります。 ノートブックでこのパスを使用して、データを読み取ることができます。 - 「UI を使用してテーブルを作成 」をクリックします。
- [クラスター] ドロップダウンで、クラスターを選択します。
DBFS の手順
- ファイルを選択します。
- 「UI を使用してテーブルを作成 」をクリックします。
- [クラスター] ドロップダウンで、クラスターを選択します。
- ファイルを [ ファイル ] ドロップゾーンにドラッグするか、ドロップゾーンをクリックしてファイルを参照して選択します。 アップロード後、ファイルごとにパスが表示されます。 パスは
-
「 プレビュー・テーブル 」をクリックして、テーブルを表示します。
-
[テーブル名 ] フィールドで、必要に応じてデフォルトのテーブル名を上書きします。テーブル名には、小文字の英数字とアンダースコアのみを含めることができ、小文字またはアンダースコアで始める必要があります。
-
「 データベースで作成 」フィールドで、選択した
default
データベースをオプションで上書きします。 -
[ファイルの種類 ] フィールドで、必要に応じて、推論されたファイルの種類を上書きします。
-
ファイルタイプが CSV の場合:
- [列区切り記号 ] フィールドで、推論された区切り記号を上書きするかどうかを選択します。
- 最初の行を列のタイトルとして使用するかどうかを示します。
- スキーマを推論するかどうかを示します。
-
ファイルの種類が JSON の場合は、ファイルが複数行であるかどうかを示します。
-
[ テーブルを作成 ] をクリックします。
データベースとテーブルの表示
Catalog Explorer が有効になっているワークスペースは、以下で説明する従来の動作にアクセスできません。
サイドバー カタログ をクリックします。Databricks 、アクセス権を持つ稼働中のクラスターを選択します。 [データベース] フォルダには、
default
データベースが選択されているデータベースの一覧が表示されます。 「テーブル」フォルダには、 default
データベース内のテーブルのリストが表示されます。
クラスターは、[データベース] メニューから変更したり、 テーブル UI を作成したり、 テーブル UI を表示したりできます。 たとえば、[データベース] メニューから次のようにします。
-
[データベース] フォルダの上部にある
下矢印をクリックします。
-
クラスターを選択します。
テーブルの詳細の表示
テーブルの詳細ビューには、テーブルスキーマとサンプルデータが表示されます。
-
サイドバー
カタログ をクリックします。
-
[データベース] フォルダで、データベースをクリックします。
-
[テーブル] フォルダで、テーブル名をクリックします。
-
クラスタードロップダウンで、オプションで別のクラスターを選択して、テーブルプレビューをレンダリングします。
テーブルのプレビューを表示するには、Spark SQL クラスター ドロップダウンで選択したクラスターに対してクエリを実行します。クラスターですでにワークロードが実行されている場合、テーブルプレビューの読み込みに時間がかかることがあります。
UI を使用したテーブルの削除
- サイドバー
カタログ をクリックします。
- テーブル名の横にある
をクリックし、[ 削除 ] を選択します。