DBFS でのテーブルの探索と作成
このドキュメントは廃止されており、更新されない可能性があります。 このコンテンツに記載されている製品、サービス、またはテクノロジはサポートされなくなりました。 Databricks へのファイルのアップロード、ファイルのアップロードを使用したテーブルの作成または変更、およびカタログ エクスプローラーとはを参照してください。
従来の DBFS ファイルのアップロードおよびテーブル作成 UI には、 データの追加 UI からアクセスします。 New > Data > DBFS をクリックします。
ノートブックから UI にアクセスするには、 ファイル > データの追加 をクリックします。
Databricks では、データ オブジェクトの表示と ACL の管理のエクスペリエンスを向上させるために カタログ エクスプローラー を使用し、小さなファイルを Delta Lake に簡単に取り込むために ファイルのアップロードからテーブルを作成または変更するページを使用することをお勧めします。
この記事で説明する一部の要素の可用性は、ワークスペースの構成によって異なります。 ワークスペース管理者または Databricks アカウント チームにお問い合わせください。
データのインポート
Databricks で分析する小さなデータ ファイルがローカル マシンにある場合は、UI を使用して それらを DBFS にインポートできます。
ワークスペース管理者はこの機能を無効にすることができます。 詳細については、「 データ アップロードの管理」を参照してください。
テーブルの作成
DBFS テーブル作成 UI を起動するには、サイドバーの 新規 をクリックするか、データ追加 UIの DBFS ボタンをクリックします。DBFS のファイルからテーブルにデータを取り込むことも、ファイルをアップロードすることもできます。
UI では、 外部テーブルのみを作成できます。
-
データソースを選択し、対応するセクションの手順に従ってテーブルを設定します。
Databricks ワークスペース管理者が ファイルのアップロードオプションを無効にしている場合、ファイルをアップロードするオプションはありません。テーブルは、他のデータソースのいずれかを使用して作成できます。
ファイルのアップロードの手順
- ファイルを [ ファイル ] ドロップゾーンにドラッグするか、ドロップゾーンをクリックしてファイルを参照して選択します。 アップロード後、ファイルごとにパスが表示されます。 パスは
/FileStore/tables/<filename>-<integer>.<file-type>
のようになります。 ノートブックでこのパスを使用して、データを読み取ることができます。 - UI を使用してテーブルを作成 をクリックします。
- [クラスター] ドロップダウンで、クラスターを選択します。
DBFS の手順
- ファイルを選択します。
- UI を使用してテーブルを作成 をクリックします。
- [クラスター] ドロップダウンで、クラスターを選択します。
- ファイルを [ ファイル ] ドロップゾーンにドラッグするか、ドロップゾーンをクリックしてファイルを参照して選択します。 アップロード後、ファイルごとにパスが表示されます。 パスは
-
テーブルのプレビュー をクリックして、テーブルを表示します。
-
テーブル名 フィールドで、必要に応じてデフォルトのテーブル名を上書きします。テーブル名には、小文字の英数字とアンダースコアのみを含めることができ、小文字またはアンダースコアで始める必要があります。
-
「 データベースで作成 」フィールドで、選択した
default
データベースをオプションで上書きします。 -
ファイルの種類 フィールドで、必要に応じて、推論されたファイルの種類を上書きします。
-
ファイルタイプが CSV の場合:
- 列区切り記号 フィールドで、推論された区切り記号を上書きするかどうかを選択します。
- 最初の行を列のタイトルとして使用するかどうかを示します。
- スキーマを推論するかどうかを示します。
-
ファイルの種類が JSON の場合は、ファイルが複数行であるかどうかを示します。
-
[ テーブルを作成 ] をクリックします。
データベースとテーブルの表示
カタログエクスプローラ が有効になっているワークスペースは、以下で説明する従来の動作にアクセスできません。
サイドバー カタログ をクリックします。Databricksはアクセス権を持つ稼働中のクラスターを選択します。 [データベース] フォルダには、
default
データベースが選択されているデータベースの一覧が表示されます。 「テーブル」フォルダには、 default
データベース内のテーブルのリストが表示されます。
データベースメニュー、 テーブル作成UI、 テーブル表示UIからクラスターを変更できます。 たとえば、[データベース] メニューから次のようにします。
-
[データベース] フォルダの上部にある
下矢印をクリックします。
-
クラスターを選択します。
テーブルの詳細の表示
テーブルの詳細ビューには、テーブルスキーマとサンプルデータが表示されます。
-
サイドバー
カタログ をクリックします。
-
[データベース] フォルダで、データベースをクリックします。
-
[テーブル] フォルダで、テーブル名をクリックします。
-
クラスタードロップダウンで、オプションで別のクラスターを選択して、テーブルプレビューをレンダリングします。
テーブルのプレビューを表示するには、 クラスター ドロップダウンで選択したクラスターに対してSpark SQLクエリを実行します。クラスターですでにワークロードが実行されている場合、テーブルプレビューの読み込みに時間がかかることがあります。
UI を使用したテーブルの削除
- サイドバー
カタログ をクリックします。
- テーブル名の横にある
をクリックし、[ 削除 ] を選択します。