カタログ
ユーザー向けのカタログ API。 SparkSession.catalogからアクセスできます。これは、Scala 実装org.apache.spark.sql.catalog.Catalogをラップした薄いラッパーです。
構文
# Access through SparkSession
spark.catalog
方法
手法 | 説明 |
|---|---|
このセッションの現在のデフォルト カタログを返します。 | |
このセッションの現在のデフォルト カタログを設定します。 | |
このセッション内のカタログのリストを返します。 | |
このセッションの現在のデフォルト データベースを返します。 | |
このセッションの現在のデフォルト データベースを設定します。 | |
すべてのセッションで利用可能なデータベースのリストを返します。 | |
指定された名前のデータベースを取得します。データベースが見つからない場合は AnalysisException をスローします。 | |
指定された名前のデータベースが存在するかどうかを確認します。 | |
指定されたデータベース内のテーブルとビューのリストを返します。すべての一時ビューが含まれます。 | |
指定された名前のテーブルまたはビューを取得します。テーブルが見つからない場合は AnalysisException をスローします。 | |
指定された名前のテーブルまたはビューが存在するかどうかを確認します。 | |
指定されたデータベース内の指定されたテーブルまたはビューの列のリストを返します。 | |
指定されたデータベースに登録されている関数のリストを返します。すべての一時機能が含まれます。 | |
指定された名前の関数が存在するかどうかを確認します。一時的な機能が含まれます。 | |
指定された名前の関数を取得します。関数が見つからない場合は AnalysisException をスローします。 | |
| データソース内のデータセットに基づいてテーブルを作成し、関連付けられたDataFrameを返します。 |
指定された名前のローカル一時ビューを削除します。ビューがキャッシュされている場合は、キャッシュを解除します。 | |
指定された名前のグローバル一時ビューを削除します。ビューがキャッシュされている場合は、キャッシュを解除します。 | |
テーブルが現在メモリ内にキャッシュされている場合は true を返します。 | |
指定されたテーブルをメモリ内または指定されたストレージ レベルでキャッシュします。デフォルトは MEMORY_AND_DISK です。 | |
指定されたテーブルをメモリ内キャッシュから削除します。 | |
キャッシュされたすべてのテーブルをメモリ内キャッシュから削除します。 | |
指定されたテーブルのすべてのキャッシュされたデータとメタデータを無効化して更新します。 | |
指定されたテーブルのすべてのパーティションを回復し、カタログを更新します。パーティション化されたテーブルでのみ機能します。 | |
指定されたデータ ソース パスを含むすべてのDataFrameのすべてのキャッシュされたデータとメタデータを無効にして更新します。 |
例
spark.catalog.currentDatabase()
'default'
spark.catalog.listDatabases()
[Database(name='default', catalog='spark_catalog', description='default database', ...)]
_ = spark.sql("CREATE TABLE tbl1 (name STRING, age INT) USING parquet")
spark.catalog.tableExists("tbl1")
True
spark.catalog.cacheTable("tbl1")
spark.catalog.isCached("tbl1")
True
spark.catalog.uncacheTable("tbl1")
spark.catalog.isCached("tbl1")
False