メインコンテンツまでスキップ

saveAsTable

DataFrameの内容を、指定されたテーブルとして保存します。テーブルが既に存在する場合、動作はmode問題に依存します (例外をスローすることになります)。 mode'overwrite'の場合、 DataFrameのスキーマは既存のテーブルスキーマと一致する必要はありません。

構文

saveAsTable(name, format=None, mode=None, partitionBy=None, **options)

パラメーター

パラメーター

Type

説明

name

str

テーブル名。

format

文字列、オプション

保存に使用されるフォーマット。

mode

文字列、オプション

データが既に存在する場合の動作。許容される値は、 'append''overwrite''error'または'errorifexists' (デフォルト)、および'ignore'です。

partitionBy

文字列またはリスト(省略可能)

パーティショニング列の名前。

**options

辞書

その他の文字列オプション。

戻り値

なし

注意

mode'append'の場合、テーブルが既に存在する場合は、そのフォーマットとオプションが使用されます。DataFrameWriter.insertIntoとは異なり、 DataFrameWriter.saveAsTable列名を使用して正しい列位置を見つけます。

DataFrameからテーブルを作成し、それを読み戻します。

Python
spark.sql("DROP TABLE IF EXISTS tblA")
spark.createDataFrame([
(100, "Alice"), (120, "Bob"), (140, "Tom")],
schema=["age", "name"]
).write.saveAsTable("tblA")

spark.read.table("tblA").sort("age").show()
# +---+------------+
# |age| name|
# +---+------------+
# |100|Alice|
# |120|Bob|
# |140| Tom|
# +---+------------+

spark.sql("DROP TABLE tblA")