メインコンテンツまでスキップ

チェックポイント

このDataFrameのチェックポイント付きバージョンを返します。チェックポイント機能を使用すると、このDataFrameの論理プランを切り詰めることができます。これは、プランが指数関数的に増加する可能性がある反復アルゴリズムにおいて特に役立ちます。 これは、 SparkContext.setCheckpointDirまたはspark.checkpoint.dir設定で設定されたチェックポイントディレクトリ内のファイルに保存されます。

構文

checkpoint(eager: bool = True)

パラメーター

パラメーター

Type

説明

eager

bool、オプション、デフォルト値はTrue

このDataFrameすぐにチェックポイントとして保存するかどうか。

戻り値

DataFrame: チェックポイント付きDataFrame 。

注意

このAPIは試験的なものです。

Python
df = spark.createDataFrame([
(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.checkpoint(False)
# DataFrame[age: bigint, name: string]