メインコンテンツまでスキップ

ローカルチェックポイント

このDataFrameのローカルでチェックポイントが設定されたバージョンを返します。チェックポイント機能を使用すると、このDataFrameの論理プランを切り詰めることができます。これは、プランが指数関数的に増加する可能性がある反復アルゴリズムにおいて特に役立ちます。 ローカル チェックポイントはキャッシュ サブシステムを使用してエグゼキューターに保存されるため、信頼性がありません。

構文

localCheckpoint(eager: bool = True, storageLevel: Optional[StorageLevel] = None)

パラメーター

パラメーター

Type

説明

eager

bool、オプション、デフォルト値はTrue

このDataFrameすぐにチェックポイントとして保存するかどうか。

storageLevel

ストレージレベル、オプション、デフォルトはなし

チェックポイントが保存されるストレージレベル。指定がない場合、RDDローカルチェックポイントのデフォルト値が使用されます。

戻り値

DataFrame: チェックポイント付きDataFrame 。

注意

このAPIは試験的なものです。

Python
df = spark.createDataFrame([
(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.localCheckpoint(False)
# DataFrame[age: bigint, name: string]