ローカルチェックポイント
このDataFrameのローカルでチェックポイントが設定されたバージョンを返します。チェックポイント機能を使用すると、このDataFrameの論理プランを切り詰めることができます。これは、プランが指数関数的に増加する可能性がある反復アルゴリズムにおいて特に役立ちます。 ローカル チェックポイントはキャッシュ サブシステムを使用してエグゼキューターに保存されるため、信頼性がありません。
構文
localCheckpoint(eager: bool = True, storageLevel: Optional[StorageLevel] = None)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| bool、オプション、デフォルト値はTrue | このDataFrameすぐにチェックポイントとして保存するかどうか。 |
| ストレージレベル、オプション、デフォルトはなし | チェックポイントが保存されるストレージレベル。指定がない場合、RDDローカルチェックポイントのデフォルト値が使用されます。 |
戻り値
DataFrame: チェックポイント付きDataFrame 。
注意
このAPIは試験的なものです。
例
Python
df = spark.createDataFrame([
(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.localCheckpoint(False)
# DataFrame[age: bigint, name: string]