メインコンテンツまでスキップ

同じ意味論

両方のDataFrames内の論理クエリプランが等しく、したがって同じ結果を返す場合は、 Trueを返します。

構文

sameSemantics(other: "DataFrame")

パラメーター

パラメーター

Type

説明

other

データフレーム

比較対象となるもう一方のDataFrame 。

戻り値

bool: これら 2 つのDataFramesが類似しているかどうか。

注意

ここでの等価性の比較は、属性名などの表面的な違いを許容することで簡略化されている。

このAPI両方のDataFrames非常に高速に比較できますが、例えば異なるプランから同じ結果を返すDataFramesに対してはFalse返す場合があります。 このような偽陰性の意味論は、例えばキャッシュ処理において役立つことがある。

このAPIは開発者向けAPIです。

Python
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True