同じ意味論
両方のDataFrames内の論理クエリプランが等しく、したがって同じ結果を返す場合は、 Trueを返します。
構文
sameSemantics(other: "DataFrame")
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| データフレーム | 比較対象となるもう一方のDataFrame 。 |
戻り値
bool: これら 2 つのDataFramesが類似しているかどうか。
注意
ここでの等価性の比較は、属性名などの表面的な違いを許容することで簡略化されている。
このAPI両方のDataFrames非常に高速に比較できますが、例えば異なるプランから同じ結果を返すDataFramesに対してはFalse返す場合があります。 このような偽陰性の意味論は、例えばキャッシュ処理において役立つことがある。
このAPIは開発者向けAPIです。
例
Python
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True