mesma semântica
Retorna True quando os planos de consulta lógica dentro de ambos os DataFrames são iguais e, portanto, retornam os mesmos resultados.
Sintaxe
sameSemantics(other: "DataFrame")
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
| DataFrame | O outro DataFrame para comparação. |
Devoluções
bool: Indica se esses dois DataFrames são semelhantes.
Notas
A comparação de igualdade aqui é simplificada ao tolerar diferenças cosméticas, como nomes de atributos.
Esta API pode comparar ambos os DataFrames muito rapidamente, mas ainda pode retornar False nos DataFrames que retornam os mesmos resultados, por exemplo, de planos diferentes. Essa semântica de falso negativo pode ser útil, por exemplo, em sistemas de cache.
Esta API é uma API para desenvolvedores.
Exemplos
Python
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True