tabela cruzada (Funções de Estatística do DataFrame)

Calcule uma tabela de frequência aos pares das colunas fornecidas, também conhecida como tabela de contingência. A primeira coluna de cada linha contém os valores distintos de col1 e os nomes das colunas são os valores distintos de col2. O nome da primeira coluna é $col1_$col2. Os pares sem ocorrências têm uma contagem de zero. DataFrame.crosstab e DataFrameStatFunctions.crosstab são sinônimos um do outro.

Sintaxe

crosstab(col1, col2)

Parâmetros

Parâmetro	Tipo	Descrição
`col1`	str	O nome da primeira coluna. Os itens distintos compõem a primeira coluna de cada linha.
`col2`	str	O nome da segunda coluna. Os itens distintos compõem os nomes das colunas do `DataFrame` resultante.

Parâmetro	Tipo	Descrição
`col1`	str	O nome da primeira coluna. Os itens distintos compõem a primeira coluna de cada linha.
`col2`	str	O nome da segunda coluna. Os itens distintos compõem os nomes das colunas do `DataFrame` resultante.

Devoluções

DataFrame

Exemplos

Python
df = spark.createDataFrame([(1, 11), (1, 11), (3, 10), (4, 8), (4, 8)], ["c1", "c2"])
df.stat.crosstab("c1", "c2").sort("c1_c2").show()
# +-----+---+---+---+
# |c1_c2| 10| 11|  8|
# +-----+---+---+---+
# |    1|  0|  2|  0|
# |    3|  1|  0|  0|
# |    4|  0|  0|  2|
# +-----+---+---+---+

Sintaxe​

Parâmetros​

Devoluções​

Exemplos​

Sintaxe

Parâmetros

Devoluções

Exemplos