amostra

Retorna um subconjunto amostrado deste DataFrame.

Sintaxe

sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)

Parâmetros

Parâmetro	Tipo	Descrição
`withReplacement`	booleano, opcional	Amostra com reposição ou não (default `False`).
`fraction`	flutuar, opcional	Fração de linhas a serem geradas, intervalo [0,0, 1,0].
`seed`	int, opcional	Semente para amostragem (default , uma semente aleatória).

Parâmetro	Tipo	Descrição
`withReplacement`	booleano, opcional	Amostra com reposição ou não (default `False`).
`fraction`	flutuar, opcional	Fração de linhas a serem geradas, intervalo [0,0, 1,0].
`seed`	int, opcional	Semente para amostragem (default , uma semente aleatória).

Devoluções

DataFrameLinhas amostradas do DataFrame fornecido.

Notas

Não há garantia de que isso fornecerá exatamente a fração especificada da contagem total do DataFrame fornecido.

fraction é obrigatório e, withReplacement e seed são opcionais.

Exemplos

Python
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10

Sintaxe​

Parâmetros​

Devoluções​

Notas​

Exemplos​

Sintaxe

Parâmetros

Devoluções

Notas

Exemplos