Pular para o conteúdo principal

paraPandas

Retorna o conteúdo deste DataFrame como Pandas pandas.DataFrame.

Sintaxe

toPandas()

Devoluções

pandas.DataFrame

Notas

Este método só deve ser usado se o Pandas pandas.DataFrame resultante for esperado ser pequeno, pois todos os dados são carregados na memória do driver.

O uso com spark.sql.execution.arrow.pyspark.enabled=True é experimental.

Esta opção só está disponível se o Pandas estiver instalado e disponível.

Exemplos

Python
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.toPandas()
# age name
# 0 2 Alice
# 1 5 Bob