Pular para o conteúdo principal

fillna

Retorna um novo DataFrame no qual os valores nulos são preenchidos com o novo valor. DataFrame.fillna e DataFrameNaFunctions.fill são sinônimos um do outro.

Sintaxe

fillna(value: Union["LiteralType", Dict[str, "LiteralType"]], subset: Optional[Union[str, Tuple[str, ...], List[str]]] = None)

Parâmetros

Parâmetro

Tipo

Descrição

value

int, float, strings, bool ou dict

O valor que substituirá os valores nulos. Se o valor for um dicionário, então subset é ignorado e value deve ser um mapeamento do nome da coluna (strings) para o valor de substituição. O valor de substituição deve ser um número inteiro, um número de ponto flutuante, um valor booleano ou uma string.

subset

string, tupla ou lista, opcional

Lista opcional de nomes de colunas a serem considerados. As colunas especificadas no subconjunto que não possuem tipos de dados correspondentes serão ignoradas.

Devoluções

DataFrameDataFrame com valores nulos substituídos.

Exemplos

Python
df = spark.createDataFrame([
(10, 80.5, "Alice", None),
(5, None, "Bob", None),
(None, None, "Tom", None),
(None, None, None, True)],
schema=["age", "height", "name", "bool"])

df.na.fill(50).show()
# +---+------+-----+----+
# |age|height| name|bool|
# +---+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| 50.0| Bob|NULL|
# | 50| 50.0| Tom|NULL|
# | 50| 50.0| NULL|true|
# +---+------+-----+----+

df.na.fill(False).show()
# +----+------+-----+-----+
# | age|height| name| bool|
# +----+------+-----+-----+
# | 10| 80.5|Alice|false|
# | 5| NULL| Bob|false|
# |NULL| NULL| Tom|false|
# |NULL| NULL| NULL| true|
# +----+------+-----+-----+

df.na.fill({'age': 50, 'name': 'unknown'}).show()
# +---+------+-------+----+
# |age|height| name|bool|
# +---+------+-------+----+
# | 10| 80.5| Alice|NULL|
# | 5| NULL| Bob|NULL|
# | 50| NULL| Tom|NULL|
# | 50| NULL|unknown|true|
# +---+------+-------+----+