メインコンテンツまでスキップ

置換( DataFrame )

値を別の値に置き換える新しいDataFrameを返します。DataFrame.replaceDataFrameNaFunctions.replaceは互いの別名です。置換対象の値と置換後の値は同じ型である必要があり、数値、ブール値、または文字列のみを指定できます。値は「なし」にすることができます。置換時には、新しい値は既存の列の型にキャストされます。

構文

replace(to_replace: Union["LiteralType", List["LiteralType"], Dict["LiteralType", "OptionalPrimitiveType"]], value: Optional[Union["OptionalPrimitiveType", List["OptionalPrimitiveType"]]] = _NoValue, subset: Optional[List[str]] = None)

パラメーター

パラメーター

Type

説明

to_replace

bool、int、float、文字列、list、または dict

交換される値。値が辞書型の場合、 valueは無視されるか省略可能であり、 to_replace値と置換値の間のマッピングでなければなりません。

value

bool、int、float、文字列またはなし、オプション

置換値は、bool、int、float、 または None である必要があります。 valueがリストの場合、 value to_replaceと同じ長さと型である必要があります。valueがスカラーでto_replaceがシーケンスである場合、 valueto_replaceの各項目の代替として使用されます。

subset

リスト(オプション)

検討対象となる列名のリスト(任意)。サブセットで指定された列のうち、データ型が一致しない列は無視されます。

戻り値

DataFrame置換された値を含むDataFrame 。

Python
df = spark.createDataFrame([
(10, 80, "Alice"),
(5, None, "Bob"),
(None, 10, "Tom"),
(None, None, None)],
schema=["age", "height", "name"])

df.na.replace(10, 20).show()
# +----+------+-----+
# | age|height| name|
# +----+------+-----+
# | 20| 80|Alice|
# | 5| NULL| Bob|
# |NULL| 20| Tom|
# |NULL| NULL| NULL|
# +----+------+-----+

df.na.replace('Alice', None).show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80|NULL|
# | 5| NULL| Bob|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+

df.na.replace(['Alice', 'Bob'], ['A', 'B'], 'name').show()
# +----+------+----+
# | age|height|name|
# +----+------+----+
# | 10| 80| A|
# | 5| NULL| B|
# |NULL| 10| Tom|
# |NULL| NULL|NULL|
# +----+------+----+
このページの見出し