Pular para o conteúdo principal

está

Verifique se o valor da coluna está em uma lista de valores.

Sintaxe

Python
isin(*cols)

Parâmetros

Parâmetro

Tipo

Descrição

cols

Valores

Lista de valores a serem comparados

Devoluções

Coluna (Booleana)

Exemplos

Exemplo 1: Filtrar linhas com nomes que contenham os valores especificados.

Python
df = spark.createDataFrame([(2, "Alice"), (5, "Bob"), (8, "Mike")], ["age", "name"])
df[df.name.isin("Bob", "Mike")].orderBy("age").show()
Output
# +---+----+
# |age|name|
# +---+----+
# | 5| Bob|
# | 8|Mike|
# +---+----+

Exemplo 2: Filtrar linhas com idades na lista especificada.

Python
df[df.age.isin([1, 2, 3])].show()
Output
# +---+-----+
# |age| name|
# +---+-----+
# | 2|Alice|
# +---+-----+

Exemplo 3: Filtrar linhas com nomes que não estejam entre os valores especificados.

Python
df[~df.name.isin("Alice", "Bob")].show()
Output
# +---+----+
# |age|name|
# +---+----+
# | 8|Mike|
# +---+----+

Exemplo 4: Usar um DataFrame como uma subconsulta IN.

Python
df.where(df.age.isin(spark.range(6))).orderBy("age").show()
Output
# +---+-----+
# |age| name|
# +---+-----+
# | 2|Alice|
# | 5| Bob|
# +---+-----+