Classe de coluna
Uma coluna em um DataFrame.
Compatível com Spark Connect
Sintaxe
Consulte Criar instâncias de coluna.
Métodos
Método | Descrição |
|---|---|
Retorna esta coluna com um novo nome ou nomes atribuídos por um alias (no caso de expressões que retornam mais de uma coluna, como explode). | |
Retorna uma expressão de classificação baseada na ordem crescente da coluna. | |
Retorna uma expressão de classificação baseada na ordem crescente da coluna, sendo que valores nulos são retornados antes de valores não nulos. | |
Retorna uma expressão de classificação baseada na ordem crescente da coluna, e os valores nulos aparecem após os valores não nulos. | |
Pseudônimo para | |
Verifique se os valores da coluna atual estão entre os limites inferior e superior especificados, inclusive. | |
Calcule a operação AND bit a bit desta expressão com outra expressão. | |
Calcule a operação OR bit a bit desta expressão com outra expressão. | |
Calcule o XOR bit a bit desta expressão com outra expressão. | |
Converte a coluna para o tipo | |
Contém o outro elemento. | |
Retorna uma expressão de classificação baseada na ordem decrescente da coluna. | |
Retorna uma expressão de classificação baseada na ordem decrescente da coluna, em que os valores nulos aparecem antes dos valores não nulos. | |
Retorna uma expressão de classificação baseada na ordem decrescente da coluna, e os valores nulos aparecem após os valores não nulos. | |
Uma expressão que remove campos em StructType pelo nome. | |
strings terminam com. | |
Teste de igualdade que é seguro para valores nulos. | |
Uma expressão que obtém um campo pelo nome em um StructType. | |
Uma expressão que obtém um item em uma posição ordinal de uma lista, ou obtém um item por key de um dicionário. | |
Expressão SQL ILIKE (LIKE que não diferencia maiúsculas de minúsculas). | |
Verdadeiro se a expressão atual for NaN. | |
Verdadeiro se a expressão atual NÃO for nula. | |
Verdadeiro se a expressão atual for nula. | |
Uma expressão booleana que é avaliada como verdadeira se o valor dessa expressão estiver contido nos valores avaliados dos argumentos. | |
Expressão semelhante a SQL. | |
Pseudônimo para | |
Avalia uma lista de condições e retorna uma entre várias expressões de resultado possíveis. | |
Defina uma coluna de janelamento. | |
Expressão SQL RLIKE (LIKE com Regex). | |
As strings começam com. | |
Retorna uma coluna que é uma substring da coluna. | |
Esta é uma versão especial de | |
Avalia uma lista de condições e retorna uma entre várias expressões de resultado possíveis. | |
Uma expressão que adiciona/substitui um campo em StructType pelo nome. |
Operadores
A classe Column suporta operadores padrão do Python para operações aritméticas, de comparação e lógicas:
- Aritmética :
+,-,*,/,%,** - Comparação :
==,!=,<,<=,>,>= - Lógico :
&(E),|(OU),~(NÃO)
Exemplos
Para exemplos mais simples que demonstram o uso de colunas, consulte Operações de coluna.
Criar instâncias de coluna
Selecionar uma coluna de um DataFrame:
df = spark.createDataFrame(
[(2, "Alice"), (5, "Bob")], ["age", "name"])
# Access by attribute
df.name
# Column<'name'>
# Access by bracket notation
df["name"]
# Column<'name'>
Criar uma coluna a partir de uma expressão:
df.age + 1
# Column<...>
1 / df.age
# Column<...>
Operações básicas de coluna
# Arithmetic operations
df.select(df.age + 10).show()
# Comparison operations
df.filter(df.age > 3).show()
# String operations
df.filter(df.name.startswith("A")).show()
# Null checking
df.filter(df.name.isNotNull()).show()
Lógica condicional
from pyspark.sql import functions as F
df.select(
F.when(df.age < 3, "child")
.when(df.age < 13, "kid")
.otherwise("adult")
.alias("age_group")
).show()
Classificação
df.orderBy(df.age.desc()).show()
df.orderBy(df.age.asc_nulls_last()).show()