Classe de remo
Uma linha em um DataFrame. Os campos nele contidos podem ser acessados:
- como atributos (
row.key) - como valores de dicionário (
row[key])
key in row irá pesquisar através da chave da linha.
A função `row` pode ser usada para criar um objeto de linha utilizando argumentos nomeados. Não é permitido omitir um argumento nomeado para representar que o valor é None ou está ausente. Neste caso, isso deve ser definido explicitamente como None.
Alterado no Databricks Runtime 7.4 : As linhas criadas a partir de argumentos nomeados não terão mais os nomes dos campos classificados em ordem alfabética e serão ordenadas na posição em que foram inseridos.
Sintaxe
from pyspark.sql import Row
Row(tuple)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
| tupla | Os elementos da linha |
Métodos
Método | Descrição |
|---|---|
Retorna a linha como |
Exemplos
Utilizando argumentos nomeados
from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False
Criando classes de linha
Row também pode ser usado para criar outra classe semelhante a Row, que por sua vez pode ser usada para criar objetos Row:
Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)
Este formulário também pode ser usado para criar linhas como valores de tupla, com campos sem nome:
row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True