Pular para o conteúdo principal

Classe de remo

Uma linha em um DataFrame. Os campos nele contidos podem ser acessados:

  • como atributos (row.key)
  • como valores de dicionário (row[key])

key in row irá pesquisar através da chave da linha.

A função `row` pode ser usada para criar um objeto de linha utilizando argumentos nomeados. Não é permitido omitir um argumento nomeado para representar que o valor é None ou está ausente. Neste caso, isso deve ser definido explicitamente como None.

Alterado no Databricks Runtime 7.4 : As linhas criadas a partir de argumentos nomeados não terão mais os nomes dos campos classificados em ordem alfabética e serão ordenadas na posição em que foram inseridos.

Sintaxe

Python
from pyspark.sql import Row

Row(tuple)

Parâmetros

Parâmetro

Tipo

Descrição

tuple

tupla

Os elementos da linha

Métodos

Método

Descrição

asDict(recursive)

Retorna a linha como Dict[str, Any].

Exemplos

Utilizando argumentos nomeados

Python
from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False

Criando classes de linha

Row também pode ser usado para criar outra classe semelhante a Row, que por sua vez pode ser usada para criar objetos Row:

Python
Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)

Este formulário também pode ser usado para criar linhas como valores de tupla, com campos sem nome:

Python
row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True