行クラス
DataFrame 内の行。次のフィールドにアクセスできます:
- 類似属性(
row.key) - 辞書の値(
row[key])
key in row 行キーを検索します。
Row は、名前付き引数を使用して行オブジェクトを作成するために使用できます。値が None または欠落していることを表すために名前付き引数を省略することはできません。この場合は明示的に None に設定する必要があります。
Databricks Runtime 7.4 で変更された点 : 名前付き引数から作成された行では、フィールド名がアルファベット順に並べ替えられなくなり、入力した位置で並べ替えられるようになりました。
構文
Python
from pyspark.sql import Row
Row(tuple)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| タプル | 行要素 |
方法
手法 | 説明 |
|---|---|
行を |
例
名前付き引数の使用
Python
from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False
行クラスの作成
Row は別の Row のようなクラスを作成するためにも使用でき、その後 Row オブジェクトを作成するために使用できます。
Python
Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)
この形式は、名前のないフィールドを持つタプル値として行を作成するためにも使用できます。
Python
row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True