転置
指定されたインデックス列の値がDataFrameの新しい列になるように、 DataFrameを転置します。 インデックス列が指定されていない場合は、最初の列がデフォルト値として使用されます。
構文
transpose(indexColumn: Optional["ColumnOrName"] = None)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| str または Column (オプション) | 転置操作のインデックスとして扱われる単一の列。この列は、インデックス列の値が転置されたDataFrameの新しい列になるようにDataFrameを変換するために使用されます。 指定されていない場合は、 DataFrameの最初の列が使用されます。 |
戻り値
DataFrame: 転置されたDataFrame 。
注意
- インデックス列を除くすべての列は、最小共通データ型を共有する必要があります。データ型が同じでない限り、すべての列は最も近い共通のデータ型にキャストされます。
- 元の列名が転置される列の名前は、デフォルトで「key」になります。
- インデックス列のNULL値は、転置後のテーブルの列名から除外され、列名は昇順に並べられます。
Spark Connectに対応しています。
例
Python
df = spark.createDataFrame(
[("A", 1, 2), ("B", 3, 4)],
["id", "val1", "val2"],
)
df.show()
# +---+----+----+
# | id|val1|val2|
# +---+----+----+
# | A| 1| 2|
# | B| 3| 4|
# +---+----+----+
df.transpose().show()
# +----+---+---+
# | key| A| B|
# +----+---+---+
# |val1| 1| 3|
# |val2| 2| 4|
# +----+---+---+
df.transpose(df.id).show()
# +----+---+---+
# | key| A| B|
# +----+---+---+
# |val1| 1| 3|
# |val2| 2| 4|
# +----+---+---+