メインコンテンツまでスキップ

転置

指定されたインデックス列の値がDataFrameの新しい列になるように、 DataFrameを転置します。 インデックス列が指定されていない場合は、最初の列がデフォルト値として使用されます。

構文

transpose(indexColumn: Optional["ColumnOrName"] = None)

パラメーター

パラメーター

Type

説明

indexColumn

str または Column (オプション)

転置操作のインデックスとして扱われる単一の列。この列は、インデックス列の値が転置されたDataFrameの新しい列になるようにDataFrameを変換するために使用されます。 指定されていない場合は、 DataFrameの最初の列が使用されます。

戻り値

DataFrame: 転置されたDataFrame 。

注意

  • インデックス列を除くすべての列は、最小共通データ型を共有する必要があります。データ型が同じでない限り、すべての列は最も近い共通のデータ型にキャストされます。
  • 元の列名が転置される列の名前は、デフォルトで「key」になります。
  • インデックス列のNULL値は、転置後のテーブルの列名から除外され、列名は昇順に並べられます。

Spark Connectに対応しています。

Python
df = spark.createDataFrame(
[("A", 1, 2), ("B", 3, 4)],
["id", "val1", "val2"],
)
df.show()
# +---+----+----+
# | id|val1|val2|
# +---+----+----+
# | A| 1| 2|
# | B| 3| 4|
# +---+----+----+

df.transpose().show()
# +----+---+---+
# | key| A| B|
# +----+---+---+
# |val1| 1| 3|
# |val2| 2| 4|
# +----+---+---+

df.transpose(df.id).show()
# +----+---+---+
# | key| A| B|
# +----+---+---+
# |val1| 1| 3|
# |val2| 2| 4|
# +----+---+---+