箱
DataFrame列から箱ひげプロットを作成します。
ボックス プロットは、数値データのグループを四分位数でグラフィカルに表現する方法です。 このボックスは、データの第1四分位値から第3四分位値までをカバーし、中央値(第2四分位値)に線が引かれています。ヒゲは、データの範囲を示すために、ボックスの端から伸びています。デフォルトでは、それらはボックスの端から 1.5 × IQR (IQR = Q3 - Q1) を超えて伸びることはなく、その区間内の最も遠いデータポイントで終わります。外れ値は個別の点としてプロットされます。
構文
box(column=None, **kwargs)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
| 文字列または文字列のリスト(省略可能) | ボックスプロットを作成する際に使用する列名、または列名のリスト。 |
| オプション | 追加のキーワード引数。 |
戻り値
plotly.graph_objs.Figure
例
Python
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()