Pular para o conteúdo principal

caixa

Cria um gráfico de caixa e bigode a partir de DataFrame colunas.

Um gráfico de caixa é um método para representar graficamente grupos de dados numéricos por meio de seus quartis. A caixa estende-se dos valores do primeiro ao terceiro quartil dos dados, com uma linha na mediana (segundo quartil). Os bigodes estendem-se das bordas da caixa para mostrar a amplitude dos dados. Por default, eles se estendem no máximo 1,5 × IQR (IQR = Q3 - Q1) a partir das bordas da caixa, terminando nos pontos de dados mais distantes dentro desse intervalo. Os valores discrepantes são representados por pontos separados.

Sintaxe

box(column=None, **kwargs)

Parâmetros

Parâmetro

Tipo

Descrição

column

string ou lista de strings, opcional

Nome da coluna ou lista de nomes a serem usados para criar o gráfico de caixa. Se None (default), todas as colunas numéricas serão usadas.

**kwargs

opcional

Argumentos de palavra-chave adicionais. Suporta precision: um float usado para compute estatísticas aproximadas para o gráfico de caixa. padrão: 0.01. Use valores menores para obter estatísticas mais precisas.

Devoluções

plotly.graph_objs.Figure

Exemplos

Python
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [
("A", 50, 55),
("B", 55, 60),
("C", 60, 65),
("D", 65, 70),
("E", 70, 75),
("F", 10, 15),
("G", 85, 90),
("H", 5, 150),
]
columns = ["student", "math_score", "english_score"]
df = spark.createDataFrame(data, columns)
df.plot.box()