espalhamento
Cria um gráfico de dispersão com tamanhos e cores de marcadores variáveis.
As coordenadas de cada ponto são definidas por duas colunas do DataFrame, e círculos preenchidos são usados para representar cada ponto. Esse tipo de gráfico é útil para visualizar correlações complexas entre duas variáveis, como coordenadas naturais em 2D, como longitude e latitude, ou qualquer par de métricas que possam ser plotadas uma contra a outra.
Sintaxe
scatter(x, y, **kwargs)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
| str | Nome da coluna a ser usada como coordenadas horizontais para cada ponto. |
| string ou lista de strings | Nome da coluna a ser usada como coordenadas verticais para cada ponto. |
| opcional | Argumentos de palavra-chave adicionais. |
Devoluções
plotly.graph_objs.Figure
Exemplos
Python
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
data = [(5.1, 3.5, 0), (4.9, 3.0, 0), (7.0, 3.2, 1), (6.4, 3.2, 1), (5.9, 3.0, 2)]
columns = ['length', 'width', 'species']
df = spark.createDataFrame(data, columns)
df.plot.scatter(x='length', y='width')