pegar
Retorna o elemento de uma matriz no índice fornecido (baseado em 0). Se o índice apontar para fora dos limites da matriz, essa função retornará NULL. A posição não é baseada em 1, mas sim em um índice baseado em 0.
Sintaxe
from pyspark.sql import functions as sf
sf.get(col, index)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Nome da coluna que contém a matriz. |
|
| Índice a ser verificado na matriz. |
Devoluções
pyspark.sql.ColumnValor na posição indicada.
Exemplos
Exemplo 1 : Posicionando um elemento em uma posição fixa
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", "b", "c"],)], ['data'])
df.select(sf.get(df.data, 1)).show()
+------------+
|get(data, 1)|
+------------+
| b|
+------------+
Exemplo 2 : Obtendo um elemento em uma posição fora dos limites da matriz
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", "b", "c"],)], ['data'])
df.select(sf.get(df.data, 3)).show()
+------------+
|get(data, 3)|
+------------+
| NULL|
+------------+
Exemplo 3 : Obtendo um elemento em uma posição especificada por outra coluna
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", "b", "c"], 2)], ['data', 'index'])
df.select(sf.get(df.data, df.index)).show()
+----------------+
|get(data, index)|
+----------------+
| c|
+----------------+
Exemplo 4 : Obtendo um elemento em uma posição calculada a partir de outra coluna
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", "b", "c"], 2)], ['data', 'index'])
df.select(sf.get(df.data, df.index - 1)).show()
+----------------------+
|get(data, (index - 1))|
+----------------------+
| b|
+----------------------+
Exemplo 5 : Obtendo um elemento em uma posição negativa
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", "b", "c"], )], ['data'])
df.select(sf.get(df.data, -1)).show()
+-------------+
|get(data, -1)|
+-------------+
| NULL|
+-------------+