substring
A substring começa em pos e tem comprimento len quando str é do tipo string ou retorna a fatia do array de bytes que começa em pos em byte e tem comprimento len quando str é do tipo binário.
A posição não é baseada em zero, mas sim em um índice baseado em 1.
Para a função Databricks SQL correspondente, consulte a funçãosubstring.
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.substring(str=<str>, pos=<pos>, len=<len>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| coluna de destino para trabalhar. |
|
| posição inicial na str. |
|
| comprimento dos caracteres. |
Devoluções
pyspark.sql.Column: subcadeia de caracteres do valor fornecido.
Exemplos
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()