Pular para o conteúdo principal

substring

A substring começa em pos e tem comprimento len quando str é do tipo string ou retorna a fatia do array de bytes que começa em pos em byte e tem comprimento len quando str é do tipo binário.

A posição não é baseada em zero, mas sim em um índice baseado em 1.

Para a função Databricks SQL correspondente, consulte a funçãosubstring.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

Parâmetros

Parâmetro

Tipo

Descrição

str

pyspark.sql.Column ou str

coluna de destino para trabalhar.

pos

pyspark.sql.Column ou str ou int

posição inicial na str.

len

pyspark.sql.Column ou str ou int

comprimento dos caracteres.

Devoluções

pyspark.sql.Column: subcadeia de caracteres do valor fornecido.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()