índice_de_substring
Retorna a substring da string str antes do número de ocorrências do delimitador delim. Se o número de elementos for positivo, tudo o que estiver à esquerda do delimitador final (contando da esquerda para a direita) será retornado. Se o número de elementos for negativo, todos os elementos à direita do delimitador final (contando da direita para a esquerda) serão retornados. A função substring_index realiza uma correspondência que diferencia maiúsculas de minúsculas ao procurar por "delim".
Para a função Databricks SQL correspondente, consulte a funçãosubstring_index.
Sintaxe
from pyspark.databricks.sql import functions as dbf
dbf.substring_index(str=<str>, delim=<delim>, count=<count>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| coluna de destino para trabalhar. |
|
| delimitador de valores. |
|
| número de ocorrências. |
Devoluções
pyspark.sql.Column: subcadeia de caracteres do valor fornecido.
Exemplos
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('a.b.c.d',)], ['s'])
df.select('*', dbf.substring_index(df.s, '.', 2)).show()
df.select('*', dbf.substring_index('s', '.', -3)).show()