dividir
Divide a string em torno de correspondências do padrão fornecido.
Para a função Databricks SQL correspondente, consulte a funçãosplit.
Sintaxe
from pyspark.databricks.sql import functions as dbf
dbf.split(str=<str>, pattern=<pattern>, limit=<limit>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| uma expressão de strings para dividir |
|
| uma sequência de caracteres representando uma expressão regular. As strings de regex devem ser expressões regulares Java . Aceito como uma representação de expressão regular, para fins de compatibilidade com versões anteriores. Além de int, |
|
| Um número inteiro que controla quantas vezes |
Devoluções
pyspark.sql.Column: matriz de strings separadas.
Exemplos
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('oneAtwoBthreeC',)], ['s',])
df.select('*', dbf.split(df.s, '[ABC]')).show()
df.select('*', dbf.split(df.s, '[ABC]', 2)).show()
df.select('*', dbf.split('s', '[ABC]', -2)).show()
df = spark.createDataFrame([
('oneAtwoBthreeC', '[ABC]', 2),
('1A2B3C', '[1-9]+', 1),
('aa2bb3cc4', '[1-9]+', -1)], ['s', 'p', 'l'])
df.select('*', dbf.split(df.s, df.p)).show()
df.select(dbf.split('s', df.p, 'l')).show()