para_número
Converter strings 'col' em números com base no formato de strings 'format'. Lança uma exceção se a conversão falhar.
O formato pode consistir nos seguintes caracteres, sem distinção entre maiúsculas e minúsculas:
- '0' ou '9': Especifica um dígito esperado entre 0 e 9. Uma sequência de 0 ou 9 nas strings de formato corresponde a uma sequência de dígitos nas strings de entrada. Se a sequência 0/9 começar com 0 e estiver antes da vírgula decimal, ela só poderá corresponder a uma sequência de dígitos do mesmo tamanho. Caso contrário, se a sequência começar com 9 ou for posterior a 9, então... O ponto decimal pode corresponder a uma sequência de dígitos que tenha o mesmo tamanho ou um tamanho menor.
- '.' ou 'D': Especifica a posição do ponto decimal (opcional, permitido apenas uma vez).
- ',' ou 'G': Especifica a posição do separador de agrupamento (milhares) (,). Deve haver um 0 ou um 9 à esquerda e à direita de cada separador de agrupamento. 'col' deve corresponder ao separador de agrupamento relevante para o tamanho do número.
- '$': Especifica a localização do símbolo de moeda $. Este caractere só pode ser especificado uma vez.
- 'S' ou 'MI': Especifica a posição de um sinal '-' ou '+' (opcional, permitido apenas uma vez no início ou no final das cadeias de formatação). Note que 'S' permite '-', mas 'MI' não.
- 'PR ': Permitido apenas no final das strings de formatação; especifica que 'col' indica um Número negativo com colchetes angulares envolventes.
Para a função Databricks SQL correspondente, consulte a funçãoto_number.
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.to_number(col=<col>, format=<format>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Coluna de entrada ou strings. |
|
| Formato a ser usado para converter valores numéricos. |
Exemplos
Python
df = spark.createDataFrame([("$78.12",)], ["e"])
df.select(to_number(df.e, lit("$99.99")).alias('r')).collect()