Pular para o conteúdo principal

para_número

Converter strings 'col' em números com base no formato de strings 'format'. Lança uma exceção se a conversão falhar.

O formato pode consistir nos seguintes caracteres, sem distinção entre maiúsculas e minúsculas:

  • '0' ou '9': Especifica um dígito esperado entre 0 e 9. Uma sequência de 0 ou 9 nas strings de formato corresponde a uma sequência de dígitos nas strings de entrada. Se a sequência 0/9 começar com 0 e estiver antes da vírgula decimal, ela só poderá corresponder a uma sequência de dígitos do mesmo tamanho. Caso contrário, se a sequência começar com 9 ou for posterior a 9, então... O ponto decimal pode corresponder a uma sequência de dígitos que tenha o mesmo tamanho ou um tamanho menor.
  • '.' ou 'D': Especifica a posição do ponto decimal (opcional, permitido apenas uma vez).
  • ',' ou 'G': Especifica a posição do separador de agrupamento (milhares) (,). Deve haver um 0 ou um 9 à esquerda e à direita de cada separador de agrupamento. 'col' deve corresponder ao separador de agrupamento relevante para o tamanho do número.
  • '$': Especifica a localização do símbolo de moeda $. Este caractere só pode ser especificado uma vez.
  • 'S' ou 'MI': Especifica a posição de um sinal '-' ou '+' (opcional, permitido apenas uma vez no início ou no final das cadeias de formatação). Note que 'S' permite '-', mas 'MI' não.
  • 'PR ': Permitido apenas no final das strings de formatação; especifica que 'col' indica um Número negativo com colchetes angulares envolventes.

Para a função Databricks SQL correspondente, consulte a funçãoto_number.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.to_number(col=<col>, format=<format>)

Parâmetros

Parâmetro

Tipo

Descrição

col

pyspark.sql.Column ou str

Coluna de entrada ou strings.

format

pyspark.sql.Column ou str, optional

Formato a ser usado para converter valores numéricos.

Exemplos

Python
df = spark.createDataFrame([("$78.12",)], ["e"])
df.select(to_number(df.e, lit("$99.99")).alias('r')).collect()