Levenshtein
Calcule a distância de Levenshtein entre as duas strings fornecidas.
Para a função Databricks SQL correspondente, consulte a funçãolevenshtein.
Sintaxe
Python
from pyspark.databricks.sql import functions as dbf
dbf.levenshtein(left=<left>, right=<right>, threshold=<threshold>)
Parâmetros
Parâmetro | Tipo | Descrição |
|---|---|---|
|
| Valor da primeira coluna. |
|
| Valor da segunda coluna. |
|
| Se definido quando a distância de Levenshtein entre as duas strings fornecidas for menor ou igual a um determinado limite, retorne a distância resultante ou -1. |
Devoluções
pyspark.sql.ColumnDistância de Levenshtein como valor inteiro.
Exemplos
Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('kitten', 'sitting',)], ['l', 'r'])
df.select('*', dbf.levenshtein('l', 'r')).show()
Python
df.select('*', dbf.levenshtein(df.l, df.r, 2)).show()