Pular para o conteúdo principal

Levenshtein

Calcule a distância de Levenshtein entre as duas strings fornecidas.

Para a função Databricks SQL correspondente, consulte a funçãolevenshtein.

Sintaxe

Python
from pyspark.databricks.sql import functions as dbf

dbf.levenshtein(left=<left>, right=<right>, threshold=<threshold>)

Parâmetros

Parâmetro

Tipo

Descrição

left

pyspark.sql.Column ou str

Valor da primeira coluna.

right

pyspark.sql.Column ou str

Valor da segunda coluna.

threshold

int, opcional

Se definido quando a distância de Levenshtein entre as duas strings fornecidas for menor ou igual a um determinado limite, retorne a distância resultante ou -1.

Devoluções

pyspark.sql.ColumnDistância de Levenshtein como valor inteiro.

Exemplos

Python
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('kitten', 'sitting',)], ['l', 'r'])
df.select('*', dbf.levenshtein('l', 'r')).show()
Python
df.select('*', dbf.levenshtein(df.l, df.r, 2)).show()