メインコンテンツまでスキップ

マスク

指定された文字列値をマスクします。これは、機密情報を削除したテーブルのコピーを作成する場合に役立ちます。

対応する Databricks SQL 関数については、 mask関数を参照してください。

構文

Python
from pyspark.databricks.sql import functions as dbf

dbf.mask(col=<col>, upperChar=<upperChar>, lowerChar=<lowerChar>, digitChar=<digitChar>, otherChar=<otherChar>)

パラメーター

パラメーター

Type

説明

col

pyspark.sql.Column または str

ターゲットカラムをコンピュートに。

upperChar

pyspark.sql.Column または str, optional

大文字を置き換える文字。元の文字を保持するには NULL を指定します。

lowerChar

pyspark.sql.Column または str, optional

小文字を置き換える文字。元の文字を保持するには NULL を指定します。

digitChar

pyspark.sql.Column または str, optional

数字文字を置き換える文字。元の文字を保持するには NULL を指定します。

otherChar

pyspark.sql.Column または str, optional

他のすべての文字を置き換える文字。元の文字を保持するには NULL を指定します。

戻り値

pyspark.sql.Column:

Python
df = spark.createDataFrame([("AbCD123-@$#",), ("abcd-EFGH-8765-4321",)], ['data'])
df.select(mask(df.data).alias('r')).collect()
df.select(mask(df.data, lit('Y')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y'), lit('d')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y'), lit('d'), lit('*')).alias('r')).collect()