マスク
指定された文字列値をマスクします。これは、機密情報を削除したテーブルのコピーを作成する場合に役立ちます。
対応する Databricks SQL 関数については、 mask関数を参照してください。
構文
Python
from pyspark.databricks.sql import functions as dbf
dbf.mask(col=<col>, upperChar=<upperChar>, lowerChar=<lowerChar>, digitChar=<digitChar>, otherChar=<otherChar>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| ターゲットカラムをコンピュートに。 |
|
| 大文字を置き換える文字。元の文字を保持するには NULL を指定します。 |
|
| 小文字を置き換える文字。元の文字を保持するには NULL を指定します。 |
|
| 数字文字を置き換える文字。元の文字を保持するには NULL を指定します。 |
|
| 他のすべての文字を置き換える文字。元の文字を保持するには NULL を指定します。 |
戻り値
pyspark.sql.Column:
例
Python
df = spark.createDataFrame([("AbCD123-@$#",), ("abcd-EFGH-8765-4321",)], ['data'])
df.select(mask(df.data).alias('r')).collect()
df.select(mask(df.data, lit('Y')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y'), lit('d')).alias('r')).collect()
df.select(mask(df.data, lit('Y'), lit('y'), lit('d'), lit('*')).alias('r')).collect()