to_timestamp
オプションで指定された形式を使用して、列を TimestampType に変換します。日時パターンに応じて形式を指定します。デフォルトでは、フォーマットが省略されている場合は TimestampType へのキャスト規則に従います。col.cast("timestamp")と同等です。
対応する Databricks SQL 関数については、 to_timestamp関数を参照してください。
構文
Python
import pyspark.sql.functions as sf
sf.to_timestamp(col=<col>)
# With format
sf.to_timestamp(col=<col>, format=<format>)
パラメーター
パラメーター | Type | 説明 |
|---|---|---|
|
| 変換する列の値。 |
|
| オプション。タイムスタンプ値を変換するために使用する形式。 |
戻り値
pyspark.sql.Column: タイムスタンプ値はpyspark.sql.types.TimestampType型です。
例
例 1 : 文字列をタイムスタンプに変換します。
Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([('1997-02-28 10:30:00',)], ['t'])
df.select(sf.to_timestamp(df.t)).show()
Output
+-------------------+
| to_timestamp(t)|
+-------------------+
|1997-02-28 10:30:00|
+-------------------+
例 2 : 文字列をフォーマット付きのタイムスタンプに変換します。
Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([('1997-02-28 10:30:00',)], ['t'])
df.select(sf.to_timestamp(df.t, 'yyyy-MM-dd HH:mm:ss')).show()
Output
+------------------------------------+
|to_timestamp(t, yyyy-MM-dd HH:mm:ss)|
+------------------------------------+
| 1997-02-28 10:30:00|
+------------------------------------+