メインコンテンツまでスキップ

to_timestamp

オプションで指定された形式を使用して、列を TimestampType に変換します。日時パターンに応じて形式を指定します。デフォルトでは、フォーマットが省略されている場合は TimestampType へのキャスト規則に従います。col.cast("timestamp")と同等です。

対応する Databricks SQL 関数については、 to_timestamp関数を参照してください。

構文

Python
import pyspark.sql.functions as sf

sf.to_timestamp(col=<col>)

# With format
sf.to_timestamp(col=<col>, format=<format>)

パラメーター

パラメーター

Type

説明

col

pyspark.sql.Column または str

変換する列の値。

format

str

オプション。タイムスタンプ値を変換するために使用する形式。

戻り値

pyspark.sql.Column: タイムスタンプ値はpyspark.sql.types.TimestampType型です。

例 1 : 文字列をタイムスタンプに変換します。

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([('1997-02-28 10:30:00',)], ['t'])
df.select(sf.to_timestamp(df.t)).show()
Output
+-------------------+
| to_timestamp(t)|
+-------------------+
|1997-02-28 10:30:00|
+-------------------+

例 2 : 文字列をフォーマット付きのタイムスタンプに変換します。

Python
import pyspark.sql.functions as sf
df = spark.createDataFrame([('1997-02-28 10:30:00',)], ['t'])
df.select(sf.to_timestamp(df.t, 'yyyy-MM-dd HH:mm:ss')).show()
Output
+------------------------------------+
|to_timestamp(t, yyyy-MM-dd HH:mm:ss)|
+------------------------------------+
| 1997-02-28 10:30:00|
+------------------------------------+