ホームページ > バックエンド開発 > Python チュートリアル > PySpark の文字列列を日付列に変換するにはどうすればよいですか?

PySpark の文字列列を日付列に変換するにはどうすればよいですか?

Barbara Streisand
リリース: 2024-12-01 11:26:10
オリジナル
945 人が閲覧しました

How to Convert a PySpark String Column to a Date Column?

PySpark 文字列を日付形式に変換する

MM-dd-yyyy 形式の文字列列を持つ PySpark DataFrame があり、日付に変換する必要がありますcolumn.

解決策:

PySpark の文字列列を日付列に変換するには、to_date 関数を使用できます。ただし、古いバージョンの Spark (

Spark の代替アプローチ 2.2:

unix_timestamp 関数と from_unixtime 関数を組み合わせて使用​​します:
from pyspark.sql.functions import unix_timestamp, from_unixtime

# Example DataFrame with string dates
df = spark.createDataFrame(
    [("11/25/1991",), ("11/24/1991",), ("11/30/1991",)],
    ["date_str"]
)

# Convert to timestamps
df2 = df.select(
    "date_str",
    from_unixtime(unix_timestamp("date_str", "MM/dd/yyy")).alias("date")
)
ログイン後にコピー

これにより、文字列列から変換された日付オブジェクトを含む date という名前の新しい列が作成されます。

以上がPySpark の文字列列を日付列に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート