シナリオ:
Pandas DataFrame 内のデータは、多くの場合、さまざまな形式で存在します。文字列も含めて。時系列データを扱う場合、タイムスタンプは最初は文字列として表示されますが、正確な分析のために日時形式に変換する必要があります。
日付に基づく変換とフィルタリング
Pandas で文字列列を日時に変換するには、to_datetime 関数を使用します。この関数は、文字列列の予期される形式を指定する形式引数を受け取ります。
例:
次の DataFrame に文字列を含む列 (Mycol) があるとします。カスタム形式:
import pandas as pd raw_data = pd.DataFrame({'Mycol': ['05SEP2014:00:00:00.000']})
この列を日時に変換するには、次のコマンドを使用します。 code:
df['Mycol'] = pd.to_datetime(df['Mycol'], format='%d%b%Y:%H:%M:%S.%f')
指定された形式引数は、指定された文字列形式と一致します。変換後、Mycol 列には datetime オブジェクトが含まれるようになります。
日付ベースのフィルタリング
列が datetime に変換されると、日付ベースのフィルタリング操作を実行できます。 。たとえば、日付が特定の範囲内にある行を選択するには:
start_date = '01SEP2014' end_date = '30SEP2014' filtered_df = df[(df['Mycol'] >= pd.to_datetime(start_date)) & (df['Mycol'] <= pd.to_datetime(end_date))]
結果の filtered_df には、Mycol 列の値が指定された日付の間にある行のみが含まれます。
以上がPandas DataFrame 列を DateTime 形式に変換し、日付でフィルターする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。