Saya ada bingkai data panda df_sample:
columna columnb a aa a ab b ba b bb b bc
Saya telah mencipta lajur rawak yang mengandungi beberapa objek tarikh:
df_sample['contract_starts'] = np.random.choice(pd.date_range('2024-01-01', '2024-05-01'), len(df_sample))
Ini menghasilkan output berikut:
columna columnb contract_starts a aa 2024-01-21 a ab 2024-03-03 b ba 2024-01-18 b bb 2024-02-18 b bc 2024-04-03
Cara membuat contract_noted lajur datetime lain yang juga mempunyai julat nilai tertentu (mis. sehingga 2024-05-01 ) tetapi tidak lebih daripada contract_starts
lajur, contohnya:
columnA columnB contract_starts contract_noted A AA 2024-01-21 2024-01-20 A AB 2024-03-03 2024-01-01 B BA 2024-01-18 2024-01-13 B BB 2024-02-18 2024-02-01 B BC 2024-04-03 2024-03-28
Anda boleh menolak kenaikan masa rawak daripada lajur dengan contract_starts
列中减去随机时间增量numpy.random.randint
与 to_timedelta
numpy.random.randint
dengan to_timedelta
< /a>:
df_sample['contract_noted'] = (df_sample['contract_starts'] - pd.to_timedelta(np.random.randint(1,30, len(df_sample)), unit='d')) print (df_sample) columna columnb contract_starts contract_noted 0 a aa 2024-04-18 2024-03-21 1 a ab 2024-02-12 2024-01-22 2 b ba 2024-02-21 2024-02-02 3 b bb 2024-04-12 2024-03-29 4 b bc 2024-02-10 2024-02-03
Jika anda juga memerlukan masa tarikh antara mula dan tamat, seperti contract_starts
生成 1
Hasilkan integer antara
days =(df_sample['contract_starts'] - pd.Timestamp('2024-01-01')).dt.days print (days) df_sample['contract_noted'] = (df_sample['contract_starts'] - pd.to_timedelta(np.random.randint(1,days, len(df_sample)), unit='d')) print (df_sample) columnA columnB contract_starts contract_noted 0 A AA 2024-02-09 2024-01-09 1 A AB 2024-04-26 2024-02-23 2 B BA 2024-04-10 2024-04-06 3 B BB 2024-01-31 2024-01-07 4 B BC 2024-01-14 2024-01-08
Atas ialah kandungan terperinci Buat lajur masa tarikh rawak bersyarat pada panda lajur masa tarikh yang lain. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!