Buat lajur masa tarikh rawak bersyarat pada panda lajur masa tarikh yang lain

王林
Lepaskan: 2024-02-10 09:24:04
ke hadapan
1160 orang telah melayarinya

创建随机日期时间列,条件是另一个日期时间列 pandas

Kandungan soalan

Saya ada bingkai data panda df_sample:

columna columnb
a         aa
a         ab
b         ba
b         bb
b         bc
Salin selepas log masuk

Saya telah mencipta lajur rawak yang mengandungi beberapa objek tarikh:

df_sample['contract_starts'] = np.random.choice(pd.date_range('2024-01-01', '2024-05-01'), len(df_sample))
Salin selepas log masuk

Ini menghasilkan output berikut:

columna columnb contract_starts
a         aa     2024-01-21
a         ab     2024-03-03
b         ba     2024-01-18
b         bb     2024-02-18
b         bc     2024-04-03
Salin selepas log masuk

Cara membuat contract_noted lajur datetime lain yang juga mempunyai julat nilai tertentu (mis. sehingga 2024-05-01 ) tetapi tidak lebih daripada contract_startslajur, contohnya:

columnA columnB contract_starts contract_noted
A         AA     2024-01-21      2024-01-20
A         AB     2024-03-03      2024-01-01
B         BA     2024-01-18      2024-01-13
B         BB     2024-02-18      2024-02-01
B         BC     2024-04-03      2024-03-28
Salin selepas log masuk


Jawapan betul


Anda boleh menolak kenaikan masa rawak daripada lajur dengan contract_starts 列中减去随机时间增量numpy.random.randintto_timedelta numpy.random.randint dengan to_timedelta< /a>:

df_sample['contract_noted'] = (df_sample['contract_starts'] - 
                               pd.to_timedelta(np.random.randint(1,30, len(df_sample)), 
                                               unit='d'))

print (df_sample)
  columna columnb contract_starts contract_noted
0       a      aa      2024-04-18     2024-03-21
1       a      ab      2024-02-12     2024-01-22
2       b      ba      2024-02-21     2024-02-02
3       b      bb      2024-04-12     2024-03-29
4       b      bc      2024-02-10     2024-02-03
Salin selepas log masuk

Jika anda juga memerlukan masa tarikh antara mula dan tamat, seperti contract_starts 生成 1 Hasilkan integer antara 1 dan perbezaan dari masa tarikh mula:

days =(df_sample['contract_starts'] - pd.Timestamp('2024-01-01')).dt.days
print (days)

df_sample['contract_noted'] = (df_sample['contract_starts'] - 
                               pd.to_timedelta(np.random.randint(1,days, len(df_sample)), 
                                               unit='d'))
print (df_sample)
  columnA columnB contract_starts contract_noted
0       A      AA      2024-02-09     2024-01-09
1       A      AB      2024-04-26     2024-02-23
2       B      BA      2024-04-10     2024-04-06
3       B      BB      2024-01-31     2024-01-07
4       B      BC      2024-01-14     2024-01-08
Salin selepas log masuk

Atas ialah kandungan terperinci Buat lajur masa tarikh rawak bersyarat pada panda lajur masa tarikh yang lain. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:stackoverflow.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!