Erstellen Sie eine zufällige Datetime-Spalte, die von einem anderen Datetime-Spaltenpandas abhängig ist

王林
Freigeben: 2024-02-10 09:24:04
nach vorne
1169 Leute haben es durchsucht

创建随机日期时间列,条件是另一个日期时间列 pandas

Frageninhalt

Ich habe einen Pandas-Datenrahmen df_sample:

columna columnb
a         aa
a         ab
b         ba
b         bb
b         bc
Nach dem Login kopieren

Ich habe eine zufällige Spalte erstellt, die einige Datumsobjekte enthält:

df_sample['contract_starts'] = np.random.choice(pd.date_range('2024-01-01', '2024-05-01'), len(df_sample))
Nach dem Login kopieren

Dies führt zu folgender Ausgabe:

columna columnb contract_starts
a         aa     2024-01-21
a         ab     2024-03-03
b         ba     2024-01-18
b         bb     2024-02-18
b         bc     2024-04-03
Nach dem Login kopieren

So erstellen Sie eine weitere Datetime-Spalte „contract_noted“, die ebenfalls einen bestimmten Wertebereich hat (z. B. bis 01.05.2024), aber nicht mehr als contract_startsSpalte, zum Beispiel:

columnA columnB contract_starts contract_noted
A         AA     2024-01-21      2024-01-20
A         AB     2024-03-03      2024-01-01
B         BA     2024-01-18      2024-01-13
B         BB     2024-02-18      2024-02-01
B         BC     2024-04-03      2024-03-28
Nach dem Login kopieren


Richtige Antwort


Sie können ein zufälliges Zeitinkrement von einer Spalte subtrahieren, indem Sie contract_starts 列中减去随机时间增量numpy.random.randintto_timedelta numpy.random.randint mit to_timedelta< /a>:

df_sample['contract_noted'] = (df_sample['contract_starts'] - 
                               pd.to_timedelta(np.random.randint(1,30, len(df_sample)), 
                                               unit='d'))

print (df_sample)
  columna columnb contract_starts contract_noted
0       a      aa      2024-04-18     2024-03-21
1       a      ab      2024-02-12     2024-01-22
2       b      ba      2024-02-21     2024-02-02
3       b      bb      2024-04-12     2024-03-29
4       b      bc      2024-02-10     2024-02-03
Nach dem Login kopieren

Wenn Sie auch die Datums- und Uhrzeitangabe zwischen Start und Ende benötigen, gehen Sie wie folgt vor: contract_starts 生成 1 Erzeugen Sie ganze Zahlen zwischen 1 und der Differenz zur Startdatumszeit:

days =(df_sample['contract_starts'] - pd.Timestamp('2024-01-01')).dt.days
print (days)

df_sample['contract_noted'] = (df_sample['contract_starts'] - 
                               pd.to_timedelta(np.random.randint(1,days, len(df_sample)), 
                                               unit='d'))
print (df_sample)
  columnA columnB contract_starts contract_noted
0       A      AA      2024-02-09     2024-01-09
1       A      AB      2024-04-26     2024-02-23
2       B      BA      2024-04-10     2024-04-06
3       B      BB      2024-01-31     2024-01-07
4       B      BC      2024-01-14     2024-01-08
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonErstellen Sie eine zufällige Datetime-Spalte, die von einem anderen Datetime-Spaltenpandas abhängig ist. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:stackoverflow.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!