如何將資料幀字串列拆分為兩個欄位?
在資料分析領域,遇到有字串列的資料幀需要被分裂是常有的事。為了實現這項壯舉,出現了兩個基本問題:
解決方案在於pandas Series 的多功能str 屬性,特別是它的索引介面:
df['AB'].str[0] # accesses the first element of each string df['AB'].str[1] # accesses the second element of each string
透過利用這個索引介面和元組解包,我們可以使用分割元素建立新欄位:
df['A'], df['B'] = df['AB'].str.split('-').str
或者,Pandas 提供了一個方便的內建方法, str.split(),用於分割字串並自動傳回一系列清單:
df['AB_split'] = df['AB'].str.split('-')
展開此清單分成單獨的列,我們使用expand=True參數:
df[['A', 'B']] = df['AB'].str.split(' ', n=1, expand=True)
對於不同分割長度的情況,expand=True可以優雅地處理它,確保列長度一致:
df.join(df['AB'].str.split('-', expand=True).rename(columns={0:'A', 1:'B', 2:'C'}))
透過這些技術,Pandas使您能夠有效地拆分字串列並重組資料框,以滿足您的特定分析需求。
以上是如何將 Pandas DataFrame 字串列拆分為多個列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!