在資料操作領域,經常需要將多個文本列組合成一個單一的、有凝聚力的列。讓我們探討一個涉及具有「年份」和「季度」列的 DataFrame 的常見場景,其中目標是建立一個代表組合值的新「週期」列。
為了實現這一目標,我們採用以下策略:
直接連接(字串列)
如果都是「年份」和' quarter'列是字串類型,我們可以直接使用以下方式連接它們:
df["period"] = df["Year"] + df["quarter"]
類型轉換(非字串列)
如果columns不是字串類型,我們必須先將它們轉換為strings:
df["period"] = df["Year"].astype(str) + df["quarter"]
注意:在連接過程中小心處理 NaN。
多個字串列的聚合
處理時對於多個字串列,我們可以利用「agg」函數:
df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)
這裡,「-」充當列值之間的分隔符號。
透過採用這些技術,您可以輕鬆地組合 Pandas DataFrame 中的文字列,為無縫資料處理和分析。
以上是如何有效地連接 Pandas DataFrame 中的文字列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!