データフレームの文字列列を 2 つの列に分割するにはどうすればよいですか?
データ分析の領域では、データフレームに文字列列を分割する必要があることがあります。分裂することはよくあることです。この偉業を達成するには、次の 2 つの重要な質問が生じます:
解決策は、pandas シリーズの汎用性の高い str 属性にあります。インデックス作成インターフェイス:
df['AB'].str[0] # accesses the first element of each string df['AB'].str[1] # accesses the second element of each string
このインデックス作成インターフェイスとタプルのアンパックを活用することで、分割要素を含む新しい列を作成できます:
df['A'], df['B'] = df['AB'].str.split('-').str
あるいは、Pandas は便利な組み込みメソッドを提供します。 、str.split()、文字列を分割し、一連の文字列を自動的に返します。 lists:
df['AB_split'] = df['AB'].str.split('-')
このリストを個別の列に展開するには、expand=True パラメータを使用します。
df[['A', 'B']] = df['AB'].str.split(' ', n=1, expand=True)
分割長が異なる場合、expand=True はそれを適切に処理します。一貫した列の長さを確保する:
df.join(df['AB'].str.split('-', expand=True).rename(columns={0:'A', 1:'B', 2:'C'}))
これらの手法により、Pandas は文字列列を効率的に分割し、データフレームを再構築できるようにします。特定の分析ニーズに応えます。
以上がPandas DataFrame の文字列列を複数の列に分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。