Pandas DataFrame の部分文字列フィルタリング
文字列の部分一致に基づいて pandas DataFrame をフィルタリングすることは、一般的なデータ操作タスクです。この目標を達成するために、pandas バージョン 0.8.1 で導入されたベクトル化された文字列メソッドが洗練されたソリューションを提供します。
正規表現を使用する従来のアプローチ (例: re.search() で個々のセルをチェックする) とは異なり、ベクトル化された文字列メソッドは、文字列メソッドを使用すると、列全体に対する効率的な操作が可能になります。たとえば、「A」列に部分文字列「hello」が含まれる行を選択するには、次のメソッドを使用できます。 code:
この構文は、一連の文字列操作機能を提供する Series オブジェクトの str 属性を利用し、contains() メソッドは、「A」列の各要素が含まれるかどうかを示すブール マスクを返します。指定された部分文字列が含まれます。結果のマスクを使用して DataFrame をフィルタリングし、基準を満たす行のみを選択します。
このメソッドは、簡潔で効率的な方法を提供します。 pandas DataFrame で部分的な文字列一致を実行し、データ フィルタリング操作を合理化します。
以上が部分文字列の一致に基づいて Pandas DataFrame をフィルターするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。