pandas を使用して CSV ファイルを読み取り、データ処理を実行する方法
pandas は、さまざまなデータの読み取り、操作、分析機能を提供する強力なデータ処理および分析ツールです。さまざまなフォーマット。今回はpandasを使ってCSVファイルを読み込み、データ加工を行う方法を紹介します。
まず、pandas ライブラリがインストールされていることを確認してください。まだインストールされていない場合は、ターミナルで次のコマンドを実行してインストールできます:
pip install pandas
次に、次のサンプル CSV ファイルを使用して説明します:
name,age,city John,30,New York Alice,25,Los Angeles Bob,35,Chicago
さあ、始めましょうファイルを読み取り、データを処理するコードを作成します。
まず、パンダ ライブラリをインポートします:
import pandas as pd
次に、read_csv()
関数を使用して CSV ファイルを読み取ります:
df = pd.read_csv('data.csv')
これにより、次のファイルが作成されます。 CSV ファイルの内容を保存するための df
pandas DataFrame オブジェクトというファイル。
読み取ったデータを表示したい場合は、head()
関数を使用してデータの最初の数行を表示できます。
print(df.head())
次に紹介します。一般的に使用されるいくつかのデータ処理操作。
name_column = df['name'] age_column = df['age']
loc
または iloc
関数を使用してデータをフィルタリングできます: row_0 = df.loc[0] # 使用索引选择第一行数据 row_1 = df.iloc[1] # 使用位置选择第二行数据
filtered_data = df[df['age'] > 30] # 筛选年龄大于30的数据
列の削除: df.insert(3, 'country', ['USA', 'USA', 'USA']) # 添加一个名为'country'的列,所有行的值都是'USA'
データの変更:df = df.drop('city', axis=1) # 删除名为'city'的列
関数を使用します。
df.loc[0, 'age'] = 31 # 修改第一行'age'列的值为31 df['age'] = df['age'] + 1 # 将'age'列的所有值加1
これは、パンダを使用して CSV ファイルを読み取り、データ処理を実行する 基本的なメソッドといくつかの一般的な操作。これらの操作により、さまざまな形式のデータを簡単に処理および分析できます。 この記事があなたのお役に立てば幸いです。また、データ処理と分析の旅が成功することを願っています。
以上がPython の pandas ライブラリを使用して CSV データを読み取り、操作する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。