為了建立資料框,pandas 提供了函數名稱 pd.DataFrame,它可以幫助您從一些資料中建立資料框。讓我們看看它是如何工作的。
#创建一个字典 import pandas as pd fruit_data = {"Fruit": ['Apple','Avacado','Banana','Strawberry','Grape'],"Color": ['Red','Green','Yellow','Pink','Green'], "Price": [45, 90, 60, 37, 49] } fruit_data
在這裡,我們建立了一個 Python 的字典,它包括一些資料項目。現在,我們被要求將這本字典變成Pandas資料集。
#Dataframe data = pd.DataFrame(fruit_data) data
那很完美!使用 pandas 的 pd.DataFrame
函數,我們可以輕鬆地將字典轉換為 pandas 資料集。我們的資料集現在已準備好執行未來的操作。
有時,要素的列或名稱會不一致。它可以是字母表的大小寫等等。擁有統一的設計有助於我們有效地使用這些功能。
因此,作為第一步,我們將了解如何更新/更改資料中的列或特徵名稱。
#update the column name data.rename(columns = {'Fruit':'Fruit Name'})
如上圖所示簡單。大家甚至可以一次更新多個列名。為此,我們必須在大括號下方新增以逗號分隔的其他列名。
#multile column update data.rename(columns = {'Fruit':'Fruit Name','Colour':'Color','Price':'Cost'})
就像這樣,我們可以同時更新所有欄位。
在處理具有許多列的資料集時,我們可能會遇到列名不一致的情況。
在我們的資料中,大家可以觀察到所有列名的首字母大寫。始終建議為所有列名使用通用大小寫。
好吧,我們可以將它們轉換為大寫或小寫。
#lower case data.columns.str.lower() data
現在,我們所有的列名都是小寫的。
和更新列一樣,更新行也很簡單。我們必須先找到行值,然後才能使用新值更新該行。
我們可以使用 pandas loc
函數來定位行。
#updating rows data.loc[3]
Fruit Strawberry Color Pink Price 37 Name: 3, dtype: object
我們找到了第 3 行,其中包含水果草莓的詳細資訊。我們需要更新這一行,提供一個新的水果名稱為Pineapple以及它的詳細資訊。
#update data.loc[3] = ['PineApple','Yellow','48'] data
我希望大家也發現更新資料中行的值很容易。現在,假設我們只需要更新行中的一些細節,而不是整個細節。那麼,您對此有何看法?
#更新特定值 data.loc[3, ['Price']]
Price 48 Name: 3, dtype: object
我們只需要更新位於第 3 行的水果的價格。我們知道該水果的當前價格是 48。但是,我們必須將其更新為 65。讓我們這樣做。
#updating data.loc[3, ['Price']] = [65] data
我們只用一行 python 程式碼將水果鳳梨的價格更新為 65。這就是它的工作原理。簡單的。
是的,我們現在將根據特定條件更新行值。最後,我們想要一些有意義的值,這些值應該有助於我們的分析。
讓我們定義我們的條件。
#Condition updated = data['Price'] > 60 updated
我們在這裡要做的是,將價格高於 60 的水果的價格更新為昂貴。
0 False 1 True 2 False 3 True 4 False Name: Price, dtype: bool
根據輸出,我們有 2 個價格超過 60 的水果。讓我們在數據中將這些水果列為昂貴的。
#Updating data.loc[updated, 'Price'] = 'Expensive' data
以上是怎麼使用Python Pandas更新行和列的詳細內容。更多資訊請關注PHP中文網其他相關文章!