Pandas 是python的資料分析包,最初由AQR Capital Management於2008年4月開發,並於2009年底開源出來,目前由專注於Python資料包開發的PyData開發team繼續開發和維護,屬於PyData項目的一部分。
Pandas最初是作為金融資料分析工具而開發出來,因此,pandas為時間序列分析提供了很好的支持。 (推薦學習:Python影片教學)
Pandas的名稱來自於面板資料(panel data)和python資料分析(data analysis)。 panel data是經濟學中關於多維資料集的術語,在Pandas中也提供了panel的資料型態。
資料結構:
Series:一維數組,與Numpy中的一維array類似。二者與Python基本的資料結構List也很相近,其區別是:List中的元素可以是不同的資料類型,而Array和Series中則只允許儲存相同的資料類型,這樣可以更有效的使用內存,提高運算效率。
Time- Series:以時間為索引的Series。
DataFrame:二維的表格型資料結構。很多功能與R中的data.frame類似。可以將DataFrame理解為Series的容器。以下的內容主要以DataFrame為主。
Panel :三維的數組,可以理解為DataFrame的容器。
Pandas 有兩種自己獨有的基本資料結構。讀者應該注意的是,它固然有著兩種資料結構,因為它依然是 Python 的一個函式庫,所以,Python 中有的資料型別在這裡依然適用,也同樣還可以使用類別自己定義資料型別。只不過,Pandas 裡面定義了兩種資料型態:Series 和 DataFrame,它們讓資料運算變得更簡單了。
因為pandas是python的第三方函式庫所以使用前需要安裝一下,直接使用pip install pandas 就會自動安裝pandas以及相關元件
導入pandas模組並使用別名,以及導入Series模組,以下使用基於本次導入。
from pandas import Series import pandas as pd
更多Python相關技術文章,請造訪Python教學欄位學習!
以上是python怎麼導入pandas的詳細內容。更多資訊請關注PHP中文網其他相關文章!