一、工具准备
数据分析一个很好的工具:anaconda,本教程是在win10系统中使用anaconda3的jupyter工具,该工具运行在浏览器中。
下载网址:https://www.anaconda.com/
启动方法
开始菜单,打开anaconda prompt命令行窗口
进入到项目所在目录,该目录自己设定
使用命令jupyter notebook即可打开浏览器
二、Series类型
索引一旦被创建,里面的值不能被单个修改
1. 创建Series对象
通过列表或者数组创建对象
import pandas as pd import numpy as np users=['张三','李四','王老五'] series1=pd.Series(users) print(series1)
以上代码结果:
0 张三 1 李四 2 王老五 dtype: object
通过字典创建series对象
users={'张三':20,'李四':25,'王五':21} series2=pd.Series(users) print(series2)
以上代码结果:
张三 20 李四 25 王五 21 dtype: int64
2. 获取Series的序列
print(series2.index)
以上代码结果:
Index(['张三', '李四', '王五'], dtype='object')
3. 获取Series的值
print(series2.values)
以上代码结果:
[20 25 21]
4. 获取某一个值
print(series2.values) print(series2[1]) print(series2['王五'])
以上代码结果:
25 21
上面两种方法都可以获取到Series的值
5. 日期时间索引
pd.date_range('2022-10-01',periods=4,freq='M')
periods:分多个区间
freq:按年、月、日、周、时间等划分
6.时间间隔索引
pd.TimedeltaIndex([10,12,14,16],unit="D")
以上代码结果:
TimedeltaIndex(['10 days', '12 days', '14 days', '16 days'], dtype='timedelta64[ns]', freq=None)
unit的值可以换成Y,W,H等等
7.索引取值
import numpy as np import pandas as pd pd=pd.DataFrame(np.random.randint(1,100,(4,5)),index=['A','B','C','D']) # pd['A':'C']#通过索引名称取值,结果包含最后一个 pd[0:3]#通过索引下标取值,结果不包含最后一个
8. 条件索引
conditon=series>50 series[conditon] 或 series[series>50]
以上代码结果:
0 1 2 3 4 A 84.0 63.0 76.0 72.0 77.0 B NaN 96.0 NaN 65.0 NaN C NaN NaN NaN 81.0 NaN D 74.0 89.0 NaN NaN 53.0
Das obige ist der detaillierte Inhalt von使用Pandas数据分析之Series. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!