本文共 3282 字,大约阅读时间需要 10 分钟。
Python pandas库的Series与DataFrame常用命令详细讲解!
工具:jupyter notebook
Series类型是一组数据及与之相关的数据索引组成 .
1,不指定索引创建Seriesimport pandas as pdimport numpy as np#简单的分析pd.Series传递的参数,data=传递的列表数据,index=第一列的索引可以不传递默认生成根据自己的需要设置data =pd.Series(range(1,6))data2,指定索引创建Series
data =pd.Series(data=[9,8,7,6],index=['a','b','c','d'])data
DataFrame是表格型类,可理解为二维表数据类型,index(axis=0),colum(axis=1)
1,不指定列名创建DataFrame
#简单的分析pd.DataFrame传递的参数,data=传递的数据一般为字典#(里面包含迭代器(列表)),index=第一列的索引可以不传递默认#生成根据自己的需要设置d={ '姓名':['ganxiang','king','jack','brian','tony'], '年龄':[21,21,22,22,21], '学号':[11,10,12,13,14]}#pd.DataFrame(columns=,index=,data=,)columns指定列名默认可以不指定#以传递的字典key为列名,index指定第一列索引默认从0开始,#data为必须指定数据#一般为字典,字典内可以为key:列表,key:str)data =pd.DataFrame(data=d,index=['a','b','c','d','e'])data2,指定列名创建DataFrame
#指定columns,columns为列表不管有多少列按列表的写法,传递的数据为字典#指定列名一定要与字典的key值相同d={ '姓名':['ganxiang','king','jack','brian','tony'], '年龄':[21,21,22,22,21], '学号':[11,10,12,13,14]}data =pd.DataFrame(data=d,index=['a','b','c','d','e'],columns=[ '姓名','年龄','学号'],dtype=str)data3,将DataFrame里面的数据列和行互换
print("将DataFrame里面的数据列和行互换:\n",data.T)4,通过多维数组方式创建DataFrame,需要制定列索引,行索引可默认.
#通过多维数组方式创建DataFrame,需要制定列索引,行索引可默认d=[['ganxiang', '21', '11'], ['king', '21', '10'], ['jack', '22', '12'], ['brian', '22', '13'], ['tony', '21', '14']]f =pd.DataFrame(np.arange(12).reshape((3,4)),columns=['a','b','c','d'])f5,获取DataFrame里面的数据前n行,默认获取为前五行。
d={ '姓名':['ganxiang','king','jack','brian','tony','erick'], '年龄':[21,21,22,22,21,20], '学号':[11,10,12,13,14,15]}#获取DataFrame里面的数据前n行,默认获取为前五行df =pd.DataFrame(data=d,index=['a','b','c','d','e','f'],columns=[ '姓名','年龄','学号'],dtype=str)print("head()默认打印前五行:\n",df.head())6,获取DataFrame里面的数据后n行,默认获取为后五行
#获取DataFrame里面的数据后n行,默认获取为后五行print("#获取DataFrame里面的数据后n行,默认获取为后五行:\n",df.tail(2))7,获取DataFrame里面的所有数据,返回 DataFrame 的 Numpy 格式
#获取DataFrame里面的所有数据,返回 DataFrame 的 Numpy 格式print("获取DataFrame里面的所有数据:\n",df.values)8,获取DataFrame里面的所有列名,返回数据DataFrame 行
#获取DataFrame里面的所有列名,返回数据DataFrame 行print("获取DataFrame里面的所有列名:\n",df.columns)9,取DataFrame里面的某一列数据
#获取DataFrame里面的某一列数据print("获取DataFrame里面的某一列数据:\n",df['姓名'])10,获取DataFrame里面的某一列数据并指定数据读取
#获取DataFrame里面的某一列数据并指定数据读取print("1,获取DataFrame里面的某一列数据并指定数据读取:\n",df['姓名'][2:5])print("\n 2,获取DataFrame里面的某一列数据并指定数据读取:\n",df['姓名'][2])11,根据整数访问行和列的单个值,类似二维数组访问数据,iat取某个单值,只能数字索引
#根据整数访问行和列的单个值,类似二维数组访问数据,iat取某个单值,只能数字索引print("iat根据整数访问行和列的单个值\n",df.iat[0,0])12,at取某个单值,只能index和columns索引
#at取某个单值,只能index和columns索引print("at取某个单值,只能index和columns索引:\n",df.at['a',"姓名"])13,shape返回数据 DataFrame 维数的元组(行和列的数量)
#shape返回数据 DataFrame 维数的元组(行和列的数量).print("返回数据 DataFrame 维数的元组(行和列的数量):\n",df.shape)14,size返回DataFrame 元素数量
#size返回DataFrame 元素数量print("size返回DataFrame 元素数量:\n",df.size)15,dtypes返回数据 DataFrame 的 dtypes.
#dtypes返回数据 DataFrame 的 dtypes.print("dtypes返回数据 DataFrame 的 dtypes:\n",df.dtypes)16,读取某几行数据
#读取某几行数据print("读取某几行数据:\n",df.ix[1:3])17,读取某几列数据,loc第一个参数为行名,第二个参数为列名,loc只能通过index和columns来取,不能用数字
#读取某几列数据,loc第一个参数为行名,第二个参数为列名,loc只能通过index#和columns来取,不能用数字print("读取某几列数据:\n",df.loc['a':'f','姓名'])18,读取某几列数据,iloc只能用数字索引,不能用索引名
#读取某几列数据,iloc只能用数字索引,不能用索引名print("读取某几列数据:\n",df.iloc[0:6,0])到此pandas的Series与DataFrame的常用命令学习完成!
点赞再走呗🤞🤞🤞
转载地址:http://meqzi.baihongyu.com/