四川省住建设厅网站,如何选择坪山网站建设,wordpress数据库密码解密,美橙互联网站建设进不去1、serier系数#xff0c;可以看作是竖起来的listprint(s_1.index)当加入index后,index等于多少#xff0c;那么它对应的那一行数据的行名就是多少pandas库和numpy库的不同就是#xff0c;numpy只能处理数值类型的数据#xff0c;而pandas可以处理字符串等print(s_3.values…1、serier系数可以看作是竖起来的listprint(s_1.index)当加入index后,index等于多少那么它对应的那一行数据的行名就是多少pandas库和numpy库的不同就是numpy只能处理数值类型的数据而pandas可以处理字符串等print(s_3.values)2、操作seriesimport pandas as pd s_1 pd.Series([1,2,3,4,5], index[a, b, c, d, e]) s_2 pd.Series([lily, rose, jack]) #查 (1)通过标签访问 #访问某个元素 print(s_1[d]) #访问多个元素[Series的切片] print(s_1[a:d]) #访问多个元素 print(s_1[[a, d]]) (2)通过索引访问 print(s_2[2]) print(s_2[0:2]) print(s_2[[0, 2]]) print(s_1[4]) #删除 s_1 s_1.drop(a) #判断一下某个值是否在Series里面 print(jim ! s_2.values) #改 s_2[0] Peter #创建Series dic_1 {name1: Peter, name2:tim, name3:rose} s_4 pd.Series(dic_1) print(s_4) #重置索引 s_4.index range(0, len(s_4)) print(1)3、pandas.DataFrame()就是excel表由多个series拼接而成1属性2常见操作3简单操作df.columns修改列名df.index:修改行名df.loc:增加一行del:删除某列直接在原数据上删除df.drop(文件中的内容, axis1, inplaceFalse):删除某行或某列的内容若axis0,则代表删除行等于1则代表删除列若inplaceFalse表示不知道在原数据上删除而是返回一个删除后的新表格否则则在原数据上删除import pandas as pd df pd.DataFrame( {age:[10,11,12],name:[tim, tom, rose], income:[100,200,300]}, index[person1, person2, person3]) print(df) # 修改列名 a df.columns df.columns range(0, len(df.columns)) print(df.columns) # 修改行名 print(df.index) df.index range(0,len(df.index)) print(df.index) #在最后添加一列 df[pay] [20, 30, 40] print(df) # 增加一行 df.loc[person4, [age, name, income]] [20, kitty, 200] print(df) 访问DataFrame #访问某列 print(df.name) a df.name b df[name] #访问某些列 print(df[[age, name]]) # #访问行 print(df[0:2]) # #使用loc访问 print(df.loc[[person1, person3]]) #访问某个值 print(df.loc[person1, name]) #直接在原数据上删除 del df[age] print(df) #删除列 data df.drop(name, axis1, inplaceFalse) print(data) #删除行 df.drop(person3, axis0, inplaceTrue)4、数据框查询的2种方法 loc() iloc() import pandas as pd import numpy as np #生成指定日期 df pd.DataFrame( np.arange(30).reshape(5,6),index[20180101,20180102,20180103,20180104,20180105], columns[A,B,C,D,E,F]) loc()方法 df.loc[x, y] 【标签索引】 #打印某个值 print(df.loc[20180103, B]) #打印某列值 print(df.loc[:,B]) print(df.loc[20180103:,B]) print(df.loc[20180103:,[B, D]]) #打印某行值 print(df.loc[20180101, :]) #打印某些行 print(df.loc[20180103:,:]) iloc()方法 位置索引 #获取某个数据 print(df.iloc[1,2]) #获取某列 print(df.iloc[:,2]) #获取某几列 print(df.iloc[:,[1,3]]) #获取某行 print(df.iloc[1,:]) #获取某些行 print(df.iloc[[1,2,4],:])5、数据导入与导出1pandas.read_2csv(文件名)功能读取csv文件列名为文件中第一行的数据行名从0开始依次递增若所要读取的文件没有列名则需要在括号中文件名的后面在加一个headerNone但不使用时默认headerTrue代表文件中第一行的数据作为列名当headerNone时列名输出和行名一样的数2pandas.read_excel(文件名)功能读取excel文件3pandas.read_txt(文件名,sep,,headerNone)功能读取txt文件sep,,代表指定文件中的分隔符为逗号4导出文件to_csv:导出csv文件导出.csv:导出文件的文件名indexTrue:导出时 包含DataFrame的索引即行标签默认值为True若为False则不导出行标签导出excel文件也是类似的方法6、缺失值处理1)isnull()功能判断读取文件中空值的位置若是空值输出True,否则输出False2fillna()功能进行缺失值的填充只能将所有的缺失值都填充为同一个数3dropna()功能删除缺失值所在的整行数据7、重复值处理1duplicated()功能找到重复的位置若重复输出True,否则输出False2duplicated(参数1参数2,……)功能根据文件中的列名来判断是否重复参数文件中所存在的列名3提取重复行的信息通过bool提取内容提取输入为True的整行数据4删除重复的行8、数据抽取1df[列名]df:读取文件后将文件存放到的地方列名所读取文件中所存在的列名即第一行的信息想要选取一定范围内的可以在后面加上一定条件如df[好评数] 17000则选取df中好评数大于17000的信息注选取后输出的结果是布尔值只有True和False若为True则是要选取的数据为False则不是df_1 df[df[好评数] 17000]若在df[ ]中选取数据则直接输出符合条件的所有信息而不是输出布尔值2str.contains(参数,naFalse)df[第一行列名].str.contains(参数)对第一列每一个元素进行匹配若存在输出True不存在输出False若此处为确实值输出NaNnaFalse若存在na且等于False输出具体的内容但不输出缺失项的信息若等于True则连缺失行内容一起输出3)逻辑运算和、|或9、数据框的合并concat()函数使用方式concat([df1,df2,df3...])import pandas as pd import numpy as np df_1 pd.DataFrame(np.arange(12).reshape(3,4)) df_2 2*df_1 #竖向合并 new_df1 pd.concat([df_2, df_1]) #横向合并 new_df2 pd.concat([df_1, df_2], axis1) join参数 inner:表示交集 outer:表示并集 df_3 pd.DataFrame(np.arange(12).reshape(3,4), index[A, B, 2]) new_df3 pd.concat([df_1, df_3], axis1, joininner) new_df4 pd.concat([df_1, df_3], axis1, joinouter)