回帖:数据选取
df[col] # 根据列名,并以Series的形式返回列df[[col1, col2]] # 以DataFrame形式返回多列df.loc[df['team'] == 'B',['name']] # 按条件查询,只显示name 列s.iloc[0] # 按位置选取数据s.loc['index_one'] # 按索引选取数据df.loc[0,'A':'B'] #A到 B 字段的第一行 df.loc[2018:1990, '第一产业增加值':'第三产业增加值']df.loc[0,['A','B']] # d.loc[位置切片, 字段]df.iloc[0,:] # 返回第一行, iloc 只能是数字df.iloc[0,0] # 返回第一列的第一个元素dc.query('site_id > 8 and utype=="老客"').head() # 可以 and or /& | # 迭代器及使用for idx,row in df.iterrows(): row['id']# 迭代器对每个元素进行处理df.loc[i,'链接'] = f'http://www.gairuo.com/p/{slug}.html'for i in df.Name:print(i) # 迭代一个列# 按列迭代,[列名, 列中的数据序列 S(索引名 值)]for label, content in df.items():print(label, content)# 按行迭代,迭代出整行包括索引的类似列表的内容,可row[2]取for row in df.itertuples():print(row)df.at[2018, '总人口'] # 按行列索引名取一个指定的单个元素df.iat[1, 2] # 索引和列的编号取单个元素s.nlargest(5).nsmallest(2) # 最大和最小的前几个值df.nlargest(3, ['population', 'GDP'])df.take([0, 3]) # 指定多个行列位置的内容# 按行列截取掉部分内容,支持日期索引标签ds.truncate(before=2, after=4)# 将 dataframe 转成 seriesdf.iloc[:,0]float(str(val).rstrip('%')) # 百分数转数字df.reset_index(inplace=True) # 取消索引