首页| 论坛| 消息
主题:Pandas 速查手册
回帖:数据清理df.columns = ['a','b','c'] # 重命名列名df.columns = df.columns.str.replace(' ', '_') # 列名空格换下划线df.loc[df.AAA >= 5, ['BBB', 'CCC']] = 555 # 替换数据df['pf'] = df.site_id.map({2: '小程序', 7:'M 站'}) # 将枚举换成名称pd.isnull() # 检查DataFrame对象中的空值,并返回一个 Boolean 数组pd.notnull() # 检查DataFrame对象中的非空值,并返回一个 Boolean 数组df.drop(['name'], axis=1) # 删除列df.drop([0, 10], axis=0) # 删除行del df['name'] # 删除列df.dropna() # 删除所有包含空值的行df.dropna(axis=1) # 删除所有包含空值的列df.dropna(axis=1,thresh=n) # 删除所有小于 n 个非空值的行df.fillna(x) # 用x替换DataFrame对象中所有的空值df.fillna(value={'prov':'未知'}) # 指定列的空值替换为指定内容s.astype(float) # 将Series中的数据类型更改为 float 类型df.index.astype('datetime64') # 转化为时间格式s.replace(1, 'one') # 用 ‘one’ 代替所有等于 1 的值s.replace([1, 3],['one','three']) # 用'one'代替 1,用 'three' 代替 3df.rename(columns=lambda x: x + 1) # 批量更改列名df.rename(columns={'old_name': 'new_name'}) # 选择性更改列名df.set_index('column_one') # 更改索引列df.rename(index=lambda x: x + 1) # 批量重命名索引# 重新命名表头名称df.columns = ['UID', '当前待打款金额', '认证姓名']df['是否设置提现账号'] = df['状态'] # 复制一列df.loc[:, ::-1] # 列顺序反转df.loc[::-1] # 行顺序反转, 下方为重新定义索引df.loc[::-1].reset_index(drop=True)
下一楼›:数据清理
#保留小数位,四舍六入五成双df.round(2) # 全部df.round({'A': 1, ' ..
‹上一楼:查看、检查、统计、属性

df.head(n) # 查看 DataFrame 对象的前n行df.tail(n) # 查看 D ..

查看全部回帖(13)
«返回主帖