首页| 论坛| 消息
主题:Pandas 速查手册
回帖:数据合并
# 合并拼接行
# 将df2中的行添加到df1的尾部
df1.append(df2)
# 指定列合并成一个新表新列
ndf = (df['提名1']
.append(df['提名2'], ignore_index=True)
.append(df['提名3'], ignore_index=True))
ndf = pd.DataFrame(ndf, columns=(['姓名']))
# 将df2中的列添加到df1的尾部
df.concat(, axis=1)

# 合并文件的各行
df1 = pd.read_csv('111.csv', sep='\t')
df2 = pd.read_csv('222.csv', sep='\t')
excel_list =
# result =pd.concat(excel_list).fillna('')[:].astype('str')
result = pd.concat(excel_list)[]
result.to_excel('333.xlsx', index=False)
# 合并指定目录下所有的 excel(csv) 文件
import glob
files = glob.glob("data/cs/*.xls")
dflist = []
for i infiles:
dflist.append(pd.read_excel(i,usecols=['ID', '时间', '名称']))

df = pd.concat(dflist)

# 合并增加列
# 对df1的列和df2的列执行SQL形式的join
df1.join(df2,on=col1,how='inner')
# 用 key 合并两个表
df_all = pd.merge(df_sku, df_spu,
how='left',
left_on=df_sku['product_id'],
right_on=df_spu['p.product_id'])
下一楼›:时间处理 时间序列
df.index = pd.DatetimeIndex(df.index)
# 时间只保留日期
df[&# ..
‹上一楼:数据处理 GroupBy 透视

df.groupby(col) # 返回一个按列col进行分组的Groupby对象
..

查看全部回帖(13)
«返回主帖