其他语言中都有concat函数,在C语言中为字符串拼接,在SQL中也为字符串拼接,而在Pandas中相当于数据库中的全连接(Unionall):沿着一条轴,将多个对象堆叠到一起,大家不要搞混了。与数据库不同的是,它不会去重,但是可以使用drop_duplicates方法达到去重的效果。语法如下:
直接使用concat不加参数时为:
目录
语法如下:
参数解释:
同理axis为1时也一样仅看行索引是否相同
新版本的pandas已经删除了join_axes,这一功能可以用merge代替。
而ignore_index就是把索引index对应替换掉:
参数说明:
仍然是之前两个DataFrame,默认效果为:
该为交集则根据index合并,若没有的索引值则会自动NaN填补:
若想指定特定列名进行索引,则需要on函数:
如果两个DataFrame对象都有“old”,则结果中就会出现“old_x”和"old_y“
THE END