一日一技:从Pandas DataFrame两个小技巧
今天我从网上下载了一批数据。这些数据是Excel格式,我需要把他们转移到MySQL中。这是一个非常简单的需求。
正常情况下,我们只需要5行代码就能解决问题:
1 | import pandas as pd |
但我发现,这个下载的文件有两个工作簿(Sheet),第一个Sheet叫做Overall
,第二个Sheet叫做Result
。我们需要的数据在Result
这个工作簿中。那么,在使用Pandas读取时,需要这样写代码:
1 | df = pd.read_excel('文件路径', 'Result') |
第二个问题,是这个Excel表格的列名,包含了一些不能作为MySQL字段名的值,如下图所示:
其中的空格、括号、百分号、&符号都不适合放到MySQL的字段名中。那么怎么快速批量把这些字符全部替换掉呢?可以使用如下的写法:
1 | df.columns = df.columns.str.strip().str.lower().str.replace(' ', '_').str.replace('(', '').str.replace(')', '').str.replace('%', 'percent_unit').str.replace('&', '_and_') |
这样可以批量把所有列名转换为小写字母,并移除特殊符号。效果如下图所示: