Excel / WPS 处理表格数据时,一定要遵循的一些基本原则,都是血的教训啊。持续更新
# 索引列查重
绝大数据操作搜索引用,连接,分析等操作,都需要先检查索引列是否有重复。不然做了半天分析出了一个错误结论都不知道,或者最后发现是有错时,前面好多操作又白费。
索引列主要是指唯一编号。举例:统计人员情况时,对姓名或者身份证号查重。或者其他证号,编号,学号等在统计数据里需要唯一化的。做很多数据操作,会想当然默认数据索引是唯一有效的,但是查一下不会吃亏。
操作:选中索引列,开始-条件格式-突出显示单元格规则-重复项-浅红色填充,此时有重复值的数据都会按所选格式填充颜色,再到筛选-颜色筛选中可以统计和查看重复值。
# 判断和查找时检查单元格
使用vlookup或者if等需要判断单元格内容的函数,一定要数据进行清理。比如去除单元格内前后空格、空行等,统一格式为数值或文本。
# 注意长数字
数字被应用科学计数法是最恶心的情况之一,尤其是长度大于15位数的数字编号型,按理说都应该是文本类型,但在一些复制拷贝或者修改等情况下,不小心就会被科学计数,损失掉超15位的末尾数字。