2022-10-22 19:01来源:m.sf1369.com作者:宇宇
EXCEL是轻量级的数据处理软件,但可以处理200万行以上的项目,一般是用POWER QUERY或POWER PIVOT来处理。EXCEL文件表格在中超过200万行,这种情况下的数据来源基本都是从数据库中导出来的,既然已经有了数据库软件系统,最好还是用数据库来处理这些数据,这应该是最合理的处理方法。
常用的数据处理软件有:SAS 、SPSS 、EXCEL 、MATLAB、Origin 等等当前流行的图形可视化和数据分析软件有Matlab,Mathmatica和Maple等。这些软件功能强大,可满足科技工作中的许多需要,但使用这些软件需要一定的计算机编程知识和矩阵知识,并熟悉其中大量的函数和命令。
而使用Origin就像使用Excel和Word那样简单,只需点击鼠标,选择菜单命令就可以完成大部分工作,获得满意的结果。 但它又比excel要强大些。
在1000个数据里面,查找出200个数据,然后做一下标记,再手工把这些相同的删去,做法很多,你方便发数据吗?
有多种途径可实现此目标,举例:
1、用统一的模板,使用函数合并;
2、借助合并工作表的功能;
3、编写VBA程序
步骤如下:
1. 需要先在Excel选项中的加载项中,将“分析工具库”添加进去,然后才可以在“数据”选项下,看到“数据分析”。
2、数据处理阶段:
这个时候要用到excel了。首先要对数据进行一次大清洗!将多余重复的数据筛选清除,将缺失数据补充完整,将错误数据纠正或删除。
要用到一系列函数:
数据重复【(COUNTIF函数),删除重复项】
缺失数据【IF And Or 嵌套函数等】
数据抽样【Left,Right,CONCATENATE(文本1,文本2....),VLOOKUP】
数据计算【AVERAGE、SUM、MAX、MIN,Date,If】
数据分组【VLOOKUP函数,采用近似匹配,SEARCH函数】
数据抽样【RAND函数,RAND()】
以上只是一些简单的说明,具体问题需要根据需求进行分析。