2021-11-18 00:06来源:m.sf1369.com作者:宇宇
海量数据作为一个专有名词成为热点,主要应归功于近来年来互联网、云计算、移动和物联网的迅猛发展。无所不在的移动设备、RFID、无线传感器每分每秒都在产生数据、数以亿计用户的互联网服务时时刻刻在产生局立案的交互,要处理的数据量实在是太大、增长太快了,据IDC2006年(Internet Data Center)估计全世界的数据量已超过0.18ZB(1ZB=2^70B),而今年这个数字已经提升了一个数量级,达到1.8ZB,差不多平均全世界每个人一块100多GB的硬盘的数据拥有量。这种增长还在加速,预计2015年将达到近8ZB。面对如此庞大的数据量,可想而知各个大型企业特别是以数据搜集为主的公司的数据量就可想而知了:“百度,数百个PB(1ZB=2^20PB);Yahoo!100PB。为了要满足业务需求和减缓竞争压力对数据处理的实时性、有效性又提出了更高的要求,传统的常规的技术手段根本无法应对当前的形式。
在这种情况下,技术人员纷纷研发和采用了一批新的技术、主要包括分布式缓存、基于MPP的分布式数据库、分布式文件系统、各种NoSQL分布式存储方案等。