2022-11-10 05:35来源:m.sf1369.com作者:宇宇
大数据分析的数据来源有很多种,包括公司或者机构的内部来源和外部来源。分为以下几类:
交易数据。包括POS机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。
移动通信数据。能够上网的智能手机等移动设备越来越普遍。移动通信设备记录的数据量和数据的立体完整度,常常优于各家互联网公司掌握的数据。移动设备上的软件能够追踪和沟通无数事件,从运用软件储存的交易数据(如搜索产品的记录事件)到个人信息资料或状态报告事件(如地点变更即报告一个新的地理编码)等。

人为数据。人为数据包括电子邮件、文档、图片、音频、视频,以及通过微信、博客、推特、维基、脸书、Linkedin等社交媒体产生的数据流。这些数据大多数为非结构性数据,需要用文本分析功能进行分析。
机器和传感器数据。来自感应器、量表和其他设施的数据、定位/GPS系统数据等。这包括功能设备会创建或生成的数据,例如智能温度控制器、智能电表、工厂机器和连接互联网的家用电器的数据。来自新兴的物联网(Io T)的数据是机器和传感器所产生的数据的例子之一。来自物联网的数据可以用于构建分析模型,连续监测预测性行为(如当传感器值表示有问题时进行识别),提供规定的指令(如警示技术人员在真正出问题之前检查设备)等
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法[2])大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)
第一种,统计工具:有百度统计、Google、CNZZ、51啦等
第二种,搜索引擎:百度、Google、360,等等
第三种,行业大数据,这种是数据很多都是人共采集的或者行业提供的。
医疗健康领域的大数据主要有四个来源:1、制药企业/生命科学
2、临床决策支持及其他临床应用(包括诊断相关影像信息)
3、费用报销、利用率和欺诈监管
4、患者行为/社交网络
也就是说,不管是来自制药企业的数据,还是来着临床、社保或是患者的数据都可被当作医疗健康大数据的来源。
诸多的数据肯定是自己慢慢积累的啊,至于新的数据也许能通过大数据的技术获取到一些,或者是资源的互换。通过大数据分析的技术得出最有需求的数据,然后在慢慢的转换,获取利润的。
这个很多,人口健康普查,医院临床检验数据,电子健康档案,还有现在一些健康医疗类的手机app,一些高科技设备如(小米手环,可以测量健康情况的运动鞋,测血压血压仪等)
数据挖掘在很多行业都有应用,所以不清楚题主指的是哪个部分的。例如通讯行业,数据挖掘的数据来源主要是对通讯信令、通讯数据的采集,采集在运营商核心网基本就可以完成。