王***
2017-08-11 13:43:11
所谓存,其实就是大数据的采集与存储,必须先有数据。很多时候,如果我们连数据都没有,大数据只能是空中楼阁。所以,一个想要做大数据的企业,必须先想办法拥有数据,或者采集、爬取、购买数据。
关于通,主要是两个层面的问题:
其一是指数据的互通,比如一个企业内部存在很多信息孤岛,信息孤岛之间必须打通,形成统一的大数据平台。 关于通,最...[展开]
所谓存,其实就是大数据的采集与存储,必须先有数据。很多时候,如果我们连数据都没有,大数据只能是空中楼阁。所以,一个想要做大数据的企业,必须先想办法拥有数据,或者采集、爬取、购买数据。
关于通,主要是两个层面的问题:
其一是指数据的互通,比如一个企业内部存在很多信息孤岛,信息孤岛之间必须打通,形成统一的大数据平台。 关于通,最。好的办法其实就是企业建立一个统一的大数据平台,不管这个大数据平台是基于私有云(如Hadoop生态的解决方案),还是基于公共云(如阿里云数加的解决方案),当所有的数据上传到这个大数据平台,数据天然就打通了。
现在报名你的课大数据营销培训班,掌握大数据精准营销核心技术。
其二是数据的标准,如果想让不同的数据源可以相互关联,形成更大的效应,就跟我在上文讲到的一样,就得有数据标准。
如上文所言,数据标准不仅仅可以指导ETL过程中的数据清洗,数据校验,好的数据标准还可以使得无线的数据跟PC的数据相互关联互通,甚至企业之间的数据关联互通。
这些过程,我们可以把它叫做数据化的过程,也就是大数据的基本要素 -- 数据的形成。
。[收起]