上海凌翰物流有限公司 上海到济南物流专线

新闻中心 首页 > 新闻中心 > 新闻详细

这一流程几乎适用于任何来源和性质的数据

来源:www.jinanwl.cn 发布时间:2013-06-09 点击数:


上海至济南物流公司用户通过PC或移动设备发生的交易行为会产生相当数量的原始数据
  按照一定分发规则,数据被分发至各个集群服务器。零散的、无序的、没有关联的原始数据在集群服务器被加工成人或者机器可以理解的形式
  对于这一点,冯春培也毫不讳言,“上海至济南物流公司短期的伪造数据当然是有可能的,用特定的维度去伪造数据也是完全可能的,但是因为我们的业务是基于长期数据进行跟踪分析的,采纳的维度也更广,伪造数据的成本和难度会越来越大。按照我们现在的信用模型,伪造数据的收益是不太可能覆盖成本的,那么我们可以基本判断,数据的真实性是有保障的。”
  是否存在冗余数据?冯春培的答案是“NO”,“即使现在的场景需求,或者我现在的眼光来看这个数据我觉得没有用,但不意味着将来这个数据也是没用的。”这同时也造成了一个问题存储的数据量会越来越大,但是在特定的应用场景中只需要用到一小部分数据,“确实,我们现在每一次的数据分析都是在‘大海捞针"。
  据介绍,这一流程几乎适用于任何来源和性质的数据。此外,为了便于在内部解决数据的交换、安全和匹配等问题,阿里集团还搭建了一个数据交换平台。冯春培表示,在这个平台上,各个事业群可以实现数据的内部流转,实现价值最大化。http://www.jinanwl.cn/zhuanxiantwo.htm
http://www.jinanwl.cn/zhuanxianone.htm

相关新闻