当前位置:首页>开发>正文

如何利用大数据进行预测

2024-07-31 17:10:20 互联网 未知 开发

如何利用大数据进行预测?

如何利用大数据进行预测

大数据另一核心就是预测,它能够让企业在预测中迎接现实。企业把数学运算应用到海量的数据中来,来预测未来可能发生的事情。

预测是大数据的力量的核心,已经被多次证明。微软公司认为:“微软生产的一款数据驱动软件,能够通过风扇、空调、电器、电灯等电器积累下来的海量数据,便可知道怎样节省能源的浪费,就这个数据的搜集可以为世界节省43%的电能。”与此类似的事情,还有谷歌对于关键词的搜索进行分析,它能够比政府检测部门提前两周预测到流感的分布情况,提供预警服务。

如何利用大数据进行预测

大数据的出现,可以对数据进行分析获得对商机、社会服务的预测,大数据从局限于学术圈子扩大到了商业机构和政府部门。大数据开启了一个重大的时代转型。就像是望远镜让我们看到了宇宙的广阔,显微镜让我们看到了看不见的东西一样,大数据正在改变我们的生活方式和对世界的了解,成为了众多发明和服务不可缺少的工具,而大数据对于世界更多的改变还没有到来。维克托·迈尔-舍恩伯格曾说,利用大数据预测商机,将成为行业人士争相追捧的焦点。

如何利用大数据进行预测

如今各界对于大数据都是格外的关注。首要原因在于,大数据的预测在在一般情况下预测很准,可以给很多人带来利益。比如股民们可以利用大数据预测股票走势,如果大数据可以预测到股票的趋势,会赢得大部分股民对于大数据的关注。在世界杯期间,如果大数据可以根据比赛的记录球员群的信心预测比赛的输赢,那么也会赢得球迷们的关注。在以后的的奥运会或是世界杯上,大数据也会扮演重要角色。

如何利用大数据进行预测

从以上的几个案例来看,很多人对大数据预测有了一定的了解,不过还值得大家思考的是如何提升大数据预测的精准率呢?

一方面,大数据应用的范围和领域越来越广,但是有的领域不存在大数据,也就是说,大数据还没有覆盖到有些领域中去,在这种情况下,大数据的预测就有可能会出现预测不准的情况。

另一方面,要想利用大数据预测必须建立好数据模型,在2015年的世界杯期间,百度、谷歌、微软等互联网巨头对64场比赛的胜负结果以及冠军全部进行了预测。无论是决赛还是淘汰赛,百度的预测都非常精准高达100%,甚至比微软和谷歌的精准度还要高出很多。其中预测精准度的原因就是它们采用了不同的数据模型,才导致了预测结果相差甚远。

如何利用大数据进行预测

要想建立数据模型应用到预测当中去,我们应当怎么做才能从中获取收益?

有人将自己的积蓄都花费在股市交易预测系统上,但结果是一无所有。利用大数据去预测就意味着要依据预测结果去行动,要在预测和实践中学到东西并尊重数据所揭示的规律。要想利用大数据做到精准的预测必须做到这一点,否则,它们只能失败。

如何利用大数据进行预测

用数据预测,只能说是统计分析的算法问题。

而大数据的预测更多的是发现未知的规律和未知事物的联系。

因此,用大数据的预测更多的是发现事物的发展趋势,而不是预测准确的数值。

大数据的“4V”特征表明大数据不仅仅是数据海量,对于大数据的分析将更加复杂、更追求速度、更注重实效。数据量呈指数增长的同时,隐藏在海量数据的有用信息却没有相应比例增长,反而使我们获取有用信息的难度加大。以视频为例,连续的监控过程,可能有用的数据仅有一两秒。数据科学家必须借助预测分析软件来评估他们的分析模型和规则,预测分析软件通过整合统计分析和机器学习算法发挥作用。

统计与分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等,以满足大多数常见的分析需求,在这方而,一些实时性需求会用到EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存储Infobright等,而一些批处理,或者基于半结构化数据的需求可以使用Hadoop。统计与分析这部分的主要特点和挑战是分析涉及的数据量大,其对系统资源,特别是I/O会有极大的占用。

IBM SPSS和SAS是两个数据科学家常用的分析软件。R项目则是一个非常流行的开源工具。如果数据量大到“大数据”的程度,那么还需要一些专门的大数据处理平台如Hadoop或数据库分析机如0racle的Exadata。


如何利用大数据进行预测
如何利用大数据进行预测
如何利用大数据进行预测

随便看看