当前位置:首页>开发>正文

浅析hadoop设计理念和核心技术 大数据技术有哪些 核心技术是什么

2023-06-18 21:36:13 互联网 未知 开发

 浅析hadoop设计理念和核心技术 大数据技术有哪些 核心技术是什么

浅析hadoop设计理念和核心技术

hadoop狭义上指的是HDFS和MapReduce.HDFS就是hadoop分布式文件系统,是由多台计算机组成的集群上构件文件系统。MapReduce是把HDFS上的海量数据进行数据清洗,然后输出到HDFS上。 建议阅读Hadoop权威指南,一句话说不清楚,粘一段没意思。

大数据技术有哪些 核心技术是什么

这个只能说主流技术吧,不能说核心技术;现在国内很多公司大数据方面的主要使用时Hadoop生态圈内的技术,比如Hadoop、yarn、zookeeper、kafka、flume、spark 、hive、Hbase ,这些事使用比较多的,并不是说就只有这些技术,而且只是应用技术方便的,还有数据分析方向的等等。所以你这个问题首先就有问题,大数据是一个方向领域,就好比你问饮食是什么,饮食有哪些方面一样。

hadoop是数据库技术吗

Hadoop不是数据库技术。Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
  用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
  Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
  Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。

话题讨论:Storm, Spark, Hadoop三个大数据处理工具的区别和联系是什么



bg4.png 1、大数据核心是什么?
我觉得大数据的核心,首先是有其价值,如果数据量很大,而没有价值,那么大数据也就没什么特别了,所以大数据的最重要的就是我们能从大量数据中分析、挖掘出对组织有益的信息,当然了,到底有没有用,还得经过实际验证。

另外,就是速度得快,市场机会稍纵即逝,所以如果分析那么多数据,需要一个星期,或者一个月,那么可能意义也不大了。

2、Storm, Spark, Hadoop三个大数据处理工具谁将成为主流?
其实这些只是表面不同的工具而已,本质上的思想是一致,我相信未来还会有更多的工具涌现出来,但思想确很难有所变化,比如,你要想快,那么从计算机的体系结构来看,就得多内存,而少硬盘,因为硬盘太慢了。

另外,从处理问题的角度也是一样的,通过采用更多的资源,以分布式的方式,来同时处理那么的数据,速度也肯定会快,当然前提是,不同机器之间交互通信的成本,低于由此带来的益处。

3、你觉得今年大数据的发展趋势如何?
更快、更高、更强。

不过也需要更加规范,这些个东西,A工具、B工具、C工具,我感觉有点像一个玩具,还不是一个成熟的产品,所以以后,可能会专门的公司来做商业化的软件,更加成熟的软件

hadoop是什么?是操作系统么

Hadoop

更多图片(7张)
一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。

最新文章