当前位置:首页>开发>正文

hadoop三大组件的作用

2023-06-25 03:24:08 互联网 未知 开发

hadoop三大组件的作用?

hadoop三大组件的作用

Hadoop的三大核心组件分别是:

1、HDFS(Hadoop Distribute File System):hadoop的数据存储工具。

2、YARN(Yet Another Resource Negotiator,另一种资源协调者):Hadoop 的资源管理器。

3、Hadoop MapReduce:分布式计算框架。

HDFS采用master/slave架构。一个HDFS集群是由一个Namenode和一定数目的Datanodes组成。Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问。集群中的Datanode一般是一个节点一个,负责管理它所在节点上的存储。

Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。通过YARN,不同计算框架可以共享同一个HDFS集群上的数据,享受整体的资源调度。

Hadoop的MapReduce是对google三大论文的MapReduce的开源实现,实际上是一种编程模型,是一个分布式的计算框架,用于处理海量数据的运算。

最新文章