当前位置:首页>开发>正文

如何从Hadoop安全模式中进入正常模式 hadoop和spark的区别

2023-04-12 23:28:37 互联网 未知 开发

 如何从Hadoop安全模式中进入正常模式 hadoop和spark的区别

如何从Hadoop安全模式中进入正常模式

开始的时候会有安全模式,当分布式文件系统处于安全模式的情况下,文件系统中的内容不允许修改也不允许删除,直到安全模式结束。安全模式主要是为了系统启动的时候检查各个datanode上数据块的有效性,同时根据策略必要的复制或者删除部分数据块。

hadoop和spark的区别

Hadoop和Spark的联系和区别
计算数据存储位置
Hadoop:硬盘
Spark:内存
计算模型
Hadoop:单一
Spark:丰富
处理方式
Hadoop:非迭代
Spark:迭代
场景要求
Hadoop:离线批处理。(面对SQL交互式查询、实时处理及机器学习等需要和第三方框架结合。多种数据格式转换,导致消耗大量资源)
Spark:批处理、实时处理

hadoop 什么是流式数据访问

流式数据,特点就是,像流水一样,不是一次过来而是一点一点“流”过来。而你处理流式数据也是一点一点处理。如果是全部收到数据以后再处理,那么延迟会很大,而且在很多场合会消耗大量内存。

流式数据被封装成了byte流(其实也是二进制的)