当前位置:首页>开发>正文

spark是hadoop结构中的重要一员

2023-12-26 01:57:07 互联网 未知 开发

spark是hadoop结构中的重要一员?

spark是hadoop结构中的重要一员

Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合,如pageRank、K-Means等算法就非常适合内存迭代计算。 Spark整个生态体系正逐渐完善中,GraphX 、 SparkSQL、 SparkStreaming 、 MLlib,等到Spark有了自己的数据仓库后,那就完全能与Hadoop生态体系相媲美。