欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

认识Spark

发布时间:2025/7/14 编程问答 52 豆豆
生活随笔 收集整理的这篇文章主要介绍了 认识Spark 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

2019独角兽企业重金招聘Python工程师标准>>>

Spark是什么?

Spark是一个用来实现快速而通用的集群计算平台。

一个大一统的软件栈:Spark核心是一个由多个计算任务组成的、运行在多个组合机器或者是一个计算的集群上的应用进行调度、分发以及监控的计算引擎。Spark具有速度快和通用的特点,使得各个组件可以无缝连接,节省项目时间。

Spark Code

实现了Spark的基本功能:任务调度,内存管理,错误恢复,存储系统交互等。

SparkSQL

可以支持HiveSQL和SQL等来查询数据,支持多种数据源。

Spark Streaming

Spark实时数据进行流式计算的组件。

MLlib

Spark机器学习的程序库。

集群管理器

Spark支持多种集群管理器,如自身的简易调度器,HadoopYarn,ApacheMesos等。

Spark存储层次

不仅可以将任何Hadoop上HDFS上读取文件,也支持Hadoop其他接口:本地文件,Hive,HBase等。

 

转载于:https://my.oschina.net/ilovetao/blog/873405

总结

以上是生活随笔为你收集整理的认识Spark的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。