分类:Spark

Livy 安装和使用

Livy 是一个基于 Spark 的开源 REST 服务,能够通过 REST 的方式将代码片段或是序列化的二进 […]

SparkSQL 性能调优

通用调优策略 对一些 SparkSQL 任务,可以通过缓存数据、调优参数、增加并行度提升性能。 缓存数据 sq […]

Spark 存储管理

Spark 批量计算任务一般从外部存储系统读取输入数据(如 HDFS 或 HBase),Spark 会优先选择 […]