内存调优
编辑教程内存调优
调整内存的使用以及Spark应用程序的垃圾回收行为已经在Spark优化指南中详细介绍。
在这一节,我们重点介绍几个强烈推荐的自定义选项,它们可以减少Spark Streaming应用程序垃圾回收的相关暂停,获得更稳定的批处理时间。
Default persistence level of DStreams | 和RDDs不同的是, 默认的持久化级别是序列化数据到内存中 (DStream是StorageLevel.MEMORY_ONLY_SER, RDD是StorageLevel.MEMORY_ONLY)。 即使保存数据为序列化形态会增加序列化/反序列化的开销, 但是可以明显的减少垃圾回收的暂停。 |
---|---|
Clearing persistent RDDs | 默认情况下,通过Spark内置策略(LUR), Spark Streaming生成的持久化RDD将会从内存中清理掉。 如果spark.cleaner.ttl已经设置了, 比这个时间存在更老的持久化RDD将会被定时的清理掉。 正如前面提到的那样,这个值需要根据Spark Streaming应用程序的操作小心设置。 然而,可以设置配置选项spark.streaming.unpersist为true 来更智能的去持久化(unpersist)RDD。 这个配置使系统找出那些不需要经常保有的RDD,然后去持久化它们。这可以减少Spark RDD的内存使用,也可能改善垃圾回收的行为。 |
Concurrent garbage collector | 使用并发的标记-清除垃圾回收可以进一步减少垃圾回收的暂停时间。 尽管并发的垃圾回收会减少系统的整体吞吐量,但是仍然推荐使用它以获得更稳定的批处理时间。 |
Mos固件,小电视必刷固件
ES6 教程
Vue.js 教程
JSON 教程
jQuery 教程
HTML 教程
HTML 5 教程
CSS 教程
CSS3 教程
JavaScript 教程
DHTML 教程
JSON在线格式化工具
JS在线运行
JSON解析格式化
jsfiddle中国国内版本
JS代码在线运行
PHP代码在线运行
Java代码在线运行
C语言代码在线运行
C++代码在线运行
Python代码在线运行
Go语言代码在线运行
C#代码在线运行
JSRUN闪电教程系统是国内最先开创的教程维护系统, 所有工程师都可以参与共同维护的闪电教程,让知识的积累变得统一完整、自成体系。
大家可以一起参与进共编,让零散的知识点帮助更多的人。
X
选择支付方式:
立即支付
¥
9.99
无法付款,请点击这里
金额: 0 元
备注:
转账时请填写正确的金额和备注信息,到账由人工处理,可能需要较长时间
备注:
转账时请填写正确的金额和备注信息,到账由人工处理,可能需要较长时间
如有疑问请联系QQ:565830900
正在生成二维码, 此过程可能需要15秒钟