博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Erlang进程堆垃圾回收机制
阅读量:6633 次
发布时间:2019-06-25

本文共 2877 字,大约阅读时间需要 9 分钟。

原文:

作者:http://blog.csdn.net/mycwq

每一个Erlang进程创建之后都会有自己的PCB,栈,私有堆。erlang不知道他创建的进程会用到哪种场合下,所以一開始分配的内存比較小。假设分配的空间不够了,erlang gc会动态调整堆大小以满足需求,假设分配的空间大了,就会收缩堆,回收内存。

erlang进程堆的gc是分代gc。分代gc的想法基于统计学:大部分数据的生存周期都比較短,最新的数据更easy不再被使用。

这里erlang使用young heap 和old heap来区分数据。young heap放新数据,old heap放旧数据,也就是gc后存活的数据。

erlang进程堆gc有两个主要过程:浅扫描和深扫描

浅扫描(minor collection)

浅扫描是当young heap空间不足时,erlang会对young heap做一次扫描。把实用的数据拷贝到新申请的young heap空间。发现已经扫描过1次以上的数据放入old heap,然后删掉原来的young heap

在young heap中,erlang使用了高水位线来区分标记一次以上的数据和未标记的数据,那么young heap移入old heap的就是超过高水位线的数据

深扫描(major collection)

深扫描是一般当old heap空间不足时触发,erlang会对young heap和old heap做扫描,把实用的数据放入新申请的young heap,删掉原来的heap

深扫描的触发条件还有手动运行gc,和gc次数超过fullsweep_after的參数限定

控制垃圾回收

以游戏网关进程为例,网关进程通常有大量消息,而大部分消息都仅仅是在网关这里做转发,生命周期非常短,所以网关进程能够设定较大的初始内存,较快的内存回收。

spawn_opt(Fun, [{min_heap_size, 5000},{min_bin_vheap_size, 100000},{fullsweep_after, 500}])

先看下參数默认值:
1> erlang:system_info(min_heap_size).
{min_heap_size,233}
2> erlang:system_info(min_bin_vheap_size).
{min_bin_vheap_size,46368}
3> erlang:system_info(fullsweep_after).
{fullsweep_after,65535}

min_heap_size是进程最小堆大小

这个參数两个地方会用到,第一处是erlang初始化进程堆大小,第二处是gc后堆收缩后维持的最小值。min_bin_vheap_size是进程最小虚拟二进制堆大小。这两个參数都是以word为单位。初始化足够大的初始内存,能够降低轻度gc的次数。降低重复申请和回收内存的开销

fullsweep_after控制深扫描的频率

这个參数确定多少次gc后运行一次深度gc。默认值为65536,有点大了

所以。上面3个參数配合起来的意义就是。进程初始化分配足够大的内存,降低重复申请内存的开销。当申请的内存不够用。gc会又一次申请内存,累计达到500次就做一次gc

手动运行垃圾回收

上面提到了利用fullsweep_after来控制gc的情况,以下再介绍手动gc的情况:
在rabbitMQ看到这段代码,能够在项目中定期运行这个函数:
gc() ->
    [erlang:garbage_collect(P) || P <- erlang:processes(),
                           {status, waiting} == erlang:process_info(P, status)],
    erlang:garbage_collect(),
    ok.
当然,你还能够增加一些推断,比方指定占内存过50M的进程运行gc

erlang进程占用多少内存

用以下这种方法检查erlang进程占用的内存。你能够换别的參数再试试
Fun = fun()-> receive after infinity -> ok end end.
erlang:process_info(erlang:spawn(Fun), memory).
erlang垃圾回收的副作用

前面讲到erlang进程堆的gc是分代gc的,这个仅仅是全局层面的,在底层erlang还是走了标记清除的路子。标记清除这样的gc方式是定期运行的。首先gc不够及时。其次,在gc运行期间开销比較大。会引起中断。

只是每一个erlang进程的堆区域是独立的,gc能够独立进行,加上它内存区域比較小,还有erlang的变量是单次赋值,无需多次追踪,因此,erlang进程gc的延迟不会引起全局的中断

erlang文档
GC in Erlang works independently on each Erlang process, i.e. each Erlang process has its own heap, and that heap is GCed independently of other processes' heaps.
The current default GC is a "stop the world" generational mark-sweep collector. On Erlang systems running with multiple threads (the default on systems with more than one core), GC stops work on the Erlang process being GCed, but other Erlang processes on other OS threads within the same VM continue to run. The time the process spends stopped is normally short because the size of one process' heap is normally relatively small; much smaller than the combined size of all processes heaps.

结束语

这里讲了erlang进程堆的gc,另外erlang还有其它gc机制,比方,二进制共享堆和进程外堆碎片是引用计数gc,这里先不做讨论,有时间我会在下篇做讨论,有兴趣能够看了解一下。

參考:

http://blog.csdn.net/mycwq/article/details/26613275

http://www.cnblogs.com/me-sa/archive/2011/11/13/erlang0014.html

你可能感兴趣的文章
dropdownlist可以多选。类似的例子。。。
查看>>
Objective-C 内存管理
查看>>
Linux下rz,sz与ssh的配合使用
查看>>
pku 1054 The Troublesome Frog 暴力+剪枝
查看>>
串行,并行,并发
查看>>
linux NFS
查看>>
Jquery DataTable基本使用
查看>>
leetcode 674. Longest Continuous Increasing Subsequence
查看>>
Java中CAS详解
查看>>
Linux系统实战项目——sudo日志审计
查看>>
Android Application Task Activities的关系
查看>>
get app id
查看>>
[俗一下]世界500强公司的面试问题与答案提示 [转]
查看>>
使用 Excel Services ,结合 Analysis Services 在 SharePoint 中发布报表
查看>>
SQL Server数据导入导出技术概述与比较
查看>>
format的用法
查看>>
DHCPv6 server port and DHCPv6 client port
查看>>
BitmapFactory.Options避免 内存溢出 OutOfMemoryError的优化方法
查看>>
Python中通过Image的open之后,去show结果打不开bmp图片,无法正常显示图片
查看>>
DNGuard 免费的DotNet加密保护工具 V1.0
查看>>