lanzhipian 发表于 2021-1-21 16:59:12

内存泄漏

1046A的内存不断增长,最后会死机。请问该如何释放slab的内存??实际进程使用的内存只有500M左右。
root@localhost:~# ps aux|awk '{sum+=$6} END {print sum/1024}'
<font color="#ff0000">518.082</font>
slab占用了很大内存,且是SUnreclaim占用。用slabtop可以看到,里面有一个kmalloc-2048和kmalloc-256暂用了极大的内存。





djh 发表于 2021-1-22 16:48:05

您用的是哪个底板啊?

lanzhipian 发表于 2021-1-22 17:04:10

底板是FCU2302,CPU是LS 1046A
root@localhost:~# uname -a
Linux localhost 4.14.47 #1 SMP PREEMPT Sat Jun 6 09:47:56 CST 2020 aarch64 aarch64 aarch64 GNU/Linux

djh 发表于 2021-1-25 08:58:38

lanzhipian 发表于 2021-1-22 17:04
底板是FCU2302,CPU是LS 1046A
root@localhost:~# uname -a
Linux localhost 4.14.47 #1 SMP PREEMPT Sat ...

该路径/etc/netplan/50-cloud-init.yaml的网桥配置文件占用内存比较多,前提是您不需要网桥的功能了,可以将其删去,sync保存

lanzhipian 发表于 2021-1-25 13:50:49

您如何定位到问题是/etc/netplan/50-cloud-init.yaml这个文件呢?
请问还有其它方式可以解决这个问题吗?我需要使用网桥。

djh 发表于 2021-1-25 14:53:40

lanzhipian 发表于 2021-1-25 13:50
您如何定位到问题是/etc/netplan/50-cloud-init.yaml这个文件呢?
请问还有其它方式可以解决这个问题吗? ...

附件中有我们配置好的,将该压缩包解压到/etc/systemd/network下面,然后把文件读写权限全都赋值成644;再把netplan的配置文件/etc//etc/netplan/50-cloud-init.yaml删掉

lanzhipian 发表于 2021-1-25 17:47:15

换了这种方式配置后,内存泄漏问题仍然存在。
root@localhost:/dev# cat /proc/meminfo
MemTotal:      1917860 kB
MemFree:         1051824 kB
MemAvailable:    1429712 kB
Buffers:         27504 kB
Cached:         370572 kB
SwapCached:            0 kB
Active:         333728 kB
Inactive:         285372 kB
Active(anon):   188228 kB
Inactive(anon):   7144 kB
Active(file):   145500 kB
Inactive(file):   278228 kB
Unevictable:         0 kB
Mlocked:               0 kB
SwapTotal:             0 kB
SwapFree:            0 kB
Dirty:                40 kB
Writeback:             0 kB
AnonPages:      218372 kB
Mapped:         145200 kB
Shmem:            7832 kB
Slab:             210184 kB
SReclaimable:      32220 kB
SUnreclaim:       177964 kB
KernelStack:      3600 kB
PageTables:         4132 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:      958928 kB
Committed_AS:    1145268 kB
VmallocTotal:   135290290112 kB
VmallocUsed:         0 kB
VmallocChunk:          0 kB
AnonHugePages:   45056 kB
ShmemHugePages:      0 kB
ShmemPmdMapped:      0 kB
CmaTotal:          16384 kB
CmaFree:         14212 kB
HugePages_Total:       0
HugePages_Free:      0
HugePages_Rsvd:      0
HugePages_Surp:      0
Hugepagesize:       2048 kB

lanzhipian 发表于 2021-1-26 16:21:09

我配了两个网桥,br1和br0,br0用了fm1-mac4,fm1-mac5,fm1-mac1,fm1-mac2和fm1-mac9;br1用了fm1-mac3,fm1-mac6和fm1-mac10;现在内存依然会增加,怀疑是内核有bug。

djh 发表于 2021-1-27 10:31:46

lanzhipian 发表于 2021-1-26 16:21
我配了两个网桥,br1和br0,br0用了fm1-mac4,fm1-mac5,fm1-mac1,fm1-mac2和fm1-mac9;br1用了fm1-mac3, ...

您配置完以后,长期运行的话内存占用最大增加到多少?
配置前后内存的对比有详细的数据吗?
2302没有网口fm1-mac10

lanzhipian 发表于 2021-1-27 13:56:20

本帖最后由 lanzhipian 于 2021-1-27 14:00 编辑

用户手册上给的fm1-mac10对应NET6网口。
板子内存会一直增加,9小时左右会降到50M左右,之后就宕机了。
开机时的内存情况:
root@localhost:~# cat /proc/meminfo
MemTotal:      1917860 kB
MemFree:         1199176 kB
MemAvailable:    1602564 kB
Buffers:         24516 kB
Cached:         404784 kB
SwapCached:            0 kB
Active:         252140 kB
Inactive:         364732 kB
Active(anon):   159008 kB
Inactive(anon):   7124 kB
Active(file):      93132 kB
Inactive(file):   357608 kB
Unevictable:         0 kB
Mlocked:               0 kB
SwapTotal:             0 kB
SwapFree:            0 kB
Dirty:               208 kB
Writeback:          1652 kB
AnonPages:      187604 kB
Mapped:         144644 kB
Shmem:            7812 kB
Slab:            69328 kB
SReclaimable:      29196 kB
SUnreclaim:      40132 kB
KernelStack:      3600 kB
PageTables:         3912 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:      958928 kB
Committed_AS:    1097500 kB
VmallocTotal:   135290290112 kB
VmallocUsed:         0 kB
VmallocChunk:          0 kB
AnonHugePages:   18432 kB
ShmemHugePages:      0 kB
ShmemPmdMapped:      0 kB
CmaTotal:          16384 kB
CmaFree:         14212 kB
HugePages_Total:       0
HugePages_Free:      0
HugePages_Rsvd:      0
HugePages_Surp:      0
Hugepagesize:       2048 kB

lanzhipian 发表于 2021-1-27 13:58:55

三小时左右后的情况
root@localhost:~# date
Wed Jan 27 13:46:00 CST 2021
root@localhost:~# cat /proc/meminfo
MemTotal:      1917860 kB
MemFree:          377468 kB
MemAvailable:   899700 kB
Buffers:         40200 kB
Cached:         505560 kB
SwapCached:            0 kB
Active:         418512 kB
Inactive:         348480 kB
Active(anon):   192180 kB
Inactive(anon):   6676 kB
Active(file):   226332 kB
Inactive(file):   341804 kB
Unevictable:         0 kB
Mlocked:               0 kB
SwapTotal:             0 kB
SwapFree:            0 kB
Dirty:               4 kB
Writeback:             0 kB
AnonPages:      217080 kB
Mapped:         145172 kB
Shmem:            7880 kB
Slab:             721924 kB
SReclaimable:      32092 kB
SUnreclaim:       689832 kB
KernelStack:      3616 kB
PageTables:         4072 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:      958928 kB
Committed_AS:    1180240 kB
VmallocTotal:   135290290112 kB
VmallocUsed:         0 kB
VmallocChunk:          0 kB
AnonHugePages:   40960 kB
ShmemHugePages:      0 kB
ShmemPmdMapped:      0 kB
CmaTotal:          16384 kB
CmaFree:         14200 kB
HugePages_Total:       0
HugePages_Free:      0
HugePages_Rsvd:      0
HugePages_Surp:      0
Hugepagesize:       2048 kB

djh 发表于 2021-1-28 10:37:45

lanzhipian 发表于 2021-1-27 13:58
三小时左右后的情况
root@localhost:~# date
Wed Jan 27 13:46:00 CST 2021


建议您将netplan删掉之后其他都不要修改,先不配置网桥,看看是什么地方引入的这个问题,
我们目前只知道netplan会导致这个问题。

djh 发表于 2021-1-28 10:45:53

lanzhipian 发表于 2021-1-27 13:56
用户手册上给的fm1-mac10对应NET6网口。
板子内存会一直增加,9小时左右会降到50M左右,之后就宕机了。

您能发一下您的从启机开始到宕机的整个log吗?看一下打印信息
方便的话您整成文档最好,谢谢。

lanzhipian 发表于 2021-1-28 14:14:17

djh 发表于 2021-1-28 10:45
您能发一下您的从启机开始到宕机的整个log吗?看一下打印信息
方便的话您整成文档最好,谢谢。

为了解决这个内存泄漏问题,我在crontab定义了定时重启任务,昨晚2:05重启后运行到现在的情况。/var/log文件下有netserver.debug。
附件中是一些系统日志。

djh 发表于 2021-1-28 16:13:41

lanzhipian 发表于 2021-1-28 14:14
为了解决这个内存泄漏问题,我在crontab定义了定时重启任务,昨晚2:05重启后运行到现在的情况。/var/log ...

建议您做网桥的时候不要把SFP+加进去,我们研发工程师发现将SFP加到网桥里面就会有这个问题
页: [1]
查看完整版本: 内存泄漏