lede icon indicating copy to clipboard operation
lede copied to clipboard

延迟越来越高,至今不得不全面改用5.4.113版内核编译固件

Open mysolen opened this issue 2 years ago • 17 comments

自从5.4.113版以后的内核,凡是用在多人场景下的,比如餐饮、酒店等客户端比较多的场景下,随开机时间推移,从op去ping直连的上级光猫地址192.168.1.1和下级ap、打印机等地址,延迟总是越来越高,刚开机只有0.5ms左右,过一天变成1ms,两天后变成3ms,然后就越来越卡并且无法自行恢复,必需手动或远程重启,以致于不得不设置成每周1半夜甚至每天半夜自动重启一次以保证长期正常运行后不卡 前后一共有二十多台x86软路由,有D525到J1900等多种型号的CPU,intel和螃蟹卡等多种类型的网卡,其中凡是用到5.10或5.15版内核的均有此现象,甚至是5.4.243的也一样,经过长达一年多的时间仔细观察,只有5.4.113版本无论在什么场景,什么环境,拨号还是DHCP情形下都能长久正常运行,ping延迟也不会不断升高 一直等到现在,每次都期待最新版本的内核不会有此问题,但每次均以失望告终,不得不远程强制更换固件到两年前自行编译的一版5.4.113,看来这版固件有望成为养老固件了

mysolen avatar May 25 '23 09:05 mysolen

个别使用场景下无论什么版本内核均不会出现这种延迟越来越高的现象,但是只要曾经出现过这种现象的场景,不管换什么内核编译的必然都会有一样的情况出现,只到换成5.4.113才一切都安静了

mysolen avatar May 25 '23 09:05 mysolen

哈哈,可怜的孩子,我就从来都没用过 5.4内核以外的版本,我只用5.4内核,至于你说的这种没遇到,可能是我带动的东西不多

WYC-2020 avatar May 25 '23 09:05 WYC-2020

现在不能打游戏,否则延迟增加10ms,并且一分钟左右日志就会出现wan口停用又启用的信息,游戏断开。

wuzhuang123 avatar May 25 '23 09:05 wuzhuang123

哈哈,可怜的孩子,我就从来都没用过 5.4内核以外的版本,我只用5.4内核,至于你说的这种没遇到,可能是我带动的东西不多

我也曾经怀疑跟内核版本无关,但是特地一遍遍的检查,以确保新版内核编译的选项跟以前5.4.113的完全一致,不幸的是无论如何都没找到问题根源,实在是耽误太多时间了,最后还是只能强刷5.4.113了事。也曾经有段时间把注意力放在ksoftirqd软中断上面,但是同时又发现出现延迟不断增高问题的虽然ksoftirqd进程都同样会越来越频繁的出现在top进程列表前排,但是都并没有达到什么占用cpu100%的状况,最多也就1%-5%CPU占用,似乎跟这个ksoftirqd也没有必然的联系,并且无论关闭SFE,还有BBR,fullconnet,nlbw等等都一个个试过了,还是依旧,最终只能归结于内核版本了

mysolen avatar May 25 '23 10:05 mysolen

你可以这样测下,先把所有的什么都拉取最新的,然后再把内核覆盖回你认为没那个版本,如果最后没问题了,那就证明就是内核作怪。如果还有问题,那就有可能是不是其他什么包有问题

WYC-2020 avatar May 25 '23 10:05 WYC-2020

你可以这样测下,先把所有的什么都拉取最新的,然后再把内核覆盖回你认为没那个版本,如果最后没问题了,那就证明就是内核作怪。如果还有问题,那就有可能是不是其他什么包有问题

嗯,有时间我会再尝试一下,只是可惜5.4.113版内核已经被删除拉取不到了,现在还能下载到的最低版本是[kernel: bump 5.4 to 5.4.171,之前的好象都删除了,目前git下来默认的是5.4.243版本,已经亲自试过了一样存在延迟不断增高的现象

mysolen avatar May 25 '23 10:05 mysolen

主要是这样的测试相当花费时间精力,当场根本看不出来任何问题,首先必需等到有问题的场所半夜都没有人用网络了才能强制更换固件,更换以后也必需得等三天以上的时间再看结果,三天左右才能看到出毫秒级别的ping延迟是否有稳定的增加,比如从最初开机的0.5ms增长到了0.8ms或者1.2ms,间隔时间太短没法确认是否存在此问题

mysolen avatar May 25 '23 10:05 mysolen

对于两年前编译的5.4.113版本目前为止有最长不间断运行时间达到5个多月的,中间从未重启过仍然稳定运行,ping延迟稳定如初。其实这个问题算是满严重的了,不是什么某个插件能不能用的问题,而是只要存在这个问题OP几乎就没法用在正式环境了,不管是运行三天以后还是半个月以后,你都知道它铁定会崩,迟早整个局域网都会卡死,还怎么敢用,唯一能救救急的办法就是设置每天半夜自动重启一次,但是重启次数多了也难保哪天重启后就直接over了

mysolen avatar May 25 '23 10:05 mysolen

对于两年前编译的5.4.113版本目前为止有最长不间断运行时间达到5个多月的,中间从未重启过仍然稳定运行,ping延迟稳定如初。其实这个问题算是满严重的了,不是什么某个插件能不能用的问题,而是只要存在这个问题OP几乎就没法用在正式环境了,不管是运行三天以后还是半个月以后,你都知道它铁定会崩,迟早整个局域网都会卡死,还怎么敢用,唯一能救救急的办法就是设置每天半夜自动重启一次,但是重启次数多了也难保哪天重启后就直接over了

原来是这个原因,我也是这个情况,刚开机ping路由器稳定1ms,开几天甚至可高达10+ms。

zzy19868 avatar May 26 '23 09:05 zzy19868

对于两年前编译的5.4.113版本目前为止有最长不间断运行时间达到5个多月的,中间从未重启过仍然稳定运行,ping延迟稳定如初。其实这个问题算是满严重的了,不是什么某个插件能不能用的问题,而是只要存在这个问题OP几乎就没法用在正式环境了,不管是运行三天以后还是半个月以后,你都知道它铁定会崩,迟早整个局域网都会卡死,还怎么敢用,唯一能救救急的办法就是设置每天半夜自动重启一次,但是重启次数多了也难保哪天重启后就直接over了

出现和不出现的使用场景有啥不同?是相同的固件,在不同的使用场景下 会出现这种情况么?

WYC-2020 avatar May 26 '23 09:05 WYC-2020

还有一个情况需要考虑,你是物理机直装,还是使用了esxi或者pve之类的虚拟化软件;还有就是网卡驱动之类的是不是更新到最新版本了。。。

ricksuzade-maker avatar May 26 '23 09:05 ricksuzade-maker

x86软路由市面上 网卡就那两个玩意应该不是这个问题,可以试试官方固件 然后对比的时候都用同一个固件 这样更好比对出是哪里的问题

WYC-2020 avatar May 26 '23 09:05 WYC-2020

对于两年前编译的5.4.113版本目前为止有最长不间断运行时间达到5个多月的,中间从未重启过仍然稳定运行,ping延迟稳定如初。其实这个问题算是满严重的了,不是什么某个插件能不能用的问题,而是只要存在这个问题OP几乎就没法用在正式环境了,不管是运行三天以后还是半个月以后,你都知道它铁定会崩,迟早整个局域网都会卡死,还怎么敢用,唯一能救救急的办法就是设置每天半夜自动重启一次,但是重启次数多了也难保哪天重启后就直接over了

出现和不出现的使用场景有啥不同?是相同的固件,在不同的使用场景下 会出现这种情况么?

反正我的使用场景是一致的,物理直装,.config文件也基本没变过

zzy19868 avatar May 26 '23 09:05 zzy19868

你这样的问题,大概率是驱动,可以尝试格盘后在pe重新刷机,不要直接在op上上传固件刷机,有时可能有bug

lovexiaofan123 avatar May 27 '23 16:05 lovexiaofan123

我试试。运行几天后,再来回复。看看是不是有你这个问题。一般我几天编译一次新固件。等我。

baodp avatar May 28 '23 20:05 baodp

我试试。运行几天后,再回来复。看一看是不是有你这个问题。一般我几天编译一次新固件。等我。

运行第二天没问题出现问题啊

baodp avatar May 30 '23 04:05 baodp

我试试。运行几天后,再回来复。看一看是不是有你这个问题。一般我几天编译一次新固件。等我。

运行第二天没问题出现问题啊

这和实际使用的情况有关的,这种说我运行半年多还没这个问题呢哈哈

WYC-2020 avatar May 30 '23 04:05 WYC-2020