V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
xvnehc
V2EX  ›  问与答

软路由 openwrt 的 CPU softirqs(软中断)总是异常高而且核心利用不均匀,怎么排查?

  •  
  •   xvnehc · 2022-06-23 19:24:50 +08:00 · 4592 次点击
    这是一个创建于 918 天前的主题,其中的信息可能已经有所发展或是发生改变。

    硬件:J4125 + 4 千兆 i211 网卡
    固件:openwrt esir 春季小包 5.4.190 内核直装
    关了所有服务,包括 clash 、去广告等来测试,

    只要跑一会(几个小时或者很快) qbittorrent 跑 PT 下载,
    CPU 就会有一个核心是满载,也就是占用 25%,其中几乎是软中断占了全部

    这个时候如果 speedtest 测速的话会卡到千兆带宽只能跑 1 、200Mbps ,
    因为 CPU 的四个核心会跟着满载 100%,而且都是 softirqs (软中断)占用很高。
    重启软路由之后会恢复,但用一段后就又到老样子,

    怎么确定是哪里的问题,硬件、固件、网络驱动或者是 PT 软件本身?

    图是刚重启以后稍微正常的状况 截屏 2022-06-23 18.56.43

    17 条回复    2023-09-18 20:54:27 +08:00
    ysc3839
        1
    ysc3839  
       2022-06-23 20:25:00 +08:00 via Android
    一般是 CPU 性能不足,网卡使劲向 CPU 发中断,当一个中断还没处理完下一个中断就到的时候,内核会把下一个中断加入队列,在当前中断处理完后触发一个软中断处理队列里面的。
    ysc3839
        2
    ysc3839  
       2022-06-23 20:28:30 +08:00 via Android
    但如果停止网络活动后还是占用的话,就是别的问题了,一般是网卡跑满速度且每个以太网帧都不大时会出现
    xvnehc
        3
    xvnehc  
    OP
       2022-06-23 20:30:06 +08:00
    @ysc3839 啊,J4125 性能跑个软路由挂 PT 不能说不够吧,我研究了一下说也可能是网卡驱动给到 CPU 的核心处理分配不均匀的问题?
    FabricPath
        4
    FabricPath  
       2022-06-23 20:43:56 +08:00
    iptables-save 检查 iptables 规则,你的这个场景,软中断消耗基本上只有 netfilter 。
    如果没啥异常,perf top 看看是在干啥,不知道 openwrt 有 perf 没
    Actrace
        5
    Actrace  
       2022-06-23 23:30:59 +08:00
    网卡支持多队列吗?
    Actrace
        6
    Actrace  
       2022-06-23 23:35:29 +08:00
    服务器网卡支持多队列还会 100%软中断的话,试试这个设置 RSP 的脚本,可以分散到各个 CPU 核心及线程。
    https://ttttt.link/f/62b487f73e135
    YongXMan
        7
    YongXMan  
       2022-06-23 23:53:31 +08:00 via Android
    我之前也遇到过类似问题,自己编了一个固件负载就降下来了,具体原因不明。
    chenyx9
        8
    chenyx9  
       2022-06-24 02:23:02 +08:00 via Android
    iqrbalance enable
    ashong
        9
    ashong  
       2022-06-24 02:50:06 +08:00 via iPhone
    估计是你 op 固件的问题,一直用 j1900 没问题
    i3x
        10
    i3x  
       2022-06-24 05:54:52 +08:00 via Android   ❤️ 1
    @ashong 他这就是负载问题。。。


    @Actrace 解决不了单核性能弱鸡的问题。卡单核后带宽就上不去了。


    @cnasing 所有的 jxxxx 恕我直言就是 atom 同级别的玩具。你上传有 500M 吗?没有的话 tr 又不是干不动。
    另外不建议用莫名其妙的三方 openwrt 。。。。谁知道有没有加料。。。修改的作者也不全是懂行的,有的人就是根本没有经验就是看着字面意思按照个人喜好看着瞎搞。。。给 openwrt 加上休眠的固件你敢信?内置某网站 ip 监测赚钱的你敢信?更不提给人跑 pcdn 的,跑游戏挂机出口的。。。。。
    kokutou
        11
    kokutou  
       2022-06-24 08:10:43 +08:00 via Android   ❤️ 1
    换官方 openwrt 。。。
    反正这种什么整合版,编译版,优化版,总是各种小毛病。。
    photon006
        12
    photon006  
       2022-06-24 18:45:48 +08:00
    换固件,我也经常遇到这问题
    chancat
        13
    chancat  
       2022-06-25 21:50:38 +08:00 via Android
    我家软路由换成硬路由了,qsdk 真香
    yuban10703
        14
    yuban10703  
       2022-06-25 22:04:31 +08:00
    关掉 fullcone-nat 试试
    kaze1018
        15
    kaze1018  
       2022-06-27 12:34:36 +08:00 via Android
    软路由是软中断不是很正常吗(🤪
    RheatiN
        16
    RheatiN  
       2023-09-10 21:40:05 +08:00
    解决了吗,我最近 PVE 不知道动了什么设置,无论是用哪个版本 openwrt ,只要开了 fullcone ,ksoftiqrd 就会异常的高,不开 fullcone ,心里又很难受
    galaxyskyknight2
        17
    galaxyskyknight2  
       2023-09-18 20:54:27 +08:00
    同问,这个问题困扰我三年了,换什么 U 都没用,只要重启用一段时间后,测速就是 high softirq,导致测速跑不满,cpu 负载也是均衡的,四个 cpu 每个都是 20%+, 解决办法就是重启,但好不了多久,特别是给 passwall apply 一下设置后,就特别容易出来这个问题。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1159 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 18:33 · PVG 02:33 · LAX 10:33 · JFK 13:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.