V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。

如果没有发送到 /go/in,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
zx900930
V2EX  ›  NAS

Alder Lake iGPU 硬解不稳定, 过一段时间就崩溃

  •  2
     
  •   zx900930 · 2022-10-11 19:24:09 +08:00 · 2502 次点击
    这是一个创建于 785 天前的主题,其中的信息可能已经有所发展或是发生改变。
    RT, 试过 jellyfin 和 plex, 都是同样问题

    CPU i5-12400

    proxmox 内核 5.19 pve 屏蔽 i915 并直通 UHD730 给 vm

    vm 内核 5.19 debian
    i915 驱动是最新的 git 版本
    https://git.kernel.org/pub/scm/linux/kernel/git/firmware/linux-
    firmware.git/tree/i915/

    症状:
    plex 第一次 QSV 解码正常, 第二次就崩溃, 有时甚至导致整个 vm 一起崩溃.

    jellyfin 就是随机发生, 但是最多转码不到 2 小时左右就一定会崩溃, 有时也会导致整个 vm 崩溃.

    重启 vm 后会恢复正常一段时间, 然后循环以上问题.

    dmesg 的 log 里充斥着大量的 GPU HANG 错误
    [14744.308200] i915 0000:01:00.0: [drm] GPU HANG: ecode 12:1:6c857647
    [14744.308226] i915 0000:01:00.0: [drm] GPU HANG: ecode 12:1:2bbd900d
    [14744.310261] i915 0000:01:00.0: [drm] Resetting rcs0 for CS error
    [14744.312004] i915 0000:01:00.0: [drm] Resetting rcs0 for CS error
    [14746.852832] i915 0000:01:00.0: [drm] GPU HANG: ecode 12:0:00000000
    [14746.852853] i915 0000:01:00.0: [drm] Resetting rcs0 for stopped heartbeat on rcs0
    [14747.934811] i915 0000:01:00.0: [drm] GPU HANG: ecode 12:1:6c857647
    [14747.934836] i915 0000:01:00.0: [drm] GPU HANG: ecode 12:1:2bbd900d
    [14747.936869] i915 0000:01:00.0: [drm] Resetting rcs0 for CS error
    [14747.938664] i915 0000:01:00.0: [drm] Resetting rcs0 for CS error

    看到这个贴子
    https://www.reddit.com/r/PleX/comments/whpgv6/what_is_the_current_state_of_intel_alder_lake/
    发现 plex 的问题出在 Intel Compute Runtime 的版本上, 只能等官方适配.

    jellyfin 就算装了最新的 runtime 配合最新的内核版本和驱动, 还是会有崩溃的问题, 虽然坚持的时间比 plex 久一些. 说明 intel 的 linux 上游驱动还是没写好...
    而且大小核调度之类的新特性可能到内核版本 6.xx 才会优化到位, 至少等一年.

    总结:
    截至 2022 年 10 月 11 日 要组 nas 的朋友要么买不带核显的 12gen 配个解码显卡.要么还是买 10 代 iGPU.
    第 1 条附言  ·  2022-10-23 23:17:32 +08:00
    把 vm 的 host 系统从 debian bullseye 升级到了 sid
    linux 内核版本从 5.19->6.0.0-2
    连续测试了好几个小时, 看上去硬解正常了
    10 条回复    2022-12-01 01:14:11 +08:00
    f165af34d4830eeb
        1
    f165af34d4830eeb  
       2022-10-11 22:03:03 +08:00
    windows 下 qsv 转码可用么?要不然先用 windows 过渡一下?
    zx900930
        2
    zx900930  
    OP
       2022-10-12 00:14:22 +08:00
    @f165af34d4830eeb windows 看评论情况好一些, 要根据自己的硬件配置找一个不崩溃的特定版本驱动, 因为最新的崩, 旧版本也崩...
    只是要关掉 windows 更新避免自动更新到崩溃的版本.
    Eytoyes
        3
    Eytoyes  
       2022-10-12 09:15:47 +08:00
    之前就试过了,然后把 12400 出了。。。
    chenjiangui998
        4
    chenjiangui998  
       2022-10-12 10:05:02 +08:00
    xe 有这个问题吗, 还是仅限 UHD730
    zx900930
        5
    zx900930  
    OP
       2022-10-12 13:28:25 +08:00
    @chenjiangui998 移动端和桌面端不一样, 12 代移动端还需要 guc huc 那些电源管理驱动, 不然 lowpower encode decode 那些功能启用的时候会出错.
    至于稳定性, 我手上没有, 没法测试.
    f165af34d4830eeb
        7
    f165af34d4830eeb  
       2022-10-24 13:53:25 +08:00
    我的 i7 9700 home server 炸鸡了,现在面临和你一样的问题,想换新 U 但是 plex 不支持新核显的转码。。
    zx900930
        8
    zx900930  
    OP
       2022-10-24 15:22:29 +08:00 via Android
    @f165af34d4830eeb 我试过了,需要 6.0 以上的内核并集成了最新的 intel compute runtime (这个需要最新的 libc6 等依赖,很多稳定版的 linux 发行版都版本过低) 和 最新的 i915 驱动才能比较完整的支持大小核调度和新核显。
    目前就算是最新的 debian 和 ubuntu 稳定版都不行,得用 sid 或者 unstable 。
    f165af34d4830eeb
        9
    f165af34d4830eeb  
       2022-10-24 15:40:56 +08:00
    @zx900930 #8 谢谢老哥指点,我先看看能不能救一下我的服务器吧,新硬件不兼容确实头疼。
    NoahsArk
        10
    NoahsArk  
       2022-12-01 01:14:11 +08:00 via iPhone
    帮了大忙了 谢谢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1134 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 18:50 · PVG 02:50 · LAX 10:50 · JFK 13:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.