V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dai269619118
V2EX  ›  程序员

为什么 ai 生成的图片 手指总会有问题

  •  
  •   dai269619118 · 85 天前 · 2839 次点击
    这是一个创建于 85 天前的主题,其中的信息可能已经有所发展或是发生改变。
    用 midjourney 生成图片的时候

    人物的手指的数量 4 5 6 个都会有

    出现问题的概率还挺大的

    为什么手指的数量上还处理不好?

    整体图片生成的都还挺好的,手指上总有瑕疵

    用的是 6.1 的模型

    有做着相关的大佬来说说吗 具体是怎么样的一个难点。
    13 条回复    2024-09-07 16:10:11 +08:00
    rekulas
        1
    rekulas  
       85 天前
    这个网上不是很多分析了么,根本原因就是 ai 在缺乏对基础知识(投影、形体、物理、空间关系、力学等)的真正理解,而手虽然看起来简单,实际是一个比较复杂的结构,不同手势、角度带来的变化太大了,以目前 ai 的训练量还很难较为完美绘制

    mj 在手部上不算特别出色,现在有一些针对手部的增强模型,可以 mj 画了主图之后用增强模型修复手部,可以上 civitai 搜搜

    另外我觉得这也只是暂时的,大力出奇迹,ai 还在不断迭代,只要训练数据够多别说手千手观音都 so easy
    dai269619118
        2
    dai269619118  
    OP
       85 天前
    @rekulas 兄弟我知道手势很难 我上面的问题是 手指生成数量的问题
    coderluan
        3
    coderluan  
       85 天前
    试试最新的 Flux ,参数多了效果就好很多了,手这块比 midjourney 强很多。
    rekulas
        4
    rekulas  
       85 天前
    一样的道理啊,因为手势的复杂性,喂给 ai 的图可能只有 3 根手指 可能 5 根,就像你训练 ai 看了 1 亿颗树,它肯定能画出让你满意的树,但绝对没法稳定画出树叶数量刚好==平均树叶数量的树
    你问的是原因,你若要问解决方案,没什么好的办法,只有尝试下新的模型,sd3 和手部增强版
    cmdOptionKana
        5
    cmdOptionKana  
       85 天前
    flux 在这方面有明显改善,偶尔画错,但正确率已经很高,已经不能说 AI 画不好手了。
    kaneg
        6
    kaneg  
       85 天前 via iPhone
    其实画过画的应该知道,画手是比较难的
    freshgoose
        7
    freshgoose  
       85 天前
    flux 在这方面的改善还是很大的,这里有个免费版可以测试一下 https://fluxai.dev/zh/playground
    linch97
        8
    linch97  
       85 天前
    AI 学的是统计规律,并没有逻辑。而且每个特征分辨率越低,越容易出错,你画几张手占主体的就会发现出错概率低了。加上手本来结构就很复杂,经常还有遮挡关系,都是目前 AI 绘图原理无法解决的。
    flankechen
        9
    flankechen  
       85 天前
    1.人画画,手也是最难画的之一。
    2.现在的 ai 画画本质上都是扩散模型从纯噪声一步步去噪而已,物理,结构,投影一毛线关系没有,细致的结构,提示词对齐,一致性还有很多可以进步的。
    3.LS 说了,统计规律而已,目前数据细致程度和参数量没能到那个量级。不过一开始的时候,脚的数量有时候都会不对啊,现在的 fulx 好多了。
    pkoukk
        10
    pkoukk  
       85 天前
    我猜,是大家给图片打标签喂给 AI 的时候,并没有标注这图上有几根手指吧...
    所以 AI 也并不清楚,这时候应该有几根
    sentinelK
        11
    sentinelK  
       85 天前
    因为画图 AI 的实现逻辑,是从一个低分辨率图,利用统计学原理作为概率基础,逐步细化去噪的过程。

    因为是统计学原理,所以 AI 对于什么是“手”,以及“手”的物理概念一无所知。他只是知道绝大多数的画,在这个地方,会画成这样而已。

    手部在绘画中占用的资源(像素点)并不多,同时手部因为灵活,所以遮挡、姿势多样。相对脸部,躯干而言,属于信息量小,但变化大的部位。这也就导致其统计学“局部最优解”比较多,而且没有明显的全局最优。

    这就会导致手部的绘画容易出现错误。
    cocomanber
        12
    cocomanber  
       84 天前
    这个手的数量的确是个问题哈哈哈,mj 都出现过鸡爪。。。离谱
    leegradyllljjjj
        13
    leegradyllljjjj  
       84 天前
    真以为是外星智能啦,ai 后台跑的都是统计学模型,现阶段所有 ai 模型都是基于概率论的,现在的大模型是语言模型,加减乘除都能算错
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1101 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 23:42 · PVG 07:42 · LAX 15:42 · JFK 18:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.