V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
cn2024
V2EX  ›  程序员

请教直播数字人方面的问题

  •  
  •   cn2024 · 2023-12-13 12:13:35 +08:00 · 2013 次点击
    这是一个创建于 379 天前的主题,其中的信息可能已经有所发展或是发生改变。

    很好的朋友最近想开发一套直播数字人。我也看了一下市面上现成的,功能上基本大同小异。 因为我从没接过这方面的需求,没这方面项目经验。也找了一点资料,只了解了一点皮毛,整体比较模糊,还没有一个较清晰的开发思路。 预算不高,不可能做像某飞某度那种大厂方案自己做训练学习。自己做训练学习太烧钱,这块不太现实,所以大体方向还是用开源框架,调用各 api 做整合(具体哪些平台和接口比较好用的可以推荐一下,gpt4 就不用提了),其余的用户基础部分自己写。 使用自己的视频,克隆自己的形象这块还不太清楚。最终实现能使用用户自己形象和动作以及语音,减少用户在系统上复杂性操作,轻松简便用到做直播上。 希望各位有经验的吴彦祖,各位大佬能指点一二,少走点弯路。感谢

    8 条回复    2023-12-13 22:00:42 +08:00
    qz357
        1
    qz357  
       2023-12-13 12:40:50 +08:00
    本人程序员转行做直播,目前单干,目前数字人还不能代替真正的直播,除非是玩平播+矩阵。前提是你的品要好。而且可以做到直播数字人讲话是有人的感觉的。直播就是人货场。数字技术最多也就给你太过渲染的背景作为场景,但消费者知道的,觉得假就不会停留太久,除非你的品单价低。或者你想做娱乐主播?娱乐主播你要看看现在真人假扮 npc 的主播有多火才行,消费者肯停留是因为真人的表演。
    sdenvi
        2
    sdenvi  
       2023-12-13 15:53:25 +08:00
    插个眼,等待有经验的彦祖回复,有方案了麻烦 OP 踢一脚,对这块挺感兴趣的
    flyqie
        3
    flyqie  
       2023-12-13 16:52:57 +08:00
    好奇楼主目前做的数字人是怎样的?

    是类似海马云那种需要人的还是完全不需要人的?
    bianYuX
        4
    bianYuX  
       2023-12-13 16:59:35 +08:00
    插个眼,对这种普通程序员也能用的 ai 比较感兴趣
    cn2024
        5
    cn2024  
    OP
       2023-12-13 17:15:53 +08:00
    @qz357 感谢兄的建议,我不是自己用,所以暂时没考虑运营方面的事。做出来后和市场需求也是有关联的,朋友也不希望连开发成本都收不回来。
    cn2024
        6
    cn2024  
    OP
       2023-12-13 17:19:39 +08:00
    @flyqie 市面上的基本一样,无人,不过自己做通用的人物,涉及到肖像这块,好像成本也高。最终还是以支持渲染用户自己的形象为主,现在的方案好像都是用户在本地渲染,详细的资料我也还一知半解。
    cn2024
        7
    cn2024  
    OP
       2023-12-13 17:28:57 +08:00
    忘了说了,如果有这块经验的大佬,可以绿泡泡 MzI4MTk1NjI1 私我找个时间详细请教一下。会意思一下。
    ixdeal
        8
    ixdeal  
       2023-12-13 22:00:42 +08:00
    @qz357 #1 我赞成,目前的技术做不到看上去真人的感觉,那个恐怖谷曲线目前还没有突破,由于技术实现太容易和同质化,平台很容易用算法阻碍不给你流量,前途极不看好。

    人是有情感的生物,底子上就接受有缺陷的感情,天生不太喜欢过于机械的东西,极其方案死板,一成不变甚至不犯错的事物,过去几百几千年各种宗教哲学基本已经定义了这事。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1022 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 21:32 · PVG 05:32 · LAX 13:32 · JFK 16:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.