V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
x77
V2EX  ›  程序员

AIGC 多模态如何实现?

  •  
  •   x77 · 2023-06-28 21:09:34 +08:00 · 1638 次点击
    这是一个创建于 512 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如用户输入了一组字符串,我怎么判断他 User 是需要 AI 回复文本还是作图还有(未来可能支持)作曲或视频

    6 条回复    2023-06-29 12:45:43 +08:00
    raycool
        1
    raycool  
       2023-06-28 21:43:41 +08:00
    NLP 语义理解
    airyland
        2
    airyland  
       2023-06-28 22:23:42 +08:00
    调一次 ChatGPT 的 function call 解析成结构化数据
    x77
        3
    x77  
    OP
       2023-06-28 22:27:03 +08:00
    @airyland

    function_call: auto ,它返回的内容是怎么样的?
    conhost
        4
    conhost  
       2023-06-28 23:59:48 +08:00
    NLP 里面有意图识别,之前的任务机器人就是按照先进行意图识别,再进行槽位抽取。目前的大模型可能是反映成不同的 prompt
    x77
        5
    x77  
    OP
       2023-06-29 11:32:20 +08:00
    @conhost

    AWS 或者 Azure 有没有提供这种服务?或者推荐个 NLP 云服务?
    x77
        6
    x77  
    OP
       2023-06-29 12:45:43 +08:00
    看了下 OpenAI 的文档,function 可能可以实现,但是感觉很麻烦。让 gpt 模型调用我预置好函数,如果一段自然语言夹杂着作画指令,模型调用我的函数时它怎么给我传递参数?我又改如何从杂乱的信息里提取有效的参数。。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3901 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 05:20 · PVG 13:20 · LAX 21:20 · JFK 00:20
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.