momo2023
V2EX  ›  问与答

使用 deepseek v4 进行 vibe coding 的话,如何让它能识别图片?

  •  
  •   momo2023 · 1 day ago · 1268 views
    6 replies    2026-06-23 15:35:08 +08:00
    SethShi
        1
    SethShi  
       1 day ago
    等官方支持
    判断图片调用别的多模态信息塞入 deepseek
    ocr 给 deepseek
    EdwardKot
        2
    EdwardKot  
       1 day ago via iPhone
    我用 v2 网友做的 zocr 当 deepseek 的前置,文字类的可以搞一搞
    jackyli1
        3
    jackyli1  
       1 day ago
    SubAgent 吧,单独做一个图像识别的 agent ,识别后把信息给 deepseek
    Lin0936
        4
    Lin0936  
       1 day ago
    我用的 Pi ,装了个 vision proxy 插件把图像识别交给 Kimi 或 Qwen
    WashFreshFresh
        5
    WashFreshFresh  
       23h 39m ago
    等 4.1 吧 现在 api 还没推
    saySilence
        6
    saySilence  
       17h 24m ago
    写个 skill 直接调其他模型,要求低的话还是没什么的。文字很难表达图像信息,所以到 deepseek 手上已经是二手消息了。识个图、识别文字用用倒是没什么。反正后面要开放多模态了,deepseek 加油吧
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4297 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 00:59 · PVG 08:59 · LAX 17:59 · JFK 20:59
    ♥ Do have faith in what you're doing.