使用 deepseek v4 进行 vibe coding 的话，如何让它能识别图片？

6 replies • 2026-06-23 15:35:08 +08:00

1

SethShi

1 day ago

等官方支持
判断图片调用别的多模态信息塞入 deepseek
ocr 给 deepseek

2

EdwardKot

1 day ago via iPhone

我用 v2 网友做的 zocr 当 deepseek 的前置，文字类的可以搞一搞

3

jackyli1

1 day ago

SubAgent 吧，单独做一个图像识别的 agent ，识别后把信息给 deepseek

4

Lin0936

1 day ago

我用的 Pi ，装了个 vision proxy 插件把图像识别交给 Kimi 或 Qwen

5

WashFreshFresh

23h 39m ago

等 4.1 吧现在 api 还没推

6

saySilence

17h 24m ago

写个 skill 直接调其他模型，要求低的话还是没什么的。文字很难表达图像信息，所以到 deepseek 手上已经是二手消息了。识个图、识别文字用用倒是没什么。反正后面要开放多模态了，deepseek 加油吧