利用清华 ChatGLM 做了基于本地知识的问答应用

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 626 天前的主题，其中的信息可能已经有所发展或是发生改变。

💡 利用 langchain + ChatGLM-6B 开发了可以基于本地文件内容进行对话的应用，具体形式类似 chatpdf 等利用 chatgpt API 与文件对话的应用。

✅ 实现过程中 embedding 与 LLM 模型均使用开源 HuggingFace 模型，因此可在下载模型参数文件后进行离线部署。

19 条回复 • 2023-06-14 16:22:00 +08:00

perfectar

2023-04-06 08:45:51 +08:00

不错，顶一个！

1r5b6rRCaViA78f6

2023-04-06 09:01:10 +08:00 via Android

感谢分享～

daddyLi

2023-04-06 09:03:00 +08:00

顶，已 star

hellojay

2023-04-06 09:06:31 +08:00

如果要本地跑起来这个 LLM ，大概需要的配置能说下吗

infinityv

2023-04-06 09:11:28 +08:00 via iPhone

是不是类似 gpt index

littlepanda0716

2023-04-06 09:38:13 +08:00

@infinityv 之前有考虑用 gpt index 做实现，但是后面发现 gpt index 不太灵活，就直接利用 langchain 做实现了，本质上类似于用 gpt index 做的应用。

littlepanda0716

2023-04-06 09:41:02 +08:00

@hellojay LLM 方面占用资源可以参考 ChatGLM 硬件需求： https://github.com/THUDM/ChatGLM-6B/blob/main/README.md#%E7%A1%AC%E4%BB%B6%E9%9C%80%E6%B1%82

embedding 模型在本项目中选用 GanymedeNil/text2vec-large-chinese ，在 GPU 上运行时约需要 3GB 显存，也可修改为 CPU 上运行或替换为其他 huggingface 中的 embedding 模型