zhmouV2 最近的时间轴更新
zhmouV2

zhmouV2

V2EX 第 580402 号会员,加入于 2022-05-08 11:19:45 +08:00
zhmouV2 最近回复了
\x1f 是控制字符,返回了 gz 文件 你后端是返回了压缩的数据吗
拿 llm 当解决手段疑似有点幽默了,属实是大炮打蚊子,感觉是不是对 1b 参数量模型有啥误解? stable diffusion v1.5 的参数量差不多也就这个数。如果这也算解决方案,我找 1000 个印度外包去人工识别好不好。。。

正经方法不外乎提取关键字做匹配或者依赖一个小的文本分类模型做检测,或者二者结合。就跟二维码定位差不多,要么依赖 cv 传统算法提取线段/点/矩形,要么搞个小的 mobilenet 去做 detection 。
问个题外话 python 各种打包工具有类似 treeshaking 的机制吗?感觉好像只要 import 就把所有 lib 引入进去了
1 天前
回复了 zhmouV2 创建的主题 分享发现 DeepSeek 发布了推理模型 R1-Lite-Preview
@cat9life #1 目前还不支持
@forisra 是不是把 MMA 和 WWE 搞混了……WWE 纯纯表演 MMA 起码真打
顺便看了下 ollama 上已经有各种量化版本了 https://ollama.com/library/qwen2.5-coder/tags
14b q2_k 应该是我本地 8G 显存能跑的极限了 有没有兄弟说说效果
Deepseek 确实深有同感 cursor 上用 ds 的 api 问题很严重
11 天前
回复了 WolverineL 创建的主题 程序员 safetensors 模型部署请教
@WolverineL #2 你找到的是画图的模型吗,3G 大小感觉是一个画图的模型,然后 130M 是对应的 Lora ?“Lora”不是某一种模型,而是对模型参数的微调方法,类似于一种“插件”,以画画为例,某个特定的“Lora”模型能够让原来的大模型本体画出之前不认识的角色/画风/概念之类的。建议先搜索一下模型的文件名,知道大概是哪个范围的才能有答案。
11 天前
回复了 WolverineL 创建的主题 程序员 safetensors 模型部署请教
safetensors 不包含模型本身的结构,只有模型参数,你得知道这个模型是啥样的。然后 safetensors 一般还是用 python 部署吧,就是安装一下 pytorch 之类的框架,最后用 gpt 写个示例代码就行。
12 天前
回复了 COW 创建的主题 问与答 国内有哪个 AI 能平替 chatgpt?
@PositionZero #9 DeepSeek 2.5 就是两者合并成一个模型了,api 访问接口还保留应该是出于兼容考虑,新版网页端也没有切换模型的选项了。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2931 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 08:17 · PVG 16:17 · LAX 00:17 · JFK 03:17
Developed with CodeLauncher
♥ Do have faith in what you're doing.