V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  marquina  ›  全部回复第 1 页 / 共 23 页
回复总数  444
1  2  3  4  5  6  7  8  9  10 ... 23  
平均每天 1-2 小时的阅读时间?
4 天前
回复了 klo424 创建的主题 Local LLM 求 DeepSeekR1 性价比硬件推荐
@terrysnake #46 笑死,非常真实
4 天前
回复了 klo424 创建的主题 Local LLM 求 DeepSeekR1 性价比硬件推荐
@klo424 #4 “查了一下 ktransformers 是框架?我需要硬件推荐。”
deepseek 和常规 llm 在架构上有较大差别(非常稀疏),而 llm 对硬件的要求相比常规应用又有较大区别。所以部署 deepseek 有多种推理方案:纯 CPU 、CPU/GPU 混合( ktransformers )、纯 GPU ,每种方案的硬件配置有很大差别。
但 OP 这种问法的话,我建议老老实实调 API 得了
16 天前
回复了 sumarker 创建的主题 北京 终于下定决心要结束北漂生活了
@chuugoku #112 公司操作就行,自己不用管
17 天前
回复了 sumarker 创建的主题 北京 终于下定决心要结束北漂生活了
@chuugoku #110 离职后公司会办理停缴手续,然后账户就是封存状态了
@marquina #9 说得不够准确,我举个例子。
现有的数据库,存放的都是结构化的数据,比如{"name": "xxx", "age": 25},而大模型的输出是人类对齐的自然语言,将这种结构化的数据作为大模型的训练语,就会极大干扰大模型的输出:比如日常聊天场景突然给你蹦出来半段 json 。

当然你也可以说,将所有的数据都按照非结构化的自然语言处理,直接扔给大模型。如果是这样的话,就算不考虑大模型的幻觉问题,光自然语言和结构化数据之间的信息差就足够头疼了。
你把数据作为大模型的训练预料,只会模型的输出风格越来越接近数据。
而且你不可能生产一条数据就训练一次模型,总是要攒一批数据再训练。而这攒出来的数据放哪呢?还是得用数据库。有点脱裤子放屁的感觉了。
23 天前
回复了 sumarker 创建的主题 北京 终于下定决心要结束北漂生活了
@carpeDiemJll #92
@sumarker #76
公积金条款是:“北京住房公积金缴存人如为非本市户籍人员,与单位解除劳动关系后,住房公积金个人账户封存满半年且未在异地继续缴存,可申请销户提取住房公积金。”
我自己的操作时间线是:
1. 离职,北京公积金账户封存
2. 上海入职,在上海缴纳开始缴纳公积金
3. 上海离职,上海公积金账户封存
4. 北京公积金账户封存满 6 个月,进行了全额提取操作
23 天前
回复了 sumarker 创建的主题 北京 终于下定决心要结束北漂生活了
我之前也从北京跑路了。
关于思考过程: https://www.v2ex.com/t/916075
关于跨城搬家: https://www.v2ex.com/t/934738
关于五险一金:
- 医保个人账户可以转移。比如从北京换到 B 地工作,可以在 B 地申请将北京的医保个人账户余额合并到 B 地的余额。
- 北京公积金账户封存 6 个月后,可以申请全额提取,但前提是**申请时**在全国其它地方没有正在缴存的公积金账户,否则只能考虑转移了。
我很好奇,只贴出了 gemini 的测试结果,是怎么得出“Gemini 大概是所有 LLM 里最能张口就来的”这个结论的?意思是其它的 llm 都能很好的回答这个问题?
2023 年个税报告显示,全国年薪百万的只有 70w 人,可以说是人群中的金字塔尖了。男方在塔尖里,女方快要到塔尖了,这种情况能有多少呢
看了半天没懂 pc 是啥
我之前也做了软路由,后面考虑到网络稳定性还是换成传统光猫拨号+旁路由了。折腾是一方面,日常使用还是稳定为主。
- 国内访问速度快
- 可留言
- 不懂代码
- 定制功能(回答问题后进入相册)
- 成本低(钱多的话当这点不存在)

属于是要求拉满了
58 天前
回复了 DBQ 创建的主题 程序员 听李开复说,今年是大模型公司的淘汰赛
@DBQ #5
@pike0002 #6

补充一些 context 。零一万物还活着,主要做 ai 产品化;预训练基本不做了(最多之后做小体量的模型),预训练的人(算法/infra )很可能加入阿里。
63 天前
回复了 tool2dx 创建的主题 然而并没有 openssh 协议貌似已经一统天下了。
下次心情不好的时候可以点进本贴看看 hh
63 天前
回复了 nlzy 创建的主题 Local LLM 三千预算本地 70b 大模型
“高性价比”的背后就是折腾+不一定好用,太真实了
1  2  3  4  5  6  7  8  9  10 ... 23  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   998 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 38ms · UTC 19:33 · PVG 03:33 · LAX 11:33 · JFK 14:33
Developed with CodeLauncher
♥ Do have faith in what you're doing.