TimePPT

TimePPT

V2EX 第 62211 号会员,加入于 2014-05-08 19:56:28 +08:00
今日活跃度排名 22094
根据 TimePPT 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
TimePPT 最近回复了
热门景点尽量避开周末,需要预约的景点提前点定。
北京除了二环内景点聚集那片,其他景点离得都不近,带老人旅游别排太满,两点距离地铁公交单程超过 1 小时的这种,都尽量错开。
从一开始就不要把涉密信息硬编码到代码里,这跟使用不使用大模型无关,是一种良好的代码安全意识。
5 天前
回复了 bboring 创建的主题 生活 2 月最后一天,祝自己快乐
生快!
@xiaohupro 不用客气,也不是啥普及,只是感觉最近拿着大模型锤子找钉子的人越来越多了😂

另外补充下,我第一条想表达其实是,虽然大模型能获取到更多用户主动发送的信息,但其实,这种挖掘并没有比传统方法高到哪里去。
主要原因也还在:
1. 和 LLM 对话的信息量级远少于在线推荐系统的反馈,也就是说,这类特征更加稀疏——从使用频次、时长上来说都是这样。
2. 非结构化数据挖掘整理到结构化,这个成本比直接的结构化数据要高。
3. 对普通用户来说,张口表达把问题问清楚,把 context 讲清楚,这个要求远高于让他们去点/划表达喜恶——咱们冷静想想,搜索引擎出现二十年了,真正善用搜索的人有多少?简单几个 Keyword 都数不清楚的普通人,有几个能明白现在 LLM 的那些 Prompt 技巧?
@xiaohupro 另外,多模分析也不是今天才有的,抽帧截图做实体识别,七八年前业内就开始做了,从搜索推荐到内容审核现在广泛应用。只是现在这波让这些技术更多暴露在了非从业者眼前罢了。
@xiaohupro 从业者表示,根本不用这么麻烦,几个大厂通过非 LLM 做的用户画像模型,精准度在 90%以上。当年我们在全国随机抽几百个用户找人做了用户调研访谈,结果中年龄、性别、职业、泛爱好这种纬度,都准得一批。
@TimePPT 还有,绑定手机号是有关部门规定,强制实行也十多年了,跟大模型也没啥关系。反而是,有司现在要求各家 LLM 加明水印、暗水印,方便回溯来源影响会更直接。
对广告推荐来说,从你问大模型问题里挖掘喜好搞广告,还不如你刷小红书/抖音 feed 流点击查看的反馈收集来得直接。
以及,就算输入 Query 分析的用户画像,Google / 百度都做了十几二十年了。又不是 LLM 时代才有的新鲜玩意。
不做 AI 开发的没必要知道底层原理,尽可能的在工作生活中用就行,擅长使用工具没必要都去知道工具底层是啥。

打个比方,Google ,百度这种搜索引擎出来二十多年了,不专业搞这块的。有几个人学过底层检索算法?甚至用 ES 做文本检索的都没几个。

如果要做相关 AI 应用开发的,至少知道些基本概念和算法原理也就差不多了。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   955 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 20:35 · PVG 04:35 · LAX 12:35 · JFK 15:35
Developed with CodeLauncher
♥ Do have faith in what you're doing.