V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  bigtang  ›  全部回复第 1 页 / 共 5 页
回复总数  98
1  2  3  4  5  
我注册了,登录了,总是说没有登录信息,一张也生成不了?
交流下:建站 1 年,日均 ip1000, 老用户 25%,但是搜索引擎带来的不到 100 ,而且 bing 超过 baidu ,难道是我老在 V2EX 上发帖导致?我的站 tanglib.com
@iosyyy 你说的爆了是怎么爆?是查询时间爆了?我只有 1 台服务器阿,百度有 10 万台。。。
欢迎质疑
@nomagick 我说的是给 ai 提供素材,不是给最终用户。。。
@shyrock 你说的是 TF-IDF 还有 pagerank 这些? tanglib 目前只做了半个解决方案,ai 与 tanglib 之间可进行多次交互,发现关键词量太大继续限定,而百度以及原来的搜索必须一次给出结果,其实这些方法都很大概率不可靠,很多时候明明知道有百度就是找不到,这种时候不少吧?
@matrix1010 @shyrock 求交集问题是无解的,a 有 10 亿个,b 有 10 亿个,求 a and b, 只能遍历,不要问不可能的问题。
但 ai 解决这种实际问题不难,a 有 10 亿个,加一些背景限制,缩减到 3 万个,遍历就快了。
@maggch97 @pkoukk 跟 ai 的关系是:例如用户问 Q10G 电视是否效果好? trie 很快能搜到很多 Q10G 电视及评价,送给大模型判断。实际的型号可能是 tcl 75q10g, tcl85q10g, 当然你说 elasticsearch 也能搜到,我告诉你同等条件下 trie 更优秀。

跟向量数据库的区别是性能及易用性上的区别,向量数据库的匹配跟 ai 还是差很远,且向量数据库只能是含义上的匹配,就刚才这个 Q10G 电视是否效果好 我怀疑向量数据库能否准确排除非 Q10G 。
@yeekal trie 数据库就是比 ElasticSearch 粒度设为 1 要优秀得多,否则就毫无意义了
@shyrock 这个网站的数据里真不存在 “阿里 马云” 阿,你看着数据再挑两个词看看
@cowcomic 看来研究过 trie:) @buaasoftdavid 有可能是,如果 chatgpt3 不出来,整个 AI 都是“伪需求”
楼上你心目中的 Trie 树数据库是什么样的?

知乎上有个问题:Trie 树非常适合索引结构,怎就没人用于数据库引擎?
https://www.zhihu.com/question/643972502/answer/3393671711
楼主看下 tanglib.com , 适合系列内容创作(专辑)
@Vanderick kimi 完全正确!重述也很强!

@vvhy 语法是基础,如果语法都不正确,就没有 foundation 了。
Claude-3-Opus-200k 很强,重述时创新很多
楼主没想到隔热问题,汽车的隔板除非有 30 厘米厚,否则无法像住宅那样隔热,导致冬天冷死夏天热死,开空调是不爽的。
304 天前
回复了 BaymaxK 创建的主题 分享创造 改造了一个练习英语的开源项目
追求枝末了,学英语最重要的是阅读,在阅读中不知不觉背单词,推荐给楼主:tanglib.com
313 天前
回复了 windyskr 创建的主题 生活 V2er 有打网球的吗?请问怎么入门
先打拉线网球,再打墙,坚持每天打,一年 3.0 是有可能的
如果是男孩,想办法让他跟女孩子玩,女孩,反过来。
tanglib.com 建站半年,共勉。不过 2 年下来百度谷歌都不给流量,这个问题很严重。
楼主,我来说下:
找一个你喜欢的运动,只有运动,能同时改善身体和精神,其它的不能同时。

如果你没有喜欢的运动,我推荐,网球。

网球号称绿色鸦片,是实实在在的绿色鸦片,我是一个受益者,之前尝试了爬山,远足,走公园,羽毛球,乓乒球。
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3896 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 05:11 · PVG 13:11 · LAX 21:11 · JFK 00:11
Developed with CodeLauncher
♥ Do have faith in what you're doing.