V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  JCZ2MkKb5S8ZX9pq  ›  全部回复第 94 页 / 共 120 页
回复总数  2392
1 ... 90  91  92  93  94  95  96  97  98  99 ... 120  
@bxnh 不是这个情况。A 商品是第一个,你+1,+1,忽然它变第二个了。是我题目表达得很不清楚吗?
@zushi000 不一样,京东那种是你手动刷新页面,排序才会变。苏宁这个是点了数字+,立刻就变了,导致无法对同一物品连续增加数量。
2019-03-15 12:43:25 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@Arnie97 插零宽字符一个 replace 就全白插了
2019-03-15 12:42:08 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@bghtyu 这个不错,看上去接近我的预期。
2019-03-15 12:37:08 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@vincentzlt 我觉得你这个不错。
我之前一直觉得,可以用 unicode 这个拼字的特性,做一套自动字体生成的东西。根据横竖笔划密度,自动调整磅数、中宫、转折和尾端处理等等。
2019-03-15 12:32:34 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@chinvo 繁体因为映射表比较完整,很容易被破解吧。日韩越等异体汉字倒是可以,那块有空也想搞搞。
2019-03-15 01:48:39 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
https://ws1.sinaimg.cn/large/64d6a491ly1g12umo17xaj202o02o0rh.jpg
黑色占比 0.13484312996031747

https://ws1.sinaimg.cn/large/64d6a491gy1g12un3cq0xj202o02o0qx.jpg
黑色占比 0.16272941468253968

https://ws1.sinaimg.cn/large/64d6a491gy1g12una5egpj202o02o0d0.jpg
差别比例 0.48925163811932404

=====

进展汇报

试了几种图形识别的方式,都不大完美。
即便用点阵字体+bitmap 纯黑白,也不大理想。
况且我希望的结果是混淆人眼识别,有些比如 [辛] 和 [幸] 和 [亲] ,程序会觉得 13 更接近。
所以感觉这个问题比预想的还复杂一点。

笔划近似的确是一个思路,但还没想好怎么量化。
2019-03-15 01:39:41 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@c4f36e5766583218 我觉得这个主要还是看比例,比如五千字的文章里换掉五个字,应该问题不大。再比如我这段话里就焕掉了—个字,但对阅読的影响应该不会很大。
2019-03-14 18:24:53 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 强迫症 怎样改善随地吐痰的现象?
@loading 对哦,没有垃圾桶,就逼得人家乱丢垃圾哦。
与其乱丢包了痰的纸巾,不如直接吐痰,还省了纸,低碳环保。
文明楷模,该给你颁奖啊。
2019-03-14 18:05:24 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@tyrealgray 我在 append 里补充了一下
2019-03-14 17:53:45 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@pkokp8 @ebingtel 打错了 是 [枎]
2019-03-14 17:52:42 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@pkokp8 @ebingtel 我自己手机就用的笔划输入法,真的不行。
笔划是天上一脚地上一脚,差个位置差很远。
比如
[林] 横竖撇捺横竖撇捺
[扶] 横竖撇捺横横撇捺
2019-03-14 17:49:30 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@lastpass 感谢提供的百度链接,但这个不大符合我的预期。
一方面近似度差了点,一方面不够量化,多近多远没个准。
2019-03-14 17:47:10 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@lastpass 人工穷举不太可能啊,字太多了,排序又不规则,两两比较就算只有 3000 个,这也太夸张了。况且很多近似字都是冷门生僻字,字库范围就不能按 3000 来算。
2019-03-14 17:45:12 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@lastpass 查了下
[GB 2312 - 维基百科,自由的百科全书]( https://zh.wikipedia.org/wiki/GB_2312)
16~55 区( 3755 个):常用汉字(也称一级汉字),按拼音排序;
56~87 区( 3008 个):非常用汉字(也称二级汉字),按部首 /笔画排序;
按拼音排序,好像并不适合用来做识别。
2019-03-14 17:41:28 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@lastpass 区位码我去看看哦
而且因为是找近似字,范围应该不限于常用字,而是常用的 unicode 大字库了,比如微软雅黑 /思源 /萍方的交集,差不多这个范围里找。
2019-03-14 17:38:26 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@lastpass 我就是想问映射表哪儿来?
2019-03-14 17:37:44 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 怎么找出近似的汉字?
@vJianZhen 我就想问怎么建映射表
你说的方法手动一个个比?
2019-03-13 18:58:56 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 程序员 xpath 怎么取出 html 原文?
@Nick2VIPUser 嗯,后来我自己搜到这个 tostring,还有 tounicode 哦,我试试去。

题目没说完整,的确是 python etree。
2019-03-12 13:01:47 +08:00
回复了 EmotionV 创建的主题 问与答 有好吃便宜的巧克力推荐吗
@0vels 对 宜家便宜大碗
1 ... 90  91  92  93  94  95  96  97  98  99 ... 120  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2403 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 38ms · UTC 09:59 · PVG 17:59 · LAX 02:59 · JFK 05:59
Developed with CodeLauncher
♥ Do have faith in what you're doing.