我有一个群。群里每天很多同行发消息。 例如 “找华为 mate40PRO”
“找个 12pro128 黑解机”
“收个 12 。128 白色无磕碰的”
“找台 xsmax 256 原机靓白色”
“找个 xr 64 国行黑白都行 效率高的”
“收个 x64g 外观漂亮的来”
“找 11/128 白色 紫色靓充国行”
这样的句子,我需要对接 ai 分析他具体需要什么产品,然后跟我数据库的产品对比,比中了给我返回结果
请问这样该选用什么产品来做呢?
1
passer9527 2021-08-29 15:37:37 +08:00
从你给的例子来看,正则就可以搞定。 对苹果来说,数字 < 20 的是手机型号, 大数字是存储,外加 pro 之类的版本识别,然后颜色匹配。其他手机也可以类似思路。
|
2
Jface 2021-08-29 15:39:26 +08:00
最近了解了一个中文分词产品 hanLP, 不晓得能不能满足楼主需求.
https://hanlp.com/ |
3
indo OP @passer9527 感谢你的回复。主要是自己正则特别菜,而且这边我举的例子里主要是 iPhone 的产品,实际使用中还有很多别的品牌的设备。感觉正则会稍微不太方便。
|
5
ch2 2021-08-29 21:29:04 +08:00
直接无脑文本分类,把你认为应该归到一个机型的文本全标为一类
然后训练个模型出来,主要是训练用的数据得多 |