This topic created in 737 days ago, the information mentioned may be changed or developed.
例如:
app-main.html app-main.css => app-main, Webpages
angry-birds.apk flippy-birds.apk => Games, Apk Packages
facebook.ipa tiktok.apk => Social App Packages, Apps, Software
foobar2000 vlc => Media Players, Software
rclone foobar2000 => PC Software
实际输入可能是各种各样奇怪的东西。必须浏览器内本地运行,不能上传到服务器。
8 replies • 2024-05-27 15:56:44 +08:00
 |
|
2
drymonfidelia May 27, 2024
实际输入可能是各种类型的奇怪东西,只是我只想到程序相关的例子,以下这些才是大多数:
Queenie, Reba, Fiasco => TV shows Avatar, Star Wars => Films Hermes Epsom Constance 24 Black, Hermès Swift Kelly Retourne => Luxury Handbag, Hermes Bags Gochiusa, Wataten => JP Anime, JP TV shows
如果用字典肯定放不下。最好能有现成的 AI 模型能猜测这个词大概率是影片的名字来实现。
|
 |
|
4
dayeye2006199 May 27, 2024
分类的规则你可以清楚的定义吗?人看了你的定义之后可以清楚的得到答案吗? 你有标注数据吗?
如果上面都 yes ,那自己搞个模型,输出到 tensorflow.js 这种不难。
上面都是 no ,建议还是老老实实 GPT
|
 |
|
5
murmur May 27, 2024 1
关键词匹配不就完了
这东西没法训练吧
facebook 又不是 face (美颜)也不是 book (书籍)
foobar 也不是 bar (工具栏)
只有长内容,能提取出关键字的,才有分类和聚类的必要
单词或者简单词组只能做关键字匹配
|
 |
|
6
godqueue May 27, 2024
如果是生产就老实的用 gpt 吧。。或者其他大模型也可以。。但是大模型有幻觉,输出的内容很可能第一次和第 2 次的内容不一样。。。这个问题好像没有太好的手段。。
|
 |
|
7
godqueue May 27, 2024
如果需要非常精确,那好像只能自己写字典来做这个事情。。
|
 |
|
8
forty May 27, 2024
浏览器内本地运行,那么不可能存储太大的模型数据吧。 不能上传到服务器,和浏览器内本地运行,还是略有区别的,可以在本地启动服务,供浏览器调用,这样不算纯浏览器内运行,但是没有发送到服务器。
|