现在的任务大概如下: 提供图片,要求检测出属于猫、狗、人类或其他,并在此基础上,给出对象属于猫的什么种类,狗的种类等等。最后,将父类(一级标签)和子类(二级标签)一起返回。
图像识别算法不限,算力资源暂不考虑,检测时间尽可能快。
目前打算用 yolo v8 来实现,但是以前没接触过 CV 相关,看了文档 “二级标签” 也不知道咋整 +_+
我的想法是:给图片打同级双标签,不知道是否可行;一级标签过滤,二级标签再训练一遍感觉可行;只打一个标签,但是标签文本同时含有父类和子类,感觉也可行。
请各方大佬不吝赐教!
1
DocHelper 205 天前 1
|
2
flymemory 205 天前 via iPhone 1
如果一级父类不多,没有特别高的分类速度要求,可以先训练一个总的一级标签的模型,再分别训练各自的二级标签的模型,这通常来说是最稳的,yolov8 是个比较快上手的选择
|
3
indexError 205 天前 via Android 1
检测到分类应该是固定的吧。
训练二级,手动把二级和一级组成字典。 |
4
ktyang 205 天前 1
要我的话只训练二级,一级去数据库里查,一把梭看天命。不过训练两个模型也可以,也可以互相确认一下,但是结果不一致的时候的融合逻辑得想清楚。
|
5
sonnyclarity492 OP @DocHelper 老哥不愧是 DcoHelper 待我研究研究
|
6
sonnyclarity492 OP |
7
DocHelper 204 天前
@sonnyclarity492 不过简单一点做就直接一个分类头+两个 loss
一个分类头估计所有二级标签的概率 第一个 loss 计算 二级标签分类的交叉熵 然后再把属于同一一级标签的所有二级标签的 logits 加起来 得到所有一级标签的 logits 在这之上再算一个交叉熵 |