1
vitovan 2019-07-16 09:15:25 +08:00 via Android
生成的图片会不会不太符合生产环境真实 NG 的特征?
有没有 NG 产品的照片库直接拿来训练这样? |
2
dafengchui OP @vitovan append 附加没有了,正好这里回答你的问题:
生成图片有 2 个方案,并行或者二选一: 可能会有 ng 照片直接拿来训练(如果产线某零件运行时间足够久的话). 此外肯定有个学习条件输入端:比如一平方毫米允许多少个划痕 /裂缝之类. |
3
jingous 2019-07-16 09:24:05 +08:00 via Android
1 楼说的对,直接在图片上添加生成的图片大概率不符合真实环境。现在的图片生成基本都是 GAN,但也需要原始 NG 数据。即使生成新数据之后,也不是直接匹配,而是作为训练数据来训练模型。
|
4
jingous 2019-07-16 09:27:51 +08:00 via Android
直观的思路是:先收集一批 NG 数据,视数据收集的难易程度来确定是否需要生成虚假数据。然后数据训练模型,每次在生产线拍的照片输入模型来得到结果。大概框架是这样,里面可能涉及到 N 多问题:图片的光线、模型的处理数度等等
|
5
dafengchui OP @jingous 我给你的初始照片一定是完美照片,可以用来做基准照片,光线之类不需要考虑了. 倒是模型的处理数度可以探讨,目前仅仅聚焦于产品表面检测.
这个算法是要长期合作的,因为不同的产品对应不同的模型,考虑为一个平台, 暂时只是基于当前已有产品检测而已. |
6
crackhopper 2019-07-16 09:34:50 +08:00
找学校合作感觉最合适。针对数据进行样本生成,一般都是对抗网络,也方便发论文。
验收标准比较麻烦,毕竟深度学习都是玄学,样本哪怕生成的好,也只是一个环节;所以怎么验收也是值得疑虑的。 |
7
jingous 2019-07-16 09:36:04 +08:00
完美的照片才是缺点。如果你拿的是完美的照片,那么训练出来的模型只能处理完美照片。而生产环境中由于光线、光亮等原因采集到的图片各种各样,输入模型肯定得不到很好的效果。如果你这个数据获取容易的话,可以收集大量生产数据,如果数据收集困难的话,这个问题就比较难了。
|
8
dafengchui OP @jingous 产线环境这你根本不需要考虑,已经解决了.
|
9
liuzhedash 2019-07-16 09:38:36 +08:00
现在的生产线是如何判别产品是否有质量问题的?
|
10
jingous 2019-07-16 09:41:53 +08:00
@dafengchui 那就直接搜集生产环境的数据,先跑一个简单的模型试试。
|
11
dafengchui OP @liuzhedash 请看附言: 定义 ng 输入端:比如一平方毫米允许多少个划痕 /裂缝之类.
|
12
dafengchui OP @jingous 目前是基于 halcon 二开,垃圾的一比,基本抛弃了.
|
13
vitovan 2019-07-16 09:48:11 +08:00 via Android
建议楼主发几张照片看看
|
14
unhumanplane 2019-07-16 09:51:13 +08:00
瑕疵检测可是可以给一家图像公司当主营业务的领域,现在主流基本都是直接堆数据上检测搞定,外加各种数据增广,基于匹配的大概率不行。
|
15
dafengchui OP @vitovan 这是朋友的项目,我来问问是否需要公开些照片.
|
16
dafengchui OP @unhumanplane 目前只是简单的表面瑕疵识别,零件单调简单, 图像公司的算法复杂多了. 不过你提出了很好的思路, 虽然之前我们也探讨过, 我把它写到 append 中.
|
17
unhumanplane 2019-07-16 10:25:29 +08:00 1
@dafengchui 不复杂,大多数深度学习项目工程化关键都在于折腾数据,算法一大堆开源的,昨天刷 github 就看到了一个相关的库,楼主有兴趣我可以再去找找。
|
18
dafengchui OP @crackhopper 这段时间天天 github 找有没有搞这个算法的,估计有人做了,所以找到类似的,然后给感兴趣的提供参考,那么是皆大欢喜的事情.
|
19
winglight2016 2019-07-16 11:56:42 +08:00
lz 思路还是基于逻辑编程来做缺陷识别,个人建议还是用监督学习来做分类,有图片的话,可以发过来预研一下,我的 wx:Y2h5NDQ3NjQ4 ( base64 )
|
20
qinyusen 2019-07-16 12:23:48 +08:00
有监督学习的比较好, 关键是, 要有标注好的数据。
|
21
shinodajmk 2019-07-16 12:29:58 +08:00
|
22
mahonejolla 2019-07-16 15:53:20 +08:00
老铁,你是哪个公司的?我咋感觉我们在做同样的事情??
|
23
dafengchui OP @unhumanplane 请问找到了那个 github 上的算法了吗? 方便共享吗?
|
24
dafengchui OP @winglight2016 已加
|
25
dafengchui OP @mahonejolla 我是帮朋友忙而已, 你们公司也要做类似的工作吗?
|
26
mahonejolla 2019-07-16 16:42:54 +08:00
@dafengchui #25 是的,你是做的具体是什么物体的检测呢?不会是电池吧?
|
27
unhumanplane 2019-07-16 17:34:11 +08:00
|
28
cshlxm 2019-07-16 17:42:18 +08:00
好歹搞下一批真实的 NG 数据的标注,训练给 GAN 用
|
29
dafengchui OP @unhumanplane 谢谢,和上面一个兄弟微信沟通过,现在从深圳去珠海见见他当面聊聊。
|
30
dafengchui OP @cshlxm 那肯定了,只是很多时候提供的 ng 数量不足够
|
31
dafengchui OP @cshlxm 对的,大概就是这样的思路,这几天忙的飞起.
|