nealot 最近的时间轴更新
nealot

nealot

V2EX 第 298264 号会员,加入于 2018-03-08 21:13:44 +08:00
遗传算法生成的模型如何避免过拟合?
程序员  •  nealot  •  27 天前  •  最后回复来自 VoidChen
14
红盘 8T 和企业盘 HC320 8T 哪个更适合组家用 NAS
  •  1   
    程序员  •  nealot  •  92 天前  •  最后回复来自 xiaoz
    46
    请教一个数值积分问题
    程序员  •  nealot  •  102 天前  •  最后回复来自 Tony042
    1
    优化问题解空间定义问题求助
    程序员  •  nealot  •  2018-08-10 21:51:33 PM  •  最后回复来自 nealot
    8
    nealot 最近回复了
    @20015jjw 3990X 和 3970X 的 TDP 同样是 280W,但是核数多了一倍,所以牺牲了主频 (单核性能)

    一般的评测数据显示,3990X 大概是 3970X 的 1.5 倍性能,然而其京东自营售价高达 29999

    同时要不缩水地,支持 3 块显卡和 3 条 NVME 硬盘,主板和电源的规格还需要增加,所以结论仍然不变
    28 天前
    回复了 nealot 创建的主题 程序员 遗传算法生成的模型如何避免过拟合?
    @VoidChen 感觉这是个比较好的解法,值得一试

    打个比方,假设这个图像演化算法是用来生成美女的脸型的,第一个训练子集生成出来的是赵薇的脸,第二个训练子集输出的是刘亦菲的脸……

    最后把这些明星脸平均一下,就是 “平均美人脸”,这个很可能就是最终需要的模型

    (那么为什么不把训练集合在一起训练呢?我也不知道为什么,总之实验效果不好,毕竟这不是简单的加减算术题)
    28 天前
    回复了 nealot 创建的主题 程序员 遗传算法生成的模型如何避免过拟合?
    @shm7 验证集可以用来搜索最佳的模型生成参数。如果一定要套用到遗传算法上,我们是要让种群数量减小,演化次数减少,以便不进行充分的演化?这感觉和遗传算法的本意是相违背的
    28 天前
    回复了 nealot 创建的主题 程序员 遗传算法生成的模型如何避免过拟合?
    @Issacx 现在的核心问题,其实和具体业务是无关的。我来具体解释下矛盾在哪里

    传统的机器学习任务,比如用决策树做分类,如果我们在 trainset 上建立一颗尽量精细的决策树 (model),然后把这个 model 用于 testset,通常效果是不太好的,因为有过拟合,这是个典型的错误

    因为是典型的问题,所以也有典型的解法,对于决策树分类问题,解法是这样的:

    我们把 trainset 分为两个子集: trainset_1_of_2, trainset_2_of_2

    接下来的重点是,我们不是直接构建一个最佳的 model,而是构建一个最佳的 model 的生成参数 (比如 max_depth)

    ```C++
    int best_depth = -1;
    int best_score = -1;

    for (int max_depth = 1; max_depth < 10; max_depth++) {
    tree1 = construct(trainset_1_of_2, max_depth);
    score1 = run(trainset_2_of_2, tree1);
    tree2 = construct(trainset_2_of_2, max_depth);
    score2 = run(trainset_1_of_2, tree2);
    score = (score1 + score2) / 2;

    if (score > best_score) {
    best_score = score;
    best_depth = max_depth;
    }
    }
    ```

    这样我们就得到了 best_depth,然后在整个 trainset 上用这个参数来构建决策树

    ```C++
    tree = construct(trainset, best_depth);
    ```

    接下来这颗树在 testset 上效果就比较好了

    但是如果我们搜索的,不是模型生成参数,而是模型本身 (使用遗传算法),这套方法还成立吗?

    PS: 目前使用的是类似图像演化的遗传算法,得到是一个类似 BMP 的图像
    28 天前
    回复了 nealot 创建的主题 程序员 遗传算法生成的模型如何避免过拟合?
    @VoidChen 是类似图像演化的算法,可以参考这篇文章 https://chriscummins.cc/s/genetics/
    @Semidio 4500 欧的售价已经把 99% 的人吓跑了

    这个场景的最佳矿机是那些次新一代的主流矿机,能效不是最高的不要紧,关键是价格要低
    @dlsflh 卧室或书房里攒着一桶矿物油感觉也不太好诶

    临时实验一下拍个演示视频还能接受
    这个我已经实践了一段时间了,制热效果还是不错的,1500W 足够一个 10 平方米的小房间冬季取暖了

    1. 1500W 的空调可以有 4500W 的制热能力,每 4.5 单位热量,支出 1.5 份电费

    2. 3 台 1500W 的矿机也有 4500W 的制热能力,每 4.5 单位热量,反赚 0.6 份电费 (根据电价和矿机型号具体数值可能不同)

    3. 出风口噪音 75 dB 左右,放身旁完全受不了

    4. 真的不敢改造风扇;现在风扇工作很稳定,改了万一温度反馈调节机制有问题,或者采购的风扇运行不稳定,起火就不好了

    5. 现在正在开发第二版消音器,争取降噪 15dB ;第一版主要用的是消音棉,第二版用的是三层夹胶玻璃,轻微改造至少比换风扇踏实点

    6. 网络上关于降噪的资料相当少,目前还在瞎摸索阶段,这个问题其实才是大坑

    7. 一个更好的思路是矿机放屋外空调外机上,用管道把暖风通到市内;这个效果一定非常好,因为冬天的室外气温是非常低的,进的冷风几乎可以让风扇只工作在最低转速,本身噪音就降低了,经过一般商品房配的双层玻璃又降了一个数量级,但是要特别注意防雨,而且如果装修时没有预留打孔操作会比较麻烦

    8. 还有一个思路是买官方版的水冷矿机,比较省心,就是太贵,而且这类产品一般性价比不高;此外要特别关注这类产品的保修和售后服务
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2423 人在线   最高记录 5168   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 133ms · UTC 15:38 · PVG 23:38 · LAX 08:38 · JFK 11:38
    ♥ Do have faith in what you're doing.