1 万条训练出来的模型和 8 万条训练出来的性能差不多,个人认为这个模型能做到 18%已经是极限了。
1
Sawyerhou 126 天前 via Android
是说输入特征有 8 个吗?如果是,这么点输入没办法用神经网络拟合,树类模型应该都跑不满,直接多项式回归试试?
|
2
volvo007 126 天前
听起来应该有优化空间。我遇到的很多新手都是特别迷信模型,觉得好像用了一个模型就可以拯救世界。实际上数据清洗和特征工程占到了一般 ds 项目的 60% 甚至更多的时间。
去做做特征工程吧,不是简单的什么最大值、最小值、中位数,而是从业务角度出发看看有没有哪些特征是重要的 最近的一个例子是,乙方帮我们建模,也是搞了半天准确率上不去,还说就只能这样了。我一看,你这些数据前一个影响后一个,有因果关系,都不是独立同分布的搞毛。换了个思路,模型几乎没动,准确度马上提升一大截。 |