Fluyod

用深度学习做时间序列预测,如何选择数据标准化方法呢?

  •  
  •   Fluyod · Jun 18, 2020 · 2844 views
    This topic created in 2164 days ago, the information mentioned may be changed or developed.

    有一批时间序列数据,记为 x,shape 为 [n(time), n(location), n(feature)],分别为时间、地点和特征维度,例如不同地点不同时间的降雨量、气温、噪音等。用简单的 LSTM 做时间序列预测,LOSS 与评价指标为 RMSE 。按理说输入数据前需要对数据做标准化处理,例如 min-max 或者 z-score

    1 、应该在哪个维度上对数据进行标准化处理呢?例如 z-score: x = np.mean(x, axis = 0) / np.std(x, axis = 0) x = np.mean(x, axis = (0, 1)) / np.std(x, axis = (0, 1)) x = np.mean(x) / np.std(x) 以上哪种是合理的呢?

    2 、在实际尝试中,我用了 min-max 、z-score 、取对数、取 sigmoid 等多种标准化方法,对应的输出层激活函数也试过 sigmoid, tanh 或者不使用激活函数,发现要么 loss 压根不下降,要么 loss 可以下降但错误率很高,反而用原始数据输入能得到比较好的结果(优于 ARIMA 等传统模型),很快模型就收敛了,这是为什么呢?不对时间序列做任何预处理就扔进网络,是可以接受的吗

    2 replies    2020-08-28 17:36:46 +08:00
    w1573007
        1
    w1573007  
       Jun 23, 2020 via Android
    要对每一个特征分别做归一化,arima 模型比较受数据集的波动影响。连人都没有。老铁 arima 的代码可否看看,python 版的没写出来
    shm7
        2
    shm7  
       Aug 28, 2020
    如果真的不会,可以去翻翻 sklearn 的文档,里面有经过业界验证的各种预处理工具,包括 norm 。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2864 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 04:54 · PVG 12:54 · LAX 21:54 · JFK 00:54
    ♥ Do have faith in what you're doing.