以前一直用 TFIDF+SVM 做 baseline,效果尚可,不知可还有其他能做一个不错 baseline 的思路?
试了下 word embedding + bi-LSTM,结果却并没有什么提高…不晓得是不是参数的问题?
现有的训练数据大概 1000 个标签吧,每类七八百个样本,是不是数据量也太小了?
试了下 word embedding + bi-LSTM,结果却并没有什么提高…不晓得是不是参数的问题?
现有的训练数据大概 1000 个标签吧,每类七八百个样本,是不是数据量也太小了?