TL;DR: ChatGPT 的成功离不开 RLHF 和人类的标注数据(Scale AI),那么如何从人类标注数据得到可用于模型训练的标签就成为了一个关键的问题,这就是标签聚合/真值推断算法要解决的问题。这篇博客就介绍了标签聚合/真值推断领域一个非常经典的算法: Dawid-Skene.
Details: EM 算法,DS 算法,DS 算法编程实践,DS 算法在工业环境的改进。