t-SNE(t-distributed Stochastic Neighbor Embedding,t 分布随机邻域嵌入)是一种降维与可视化方法,常把高维数据(如图像特征、词向量、用户嵌入)映射到二维或三维,以便观察聚类结构与局部相似性。(也常写作 TSNE)
/ˌtiː ɛs ˈɛn iː/
We used t-SNE to visualize the dataset.
我们用 t-SNE 把数据集可视化。
After training the model, she applied t-SNE to the embedding vectors to see whether similar items formed clear clusters.
模型训练完成后,她对嵌入向量使用 t-SNE,观察相似项目是否形成清晰的簇。
t-SNE 是一个缩写,来自 t-distributed Stochastic Neighbor Embedding:方法使用 t 分布来建模低维空间中的点间关系,并通过“随机邻域/相似度”的思想尽量保留局部邻近结构;该术语随 2008 年 Laurens van der Maaten 与 Geoffrey Hinton 的论文而广泛传播。