UMAP 是一种常用的降维与可视化方法,全称 Uniform Manifold Approximation and Projection(统一流形近似与投影)。它把高维数据“嵌入”到二维或三维空间中,便于观察数据结构、做聚类前的探索等(也常用于生成用于下游任务的低维表示)。在机器学习/数据科学语境里,UMAP 往往与 t‑SNE、PCA 并列出现。
/ˈjuːmæp/
I used UMAP to visualize my dataset in 2D.
我用 UMAP 把数据集可视化成二维图。
After cleaning and scaling the features, we applied UMAP to create a low-dimensional embedding that preserved local neighborhoods for clustering.
在清洗并标准化特征后,我们使用 UMAP 生成低维嵌入,尽量保留局部邻域结构以便进行聚类。
UMAP 是一个首字母缩略词,来自 Uniform Manifold Approximation and Projection。名称本身就概括了它的核心思路:用“流形(manifold)”的几何直觉去近似高维数据结构,并把它“投影/嵌入(projection/embedding)”到低维空间。