实体解析/实体消歧/实体对齐:在数据管理与信息检索中,用来判断来自不同数据源或不同记录中的“实体”(如人、公司、地点、产品等)是否指向同一个真实对象,并将其匹配、合并或去重的过程。常见于客户数据整合、知识图谱、去重清洗、反欺诈等场景。(也常与 Record Linkage、Deduplication 等概念重叠。)
/ˈɛntɪti ˌrɛzəˈluːʃən/
Entity resolution helps remove duplicate customer records.
实体解析有助于移除重复的客户记录。
In a large knowledge graph, entity resolution is used to link “J. K. Rowling” and “Joanne Rowling” when they refer to the same author, despite differences in spelling and data sources.
在大型知识图谱中,实体解析用于把“J. K. Rowling”和“Joanne Rowling”这类不同写法、不同来源但指向同一作者的条目连接起来。
entity 源自拉丁语 ens/entis(“存在之物、实体”);resolution 源自拉丁语 resolutio(“分解、解开、解决”)。合起来字面意思是“把实体的指向关系解开/解决”,即确定记录究竟对应哪个真实对象。