V2EX  ›  英汉词典
Enqueued related words: Spell-Checking, Approximate Matching

Damerau-Levenshtein

定义 Definition

Damerau–Levenshtein(达梅劳—列文施泰因)距离:一种衡量两个字符串相似度的“编辑距离”指标,计算把一个字符串变成另一个字符串所需的最少操作次数。常见允许的操作包括:插入删除替换,以及(相较于普通 Levenshtein 距离额外加入的)相邻字符对调(transposition)。常用于拼写纠错、模糊匹配与自然语言处理等场景。

发音 Pronunciation (IPA)

/ˈdæmərɔː ˈlɛvənʃtaɪn/

例句 Examples

The spell-checker uses Damerau-Levenshtein distance to fix typos.
拼写检查器使用 Damerau–Levenshtein 距离来修正错别字。

In search and NLP, Damerau-Levenshtein distance helps rank candidate corrections by allowing common mistakes like swapping adjacent letters (e.g., “teh” → “the”).
在搜索与自然语言处理中,Damerau–Levenshtein 距离通过允许“相邻字母交换”等常见错误(如“teh”→“the”)来帮助对候选纠正结果进行排序。

词源 Etymology

该术语来自两位学者的姓氏:Frederick J. DamerauVladimir I. Levenshtein。它是在 Levenshtein 编辑距离的基础上,强调并纳入了人类打字/拼写中非常常见的错误类型——相邻字符颠倒

相关词 Related Words

文学与著作中的用例 Literary Works

  • Frederick J. Damerau, “A technique for computer detection and correction of spelling errors” (1964)
  • Vladimir I. Levenshtein, “Binary codes capable of correcting deletions, insertions, and reversals” (1965)
  • Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval
  • Daniel Jurafsky, James H. Martin, Speech and Language Processing
  • Dan Gusfield, Algorithms on Strings, Trees, and Sequences
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1941 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 02:35 · PVG 10:35 · LAX 18:35 · JFK 21:35
♥ Do have faith in what you're doing.