基于语料库的:指研究、分析或方法主要依赖语料库(大规模、真实语言材料的集合,如书面文本或口语转写),通过检索、统计与对比来得出语言规律或结论。常见于语言学、词典学、翻译研究与自然语言处理等领域。
(也可见到相近表达 corpus-driven 等,但侧重点略有不同。)
/ˈkɔːrpəs beɪst/
A corpus-based study can show how people actually use this word.
语料库研究可以展示人们在真实语境中如何使用这个词。
Using a corpus-based approach, the researcher compared idioms across different genres and time periods.
采用基于语料库的方法,研究者比较了不同体裁与不同时期的习语用法。
corpus 源自拉丁语 corpus,意为“身体、整体”,在现代学术语境中引申为“(文本/数据的)整体集合”,即“语料库”。based 来自英语 base(基础)加后缀构成“以……为基础的”。合起来 corpus-based 就是“以语料库为依据/基础的”。