学习数据库
学习数据库
理性演绎回溯论
经验主义
理性主义、经验主义与语料库语言学《中国外语》
梁茂成 语料库语言学研究的两种范式:渊源、分歧及前景
基于
a ollection of naturally-occuruing langage text. chosen to characterize a state or variety of a language. 自然、需要设计,有明确的目的性。
机器可读;真实语言;取样合理;代表性强 (需要合理设计,不同语言的比例)
常见类型:
通用语料库
BNC,COCA
专用语料库
学术预料库: MICASE & MICUSP,儿童预料库 PATTIE,商英 BEC
学习者语料库
CLEC,SWECCL (口笔语料),英语学习者国际语料库 ICLE
历时语料库:
Brown Family, COHA (1801-2000), Helsinki
平行语料库
Europarl (欧洲议会语料库)
Ted 演讲语料库
Babel语料库
可比语料库
Crown,Clob Torch
#
基本类型
1. general corpus
英国国家语料库 BNC、现代美语语料库 COCA
2. specialized corpus
学术语料库 MICASE&MICUSP、儿童语料库PATTIE (吉创建的儿童读物及视听材料的语料库)、商英BEC
3. 学习者语料库 (learner corpus):
如中国学习者语料库CLEC(桂诗春 、SWECCL(文秋芳 口、笔语语料库)、英语学习者语料库ICLE
4. 历时语料库(diachronic corpus):
如布朗家族语料库 Brown Family、 美语COHA、赫尔辛基 HELSINKI
5. 平行语料库(parallel corpus)
如欧洲议会语料库 Europarl 、TED演讲语料库、 Babel 语料库
6. 可比语料库( comparable corpus):
如 Crown、 CLOB、 ToRCH2009 语料库、国际英语语料库 ICE