内容简介
第1章 语料库语言学概述
1.1语料库的定义
1.2语料库的类型
1.3语料库的加工
1.3.1语料库的加工层次
1.3.2语料库的标注原则
1.3.3语料库的加工技术
1.4语料库的应用
1.4.1频率统计
1.4.2词汇研究
1.4.3语言教学
思考与练习
第2章 汉语语料库建设的基本步骤
2.1规划:确定类型
2.2设计:制定原则
2.2.1通用性原则
2.2.2描述性原则
2.2.3实用性原则
2.2.4抽样性原则
2.3选材:操作原则
2.3.1语料分类
2.3.2语料年限
2.3.3语料描述
2.3.4语料样本
2.3.5语料版权
2.4建库:语料录入
2.5标注:语料加工
思考与练习
第3章 汉语语料库建设的加工规范
3.1名词
3.1.1普通名词
3.1.2时间名词
3.1.3方位名词
3.1.4处所名词
3.1.5人名
3.1.6地名
3.1.7团体机构名
3.1.8其他专有名词
3.2动词
3.3形容词
3.4区别词
3.5数词
3.6量词
3.7副词
3.8代词
3.9介词
3.10连词
3.11助词
3.12叹词
3.13拟声词
3.14习用语
3.15缩略语
3.16前接成分
3.17后接成分
3.18语素字
3.19非语素字
3.20其他
3.21关于重叠式的切分与标注
思考与练习
第4章 汉语语料库建设的词表研制
4.1词表结构与组成
4.2词表的构造原则
4.3词表的操作依据
4.4词表的主要问题
4.4.1对“词”的认识不清
4.4.2对词表的要求不同
4.4.3现行切词规范存在问题
4.4.4没有规范词表
4.4.5对词表问题认识不清
4.5结构化词表理论
思考与练习
第5章 汉语语料库中的字频研究
5.1引言
5.2字频统计具体步骤
5.2.1获取网络原始语料电子文本
5.2.2原始语料的初步处理
5.2.3合并文本文件的处理
5.2.4汉字次数与字频统计
5.2.5汉字累计频率统计
5.2.6字频统计结果
5.3小结
思考与练习
第6章 汉语语料库中的词频研究
6.1词频统计的意义与困难
6.2选材、抽样、录入
6.3切词、统计
6.4小结
思考与练习
第7章 汉语语料库中的句频研究
7.1《现代汉语基本句型》
7.2标准句型系统
7.3句型统计系统的组成与结构
7.4汉语句型的自动分析
7.5句型自动分析和统计
7.6实验结果与分析
思考与练习
附:常用句型频度表
第8章 基于语料库的汉语词语搭配研究
8.1搭配的相关研究
8.2搭配的计算
8.3实验结果及其讨论
思考与练习
第9章 基于语料库的汉语语法研究
9.1语料库数据作为论证部分论据
9.2语料库数据作为论证全部论据
思考与练习
第10章 基于语料库的小学语文教材研究
10.1《小蝌蚪找妈妈》用字的统计
10.2《小蝌蚪找妈妈》用字差异标注
10.3《小蝌蚪找妈妈》用字差异类型
10.4《小蝌蚪找妈妈》的用字问题讨论
思考与练习
附:本讲参考的小学语文教材列表
第11章 基于语料库的对外汉语教材研究
11.1超纲词的判定
11.2超纲词的统计
11.3超纲词与超纲字
11.4超纲词研究的意义
11.5小结
思考与练习
第12章 基于语料库的对外汉语教学研究
12.1引言:另类中介语
12.2另类中介语研究的步骤
12.3另类中介语统计与分析
12.4小结
思考与练习
第13章 基于语料库的对外汉语教材编写
13.1引言
13.2素材选择
13.3课文排序
13.4生词处理
13.5语法讲解
13.6小结
思考与练习
第14章 基于语料库的对外汉语词典编纂
14.1字头收字范围
14.2例句用字范围
14.3释义用字范围
14.4字头义项
思考与练习
附:527个释义用字
参考文献
扩展阅读文献