当前位置 —论文政治— 范文

关于语言学相关论文范文检索,与基于美国当代英语语料库同义词辨析相关论文查重软件

本论文是一篇关于语言学相关论文查重软件,关于基于美国当代英语语料库同义词辨析相关开题报告范文。免费优秀的关于语言学及语料库及英语学习方面论文范文资料,适合语言学论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

摘 要:英语中有大量同义词,对英语学习者来说,区分有难度,而对区分同义词的研究涉及较少.利用语料库中的语料来自真实语境以及其数据可客观反映语言现象等特点,本研究拟通过美国当代英语语料库,基于数据,从词语使用语域,共现搭配两个方面对同义词进一步区分.以一组同义词gloomy和sad为例,发现这组同义词在不同的语域中分布频率不同,具有各自的语域分布倾向;在共现搭配中,该组同义词的常用搭配不同,呈现出不同的语义,从而丰富了同义词语的含义.研究还发现基于语料库对于同义词辨析非常有效.

关 键 词:同义词;美国当代语料库;语域;共现搭配

一、引言

同义词的英语为synonym,源自希腊语,是指意思相同但形式不同的两个或以上的词语.英语中包含了许多同义词.据统计,“英语语言中同义词、近义词的数量约占总词汇量的60%以上”.(贺晓东,2003)然而,尽管英语中同义词众多,意义完全一致的词却十分少,绝大多数的同义词是“彼此又有细微的语义差别或具有不同文体色彩的词”.(蒋磊,1998)而同义词辨析是英语学习的难点,亟待解决.

目前,对同义词的辨析主要通过语义学视角,语体学视角和语料库语言学视角.(王家义,2011)“语料库突出特点是所包含的语言真实,数据量庞大.”(梁茂成,李文中,许家金,2011)语料库中的例句均来自真实语境,并且数量多,涵盖面广,并通过一定的统计手段,可以真实客观的反映语言现象.而语料库语言学随着计算机技术的发展和应用而兴起,以实证和数据为基础,为同义词的辨析提供了新的研究思路.本文将沿着语言库语言学的研究方法,以同义词组gloomy和sad为例,辨析其语义差别.

本研究采用的是美国当代英语语料库(以下简称COCA),其词汇量高达3.6亿.它是美国最新当代英语语料库,也是当今世界最大的英语平衡语料库,为使用者提供充足的自然语言文本,保证了本研究的真实可靠.

二、研究方法

“语言中的概率信息是其最本质的重要信息.”(卫乃兴,2011)本研究是基于语料库对同义词进行辨析的研究,将着重分析同义词的概率等所蕴含的信息.结合梁茂成等在《语料库应用教程》中对语料库词语辨析方法的概括,“对语料库进行分析,得到各种词语搭配和结构在语料库中的出现频率、使用场合、语体等等信息”.(梁茂成,李文中,许家金,2011)综合本研究的研究重点及语料库的研究方法,将从语域,搭配这两个方面对同义词进行辨析.

(一)语域分析

1.理论基础.“以韩礼德为代表的系统――功能学派特别强调语境,即语言发生的环境.他们认为语言在一定的语境中发生,并在一定的语境中被理解或得到解释.”(张德禄,1987)语境是指词语的情境使用范围,即语域.不同的语域具有不同的特点.分析同义词不同语域分布情况,可以得出词语的语域倾向.2.COCA语料分析.在COCA语料库中,由五个子语料库组成,他们分别是口语、小说、杂志、报纸、学术期刊.口语中的语料主要来自于美国的广播公司和有线电视,广播和电视作为公共媒体,其语言有既大众化又有一定的规范性.小说的语言一般由于其体裁的多样性,其使用的语境较为复杂.杂志作为公开发行物,其语言一般较为正式,同时又通俗易懂.学术期刊因为其专业性,一般要求语言精确,客观,简明.3.具体分析方法.在分析目标词的使用语境时,通过COCA语料库检索,可以得到目标词在不同语域的分布情况.例如,在语料库出输入outraged一词,用图表(chart)功能显示,可以得到其在不同语域的分布情况,如图1所示.Section表示不同语域,All表示所有领域,SpokenFic

关于基于美国当代英语语料库同义词辨析的开题报告范文
关于语言学相关论文范文检索
tionMagazineNewspaperAcademic分别表示口语,小说,流行杂志,报纸,学术期刊.FREQ是frequency的缩写,代表出现的次数,为实际频数,PERMIL代表permillion,即表示目标词在该语料库每一百万词中出现的次数,即标准化的频数.实际频数因为来自于不同的语料库,直接比较其大小没有多少意义,一般比较标准化的频数,在此项研究中,主要比较PERMIL这行的数据.Seeallsub-sectionsatonce是该语料库的一个功能,表示可以同时看到所有的子语料库.


大学生如何写语言学论文
播放:21544次 评论:5786人


本篇论文出处 http://www.sxsky.net/zhengzhi/050434988.html

图1outraged在COCA中不同语域分布情况

(二)共现搭配词分析

1.理论依据.“语料库的研究表明,词项的搭配行为显示出一定的语义趋向:一定的词项会习惯性地吸引某一类具有相同语义特点的词项,构成搭配.”(卫乃兴,2002)同义词不同的搭配,可以看出同义词不同的语义趋向,呈现出某种特征.运用语料库进行检索,需要考虑的问题包括选取多大范围作为词语的语境,以何标准筛选出具有代表性的搭配行为.参考卫乃兴的阐述“跨距长度界定要视所研究文本题材领域(topicfield)等诸多影响词语使用特点的因素而定.一般来说,将跨距界定为一4/十4或一5/+5是适宜”.(卫乃兴,2002)“MI值(MutualInformationScore,共现信息值)是指在一个语料库中共现的两个单词,一个单词出现的频数能够预测或提供另一个单词出现的概率.MI值越大,说明两个词的搭配强度也越高.语料库的词语搭配研究中通常把MI值等于或大于3的词作为显著搭配词.”(金朋荪,李京徽,2011)MI值用来计算两个词之间,当一个词出现,另一个词出现的概率.如果概率越大,则说明两个词共同出现的概率也越大,当MI值大于3时,可将这两个词定义为显著搭配词.

由此可以看出,以节点词选取跨距为4,即选取节点词左边和右边4个词语作为该节点词的语境,以MI值(共现信息值)大于3来选取节点词的共现搭配词较为合适.2.具体研究方法.在分析节点词的共现搭配词时,通过检索COCA语料库,以目标词为节点词,左右跨距为4,共现频率大于10,得到检索结果.按MI值从大到小排列,并选出MI值大于3的词语作为常用搭配词,拟通过分析常用搭配词的特点,旨在分析其语义特征.具体操作为在词语(word)处输入节点词,搭配栏(Collocate)左右为四,分类(Sorting)选择相关性(relevance).三、基于COCA语料库对gloomy和sad语义差异分析

词典释义

在《柯林斯高阶英汉双解词典》中,gloomy,sad的解释分别如下:Gloomy:Ifpeoplearegloomy,theyareunhappyandhavenohope;Sad:Ifyouaresad,youfeelunhappy,usuallybecausesomethinghashappenedthatyoudonotlike.根据以上解释,这两个词都含有“unhappy”的意思;而他们的细微差别是gloomy强调没有希望而使人不高兴,sad则侧重于因与人意愿不一致而引起的不高兴.词典上对词语的解释侧重在对词义的区分,而对词语的使用语境,搭配行为涉及较少.卫乃兴在其《词语学》中讲到“词汇有其规约性的搭配行为,每个词都有其典型的或最频繁共现的组合伙伴”[11](卫乃兴,2011).可见词语的搭配行为可以丰富词语意义,并且呈现出某种特征.来看该词典给出的例句:Millers

1 2

关于语言学相关论文范文检索,与基于美国当代英语语料库同义词辨析相关论文查重软件参考文献资料:

政治实事论文

政治性论文

政治论文初中

初中政治论文发表

政治哲学论文

企业政治论文

形式与政治论文

高中政治职称论文

政治本科论文

八年级政治论文

基于美国当代英语语料库同义词辨析WORD版本 下载地址