- 19.95 KB
- 2022-08-11 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
语言学理论中依存树库的应用分析前言目前在语言知识的获得方法上已经取得了重大突破,即由传统手工方法完成了向语料庠辅助方法的过渡,进而促进了语言知识获得准确率和效率的提升,同时还能够将研究者的片而性和主观性获得,该方法使得语言学方法论和理论均取得了很大的发展。基于计算机语言学家是提出依存树库者,故而在进行研究的过程中语言学理论研究着并未重视,但是随着了解层度的加深,使得在语言学理论中依存树库被不断的应用,并且也将一定的研究成果获得。一、依存树库概述所谓的树库就是这标注了语义信息、句法、词类的语料库,在语言处理上存在困难和复杂性,因此,要想将语言知识获取,就必须将标有语言信息的语料库充分应用。目前人们将树庠作为了知识源、句法结构获得、句法分析结果评价的主要工具,并且相关研究者对其重视度也在不断增强。并且国外研究发现,树库囊括了丰富的句法分布和词类信息,是研究句法和词类的重要依据。同时还可以将语言信息从树库中抽取,在研究语言学时将树库作为重要工具。目前国内外开发了众多树库,其中以PSG句法标注和DG句法标注为主要的句法标注体系,其中前者建立的汉语短语结构树库包括了北京大学的汉语树庠、台湾中央研究院的汉语树库、清华大学的句法树库及其美国的宾州树库等。依存语法与短语结构语法对比之下,前者对于汉语句法结构的描述更适合,这主要是因为汉语中语法意义的表达主要是通过虚词和语序表示的,并且汉语的词间关系具有复杂性。然而依存树库是在依存语法的基础上标注句法体系的语料库,在描述句法结构时主要是通过将词与词之间的关系建立实现的。二、语言学理论研究中依存树库的应用1.研窕语言类型学在语言学中,语言类型学属于一门显学,其任务是总结人类语言共性及其跨语言比较。学者刘海涛研究了汉语句法的类型学特征与汉语依存树库的相关性得出,汉语中50%左右的依存关系是在不相邻词间发生,使句子中依存关系形成的两个词间平均存在着L84个词,换言之2.84就是汉语的平均依存距离。汉语属于AdjN、VO.SV型语言,还是对混合型语言。该研究结论与其他语言类型学家得出的结果具有相同性。刘明杰也研究了不同语体文本的依存树库,同时对比了英汉依存距离,并得出,英语与汉语的依存距离相比,前者更小,由此可见,依存树库对于研究语言类型学可操作性很强,能够帮助我们对汉语句法结构的特点更好从依存句法角度了解,并对人类语言普遍性的发现有利。2.研究语言中的词类高松以依存树库统冲了现代汉语动词、名词、从属词、支配词的依存关系类型,得出了动词和名词句法功能分布概率,对前人的研究结果进行了补充,同时也验证了研究结论。袁芬瑜以依存树库对英语名词的搭配进行了描述,并且将英语名词依存关系分析得出,同时还对英语名词的罕见句法、主要、次要功能进行了总结。在对前人理论检验的同时,也将改进建议提出。陈芯莹研究了虚词,资源选择为汉语依存句法树库,将复杂网络分析技术和方法运用的情况下,对汉语句法中的介词在、动态助词了和结构助词的的特点进行了研究,同时对虚词的被支配力和支配力做了计量地分析。3.研究广播电视语体语言学研究的核心领域就是语体研究,刘丙丽将实话实说、新闻联播作为了依存树库,同时还自建了两个依存树库,并将其作为资源,对口语体和书面语体不\n同句法成分的差异进行了分析,得出在口语体和书面语体中句法成分的各词类比重差异显著,同时还将不同语体中充当句法成分时各优势词类统计得出。1.研究外汉语教学依存树库对于外汉语教学中词汇教学具有重要的作用,通常使用频率及其词语搭配情况等信息与词汇教学具有密切相关性。高松的研究统计了偏误频率最高的50个错词,并将其根据错误频率进行甲、乙、丙三级划分,并将不同等级错词的配价信息在依存树库中提取,并将其制作为配价词表。其研究结果显示了在实际使用中高频错词可能出现的所有用法和情况,同时将各个用法出现的频次统计,实现了量化信息的统计,有助于外汉语词汇教学。三、依存树库对语言学理论研究的启示1.将依存树库的应用领域拓展除了将依存树库应用于计算语言学研究之外,还可将其在理论语言学研究中应用。依存树库对语言学理论研究来说,具有语言资源可靠、语言数据真实、客观的特点。时至今日,学者将依存树库应用于语言学理论研究,使用的方为主要包括了对外汉语教学研窕、电视节目语体研究、现代汉语虚词的地位研究、英语词类句法功能的计量研究及其汉语的语言类型学研究等。可见依存树库对于理论语言学研究具有有效性和可行性。要想将依存树库资源优势充分利用,就必须对语言知识深入挖掘,将语言现象发现更多,这样才能够将依存树库的应用领域不断拓展,并将其应用于语言学理论研究中。进而对语言计量更加深入、细致的研究,如语义、句法、现代汉语词类等方面,将依存树库与应用研究和语言学本体研究结合,并从不同角度挖掘,同时还可以将针对性的语言研究开展。2.对依存树库资源优势予以重视基于依存树库得天独厚的优势就是句子结构的分析和理解,依存树库富含丰富的语义、句法、词类等信息,既能将中心词信息给出,同时还能将句子中的词间关系提供。并且还可以根据研究需求完成语义描述。统计分析依存树库中抽取的数据,就能够总结成为语言学知识,对前人的研究结论检验的同时,还可将语言学理论体系中的不足弥补,将语言现象发现,将问题充分解决。当下众多学者倡导将语言学返回计算语言学,使语言学基础问题在计算语言学研究中重现,共享语言学资源。但是基于大部分依存树庠的提出和构建都不是理论语言学家,因此在语言学理论中依存树库的应用不多,多局限于计算语言学研究中。进而导致众多的理论语言学家对依存树库没有一个正确的认知和了解,进而忽视了语言学理论研究中依存树库的重要性。由此可见,语言学理论研究者必须对依存树库资源的优势充分重视,并将其应用价值不断的提升。四、结语综上所述,依存树库对于语言学理论研究具有重要的作用和意义,必须引起足够的重视,进而在此基础上,研究出更多的理论语言学成果,将依存树库作为研究者进行语言学理论研究的重要手段。