- 49.00 KB
- 2022-08-11 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
研究理论语言学与计算语言学中的依存语法 依存语法是法国语言学家Tesnière在其1959年出版的着作《结构句法基础》(Élémentsde syntaxestructurale)中提出的一种语法理论。因此,Tesnière也被称为现代依存语法之父(冯志伟,2010)。《结构句法基础》一书在出版后被译为德语、西班牙语和意大利语等多种语言,但由于没有英文版的译作,依存语法并没有短语结构语法的影响范围广泛。依存语法认为句法结构是由词与词之间的依存关系构成的,依存关系的种类包括主语-谓语、谓语-宾语和限定词-名词等。依存关系中的中心词支配附属词,因此是一种非对称的二元关系。依存语法没有短语结构语法中的句法成分概念,换言之,依存语法中的非终极符和终结符都由词构成。依存语法的上述特性适合于描述和解释德语、俄语、捷克语和汉语等语序比较灵活的语言(Nuges,2006),因此,近年来基于依存语法的语言对比和类型学研究逐渐增多(Liu,2013)。同时,由于依存语法较之短语结构语法更为简洁,更加适合用计算机建立语言模型,计算语言学的很多研究都借助依存语法进行自动信息提取和语义标注。 一、理论语言学视角下的依存语法 \n 理论语言学视角下的依存语法流派众多,但大多以Tesnière的研究为基础,对依存关系的表层语法结构和深层语义结构进行扩展,并试图在两者间建立联系。Tesnière(1959)通过分析世界上的60多种自然语言指出句法是以动词为中心的词与词之间的关联(connection),这种关联可以由图式(stemma)来表示。下面笔者通过图1来说明如何用图式来描述自然语言中的关联 图1是一个简单的法语句子,Alfred吃了一个苹果的图式。Tesnière指出,语句的理解和产出是一个在线性/一维顺序和结构/二维层次之间的转化过程。线性顺序是指语言表面都是按线性顺序排列的,但我们在理解和产出的过程中可能涉及一些更抽象层面的关系,也就是图1所示词与词之间的层级关系。这些层级关系有上下左右之分,构成了一个二维结构。同时,图示中的层级关系具有方向性,由中心词支配附属词。Tesnière认为图示中处于顶点的支配词是句子的谓语,谓语可以统领句子中的其他成分如行动元和状态元。行动元指完成动作的必选成分,比如句子的主语和宾语,行动元的数目可以有一个、两个或三个;状态元指完成动作的可选成分,比如状语,也有学者将其称为可自由添加的成分. 通过行动元和状态元的划分可以看出Tesnière的关联理论强调了句法和语义的密切联系。实际上,Tesnière更关注语义层面的关联,这一点在他提出的转位概念中最为明显。转位是指实义词在特定的句法关系中通过功能词变换词性的过程。如在句子Marylovestodrink.中,动词drink通过to转换为名词。通过这一转换过程后可以很容易得到动词love的论元结构:love(Mary,drink).Tesnière提出的关联理论是依存语法的原型,该理论对句法-语义界面的重视影响了后续依存语法的研究。 二、计算语言学视角下的依存语法 与理论语言学不同,计算语言学视角下的依存语法研究侧重于依存语法的形式化研究。为了便于依存语法的形式化描述,计算语言学家经常使用图来构建句子中的依存关系。这里所说的图是一种在计算机中存储数据的结构,由两部分组成:节点集合V(G)和弧集合E(G)。依存语法中的词可以用图的节点表示,词与词之间的依存关系可以用弧表示。 下面笔者通过图2来说明如何用节点和弧来描述依存关系。 图2是句子Hel;bler,S.MarinovandE.Marsi.MaltParser:Alanguage-independentsystemfordata-drivendependencyparsing[J].NaturalLanguageEngineering,2007,(2):95-135. [3]Nugues,P.M.AnIntroductiontoLanguageProcessingentsdesyntaxestructurale[M].Paris:Klincksieck,1959. [5]冯志伟.自然语言处理的形式模型[M].合肥:中国科学技术大学出版社,2010. [6]刘海涛.依存语法的理论与实践[M].北京:科学出版社,2009.