hnc两类延伸对词汇语义学的贡献ppt

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

HNC两类延伸对词汇语义学的贡献池毓焕2007.10.24目次1.传统词汇语义学关于词义关系的描写2.HNC两类延伸概貌3.与传统词义关系的比较4.对偶性表示的发展5.运用一、传统词汇语义学关于词义关系的描写Lexicalrelation:•Inclusion(hypernym-hyponym)•special:meronymy•Sameness(synonymy)•Opposition(antonymy)•:complementaryopposites//gradableantonym(contrary)//relationalopposition——K.M.Jaszczolt:SemanticsandPragmaticsWordNetv2.1建设规模•同义集Synset:囊括了117,597个同义集。WordNet描述的最基本的语义关系就是同义关系。•同义之外的语义关系对:定义了373,330对。构成不同的其他语义关系定义于同义集之上。1.名词同义集,包括上下位(hypernym-hyponym)、整体-部分(holonym-meronym,再分成员、成份和构件三子类)、反义(antonym)、属性(attribute)、派生(derivational)及话题(topic)、区域(region)和语用(usage)等;2.动词同义集,增加了制约(entailment)、因果(cause)、参见(alsosee)、群组(verbgroup)四类;3.形容词同义集,增加了相似(similarto)、分词(participleofverb)、附着(pertaintonoun)三类。•义项数:207,016个,其中单义词128,321个、多义词27,006个。WordNetv2.1定义的话题Topic定义了427个话题,如WordNet、Zen、Tao、Aristotle等。通过定义6534个话题成员关系而把分布在不同语义场中的相关词语通过话题联系在一起。有6322个同义集是话题成员=有187个同义集是多个话题的共有成员,如passenger(5)、rally(4)、winger(4)、bishop(3)等。话题拥有成员数排名前六位的是:法律(595)、军事(371)、化学(205)、计算机科学(194)、希腊神话(191)和生物学(170);34.19%话题只有一个成员,而网球话题虽有11个成员,但仍未包括网球手、网球场、网、拍等内容。WordNetv2.1定义的区域Zone共定义了161个区域名称同义集、1327个区域关系对。拥有成员数排名前六位的是:英国(518)、美国(70)、法国(49)、日本(34)、苏格兰(30)和希腊(29),垫底的诸如纽约、新疆、沙特、波斯等共86个区域只拥有一个成员。中国的成员数是21,包括:阴、阳、气、风水、针灸、春卷、文化大革命、红卫兵、法轮功、鸭绿江、杭州、贝聿铭等。WordNet试图把有中国特色的特定词语与中国相联系,但毛泽东、周恩来、北京、上海、长江、黄河等等并未定义中国区域关系,可见实际上是挂一漏万。WordNet目标定位顾名思义,WordNet的基本单位是英语单词,英语词汇中的各种语义关系构成一个网络,对其进行描述就成了WordNet的基本工作。WordNet小心翼翼地坚守Word阵地,既不深入到义素分析中的义原(primitive)或概念,也不扩展到超越单词层面的脚本(script)或框架(frame),甚至要与传统词典(dictionary)或义类辞典(thesaurus)划清界限。对WordNet的简评•把名词//动词//形容词//副词分作四个单独的库,而其他词类置之不理,这不是对语言空间的全面描述。•词汇义项动辄上十万,要描述其中的关系,如果关系类型又是几十上百种,数据规模有失控的危险。•有关Usage//Topic//Zone的定义,仍视作语义关系之一种,已有脚本(script)或框架(frame)的影子,但从现有的量上看还是缺得太多。•对词义关系的分类要服务于应用,而WordNet的理论基础是朴素的,没有相应的理论架构支撑。二、HNC两类延伸概貌大类子类小类或说明符号表示实例数第一类延伸对偶性第一//二类对偶m;n//ekm;ekn79//616对比性从小到大//反之ckm;ckn//dkm183包含性离散、完全可分-0|67第二类延伸交织性顺序型//一主两翼型//三种特殊类型t=9-b;αβγ467并列性(含根概念的特例)\k=b(\k=0-b)392定向性广义作用//广义效应3//7//i4403%28%8%3%20%17%19%1%1%第一类对偶第二类对偶对比包含交织并列定向非反前挂HNC两大类延伸分布图示第一类对偶示例00m吸引与排斥;0099m合成与分解;10m确定过程与随机过程;10n连续过程与离散过程;12m源与流;20m跨、入、出;31m出现与消失;32m利与害;33m显隐;34m增与减;343m提高与降低;35m改动、立、破;36m推动与抑制;37m界、连、断,37n卡通阻;38m选存弃;3am获得与付出;3bm积累与消耗;j71m黑氏对偶;j72m主要与次要,j72n基元与伴生;j73m特殊与一般;j74m本质与表象,j74n客观与主观;j75m泛指与特指,j75n随机与确定;j76m一、同、异;j77m轮廓、简单、复杂,j77n复合、纯、杂;……对比性示例•ckmxjw11c7m赤橙黄绿青蓝紫j10aac4m春夏秋冬j40c3m小型、中型、大型j51c4m差中良优10bc5m幼少青中老a41e22ac4m尉校将帅a71c31c6m小学一至六年级a71c33c22c4m大一至大四a72^e2m7c3m学士、硕士、博士……•ckn50a(c2n)c3n//a20979c3n贫穷、中产、富裕a219\24*tc3n农业、工业、后工业时代的医用器具制造a219\26c3n冷兵器、热兵器、超力兵器;50ac2n物质和精神生活1079c2n渐变与突变30abc2n//a02c2n实现的预备阶段和正式施行阶段509e55d2n强壮与虚弱q731c2n业余与专业比赛•dkm137d3m确定、可预测、不可预测的趋向与转化j00dkm伯仲叔季//公侯伯子男j11bd3m现代、近代、古代40i9d2m亲疏或近远843d3m认定、约定、规定a00e45d2m干部与职工•c01:a123ea2c01最低层a50\kc01法规pj2*c01部落j417c01下限jl12c01偶然•d01:a123ea1d01最高层a50d01宪法a56be21d01极刑j417d01上限jl12d01必然包含性示例•pj2-行政区划pj2-0省pj2-00县pj2-000乡pj2-0000村•54-体结构54-0面结构54-00线结构54-000点结构•j20-空间体j20-0空间面j20-00空间线j20-000空间点•a41e229-兵团a41e229-0军a41e229-00师a41e229-000团a41e229-0000营a41e229-00000连•j12bc31-时j12bc31-0分j12bc31-秒•j40-全体j40-0局部j40-00个体•j42d01广义范围j42d01-0狭义范围三、与传统词义关系的比较承继部分:•上下位、整体-部分=层次性、包含性•近义、反义=对比性、对偶性区别部分:•基于概念,概念是本体•数字化,以符号表示不同类别•从层次性中凸出包含性•对偶性的巨大发展HNC是最大的综合•黄先生几次提及上一个千僖年由托马斯·阿奎那和司各脱完成的大综合以及奥卡姆剃刀之后哲学和科学从神学中独立出来;•2005年武大讲演后回答提问时说:“HNC能管多少年?我估计至少能管一千年。”•HNC理论吸纳了菲尔墨的格语法、乔姆斯基的语言深层结构理论、奎廉的语义网络理论、山克的概念从属理论之精华,同时吸收了训诂学的理论和方法,是以汉语为基础,适合各种语言的自然语言理解理论。•HNC理论吸纳了乔姆斯基的UG理论、菲尔墨的格语法、奎廉的语义网络理论、山克的概念从属理论之精华,同时吸收了训诂学的理论和方法,并融古今中外各种哲学思想于一炉,是以汉语为基础、适合各种语言的自然语言理解理论。四、对偶性的发展对对立统一学说的发展有两点:第一、需要区别对称//对立//对抗。对称,不存在很明显的利益冲突,共存才和谐。对立,基本上利益有冲突,但可以同存,即共同体是存在的。对抗,你死我活的、利益没法平衡,具有不可共存性。这三种层面的区分是划分出非黑氏对偶的第一个思考。第二、黑格尔提到对立面转化。过去人们常把对立统一和转化混为一谈。转化是对抗从一种状态变成另一种状态。存在双重对立//两两对立的情况,其中一种是转化的结果(经常可以转化)。这种情况需要区别表达。深化对偶性概念的动因“在进行主体基元概念延伸结构设计过程中发现有三类概念需要特别表述:在作用效应链中,作用和效应由黑氏对偶已经描述得相当好(状态比较简单),而过程、转移和关系需要采取大量的非黑氏对偶。这是一种启示:人们过去首先面对的是作用和效应,而对过程、转移的思考没那么深,这也是两千年思想发展史到黑格尔仍未能突破对立统一思想的原因所在。”最早想到的某个概念仅用对立统一描述不够而设计的非黑氏对偶放在前面(从e0到e7),其后集中于过程、转移和关系的思考。非黑氏对偶的符号是ekm//ekn,最后把k归结为十二类,即k=0-be0m和e0n:(取值:m=1-3//n=5-7)•特点:e0m//e0n不存在统一体。•内容:分别描述两重对立的两种转化。•说明:e0m描述1与2是对立的,双方妥协的结果是3。e0m描述了转化的一种状态,即双方由对立转化到不对立的状态。例如:合作与对抗,双方妥协(矛盾的转化)即放弃对抗,就形成了某种合作,实际上有三种态度,第三种作为折衷并不是统一体。在这里,不是某一方转化,而是双方转化后的状态,不好说与原来是否对立。e0n描述5与6是对立的,7是由6转化来,与5不对立,并必与6对立。所以还是以5为参照点。其中确有甲乙双方:甲方对乙方对抗态度,乙方对甲方也是对抗态度,是相互对抗,而乙方转化了,不与甲方对抗了,转化后的乙方态度与转化前是对立的。最典型的例子是“侵略//抵抗//投降”,7与5不对立,而与6对立。•例子:43e0m合作、对抗、妥协a13ie0m推翻//保卫现政权、妥协a143e0m国际合作、对抗、妥协b32e0m挑战、应战、逃避40ibe0n制伏、抗拒、屈服a15e0n侵略、抗战、投降j77e0n简明、琐碎、系统e1m和e1n:(取值:m=0-2//n=5-6)•特点:描述同一对象//同一件事情,只是站在不同的参照点。•说明:e1m和e1n的差别在前者存在对立统一体0,后者没有4。例如:“上坡//下坡”,其中“坡”是对立统一体。没有区分对称//对立//对抗,可以对称而不对立。又如“上台//下台”以e1n表述。•例子:20be92e1m到和来249e1m//a228e1m买和卖40ibe1m同化与消融563e1m//a10e269e1m压迫与被压迫a10e26be1m//a2097be1m统治与被统治a10e26ae1m剥夺与被剥夺a2097ae1m剥削与被剥削a43ae1m俘获和投降a43e1m攻占与陷落b30e1m胜败平249e1n借与贷40i97ae1n主与伴4513e1n雇用与受雇54-0e21e1n凸面与凹面53a01ae45e1n招聘与应聘a01bte1n支付与领取a02eb1e1n布置与承担a02eb33e1n检查与被查a11e1n上台、下台a123e2me1n收税与纳税a13ie01e1n起义与暴乱a13ie02e1n镇压与抗争a13ie03e1n招抚与归顺a15e05te1n征服与被征服a22ae1n出租与租入a24\1e21e22e1n取款a24\1e22e21e1n贷款a413e2me1n征召与参军//退伍与复员a56be1n胜诉与败诉a59a3e1n绑架与被绑架a59ab\ke

1 / 32
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功