句法分析树标注集ROOT:要处理文本的语句IP:简单从句NP:名词短语VP:动词短语PU:断句符,通常是句号、问号、感叹号等标点符号LCP:方位词短语PP:介词短语CP:由‘的’构成的表示修饰性关系的短语DNP:由‘的’构成的表示所属关系的短语ADVP:副词短语ADJP:形容词短语DP:限定词短语QP:量词短语NN:常用名词NR:固有名词NT:时间名词PN:代词VV:动词VC:是CC:不是(应该是吧!!不太确定)VE:有VA:表语形容词AS:内容标记(如:了)VRD:动补复合词事件抽取相关的句法树特点:(1)每个IP下面通常包含NP、VP和PU(标点符号);(2)一个IP下也可包含几个IP从句;(3)IP下也可包含LCP(方位短语):(4)LCP(方位词短语)下必包含LC(方位词),有时候也包含IP或NP、VP等;(5)PP(介词短语)下必包含P(介词),有时候也包含IP或NP、VP等;(6)CP(由“的构成表示修饰性关系的短语)下必包含DEC(的),通常代表修饰性信息,有时候其下也包含IP;(7)DNP(由“的构成表示所属关系的短语)下必包含DEG(的),通常代表修饰性信息;(8)ADVP(副词短语)通常代表修饰性信息;(9)ADJP(形容词短语)通常代表修饰性信息;(10)DP(限定词短语)通常代表修饰性信息;(11)QP(量词短语)通常代表修饰性信息;(12)语句中省略PU(标点符号)时,会生成与句子语义不一致的句法树。判断是否包含事件的规则:(1)存在一个IP,若其下包含VP,通常可确定一个事件,否则反之:(2)若一个IP下包含其他IP,对包含的所有IP使用规则(1)来判断事件的有无,各个IP确定的事件间存在一定的关系;(3)当LCP下包含IP时,可根据规则(1)来判断事件的有无;(4)当PP下包含IP时,可根据规则(1)来判断事件的有无;(5)当CP下包含IP时,可根据规则(1)来判断事件的有无;确定事件元素信息的规则为:(1)IP下面包含的VP中通常包含事件的谓语动词和客体信息,IP下面包含的NP通常包含事件的主体信息;(2)NP下通常包含NN(常用名词)、NR(固有名词)、NT(时间名词)、DP、PN(代词)、DNP、CP、ADJP、QP、NP等:在NP下包含NR、NN时,优先取后面的NN所代表的词作为事件主体或客体信息,在不包含NN的情况下,取NR代表的词作为事件主体或客体信息;NP只包含CP时,取CP下的NN代表的词和DEC代表的词共同作为事件主体或客体信息;(3)VP下通常包含VV(动词)、VC(是)、VE(有)、VA(表语形容词)、AS(内容标记,如:了)、VRD(动补复合词)、VP、NP、PP、QP、ADVP等,VV、VC、VE、VA、VRD所代表的词通常作为事件的谓语动词信息;VP下包含的NP也是非常重要的信息,尤其是VV后面的NP,通常包含事件的客体信息;(4)一个IP中,当VP下包含VE或VC,并且包含QP时,取QP所代表的词作为事件客体信息。(5)一个IP中,当VP下只包含QP时,将原语句中省略的VC(是)作为事件的谓语动词信息,取QP所代表的词作为事件客体信息。