本科生毕业论文论文题目DOM在网页制作自动阅卷中的应用作者姓名专业名称计算机科学与技术班级指导教师导师职称i目录Abstract.........................................................................................................................................................4第1章引言............................................................................................................................................5第2章网页文档对象研究.....................................................................................................................52.1DOM...........................................................................................................................................52.2MSHTML组件及常用对象分析...............................................................................................6第3章综述............................................................................................................................................7第4章基于文档对象模型的网页制作自动阅卷的实现.....................................................................8第5章应用举例....................................................................................................................................95.1题型设计及阅卷分析...............................................................................................................95.2编码实现..................................................................................................................................11第6章结论..........................................................................................................................................12ii图索引图2-16图5-1...................................................................................................................................................10iii表索引表2-164摘要本文从文档对象模型的角度对网页文档格式进行了研究,并在此基础上给出了基于文档对象获取的网页制作题自动阅卷方案,弥补了以往用文本匹配方式进行阅卷在知识点定位及取值过程中的不足。关键词:文档对象、自动阅卷、MSHTML对象模型、网页AbstractWetreatedthehypertextdocumentformatintheDOM(DocumentObjectModel)convention,andintroducedadocumentobjectacquisitionbasedautomaticgradingmethodforautomaticexaminingbasedonwebpages,overcomethedefficienciesoftheformertextmatchinggradingmethodduringtheprocessesofknowledgelocationandsampling.Keywords:documentobject,automaticexamining,MSHTMLObjectModel,webpages5DOM在网页制作自动阅卷中的应用第1章引言随着互联网的发展,网络已成为人们继电视、报纸等传统媒体之后获取信息的主要途径,而网页在其中又扮演了信息载体的主要角色,于是掌握网页制作的基本技术便成了新时代的必修课。相应的,网页制作技术的无纸化考查及自动化阅卷亦成为教育界一个不断探索的领域。本文就其中的自动阅卷技术进行探讨,并给出一个方便可行的解决方案。目前为止对网页基本技术的考查以考生对静态网页进行编辑为主要方式,因此阅卷的过程其实是对考生生成的结果HTML文件进行检查的过程,看其是否符合标准答案,而HTML文件实质是一个半结构化的文本文件,所以早期的网页制作自动阅卷是纯文本处理,即以文本匹配的方式来进行答案验证。由于HTML语法结构的不严格及参与样式设置的Css的多样性使得阅卷定位及答案识别成了阅卷中的难点。文献[参考文献1]提出了参数配置法,即对于每个阅卷点通过参数配置的形式给出在文档中的位置及属性。该方法虽然一定程度上解决了阅卷定位和答案识别问题,但是对于每一题都要进行知识点属性和范围的设置不仅多出了人工配置的环节,而且为了落实知识点所在单元位置,要求相关人员必须清楚每个文档的细节,事实上由于学生操作的不可预测性,这点往往很难做到,因此该方法不能从根本上解决阅卷定位和答案识别问题。文献[参考文献2]提出基于对象的比较方法,即首先对HTML文档进行预处理,将常用网页元素以对象的形式封装起来,阅卷时只需给定知识点对象,然后对其属性进行一一比较即可。此方法较文献[参考文献1]中少了人工干预,在答案比较的过程中数据结构也清晰明确,但由于知识点对象是在预处理时通过遍历HTML文档,根据HTML语言标志分析得到,也同样存在文档分析和知识点准确定位的问题。通过考察Office系列中Word、Excel、PowerPoint等操作题的阅卷方式发现采用Office自带的文档对象模型识别文档中的元素不仅定位准确而且获取对象的属性值也相当容易。借鉴此法,我们发现HTML文档也存在类似的对象模型DOM,并且可以通过MSHTML组件来访问此模型中的对象,进而解析HTML文档中的元素。如此,只要了解DOM的基本结构及MSHTML组件中与HTML常用元素对应的对象即可通过对象访问技术来实现网页制作题的自动阅卷。第2章网页文档对象研究2.1DOMDOM(DocumentObjectModel)即文档对象模型,,是针对HMTL和XML的基于树的应用程序接口(API)。[参考文献3]它提供了一种结构化的文档表示方式,把网页中的元素抽象成一系列相互关联的对象,并以树型结构来反应网页中各对象的层级关系,开发人员便可通过该层次结构轻松地访问指定信息。图所示即为一个简单HTML文档的对象树。6图2-12.2MSHTML组件及常用对象分析MSHTML是微软公司在IE4.0时引入的主要用于HTML解析的一个COM组件,以DOM为核心思想,该组件将HTML语言中的所有标记元素封装成了相应的对象模型,通过该组件提供的标准接口,便可直接操作对象本身及其相关的属性和方法。表列举了MSHTML在HTML文档对象访问上的一些常用对象及属性:对象对应HTML标记常用属性HTMLDocumentIHTMLBodyElementbodybgColor,backgroundIHTMLFontElemenfontcolor,size,face,alignIHTMLHRElementhrColor,width,Align,SizeIHTMLImgElementimgsrc,align,width,height,IHTMLLinkElementlinkhrefIHTMLMarqueeElementmarqueebgColor,loop,directionIHTMLStylestyleColor,fontSize,fontFamilyIHTMLTabletablerows,background,bgColor,alignIHTMLTableCelltd,thbackground,colSpan,bgColor,borderColor,width,height,IHTMLTitleElementtitletext表2-1(1)其中HTMLDocument是HTML文档对象模型中的顶级对象,代表了一个HTML文档,可以通过该对象的createDocumentFromUrl方法来获得当前文档的HTMLDocument对象,通过getElementsByTagName方法返回具有给定HTML标记名称(如FONT或TABLE)的网页元素对象。(2)IHTMLBodyElement对应于HTML文档中body元素,可以用它来设置或读取网页页面属性,如网页背景颜色、背景图片、上下左右边距等。(3)IHTMLFontElement对应于HTML文档中的字体元素,可以通过该对象设置或获取字体属性,如文字的颜色、字号、字体等。(4)IHTMLHRElement对应于HTML文档中的水平线,据此可以设置或读取水平线的格式信息,如颜色、宽度、对齐方式等。(5)IHTMLImgElement对应于HTML文档中图片元素,可以用它来设置或读取图片属性,如图片的来源、对齐方式、长宽比例等。(6)IHTMLLinkElement对应于HTML文档中的超级链接,可以通过该对象来设置或获取文档documentheadhtmlbodytitletablephrfont7中超级链接相关属性,如链接目标地址等信息。(7)IHTMLMarqueeElement对应于HTML文档中的滚动字幕,可以通过它设置或返回滚动字幕属性,如背景颜色、循环资料、滚动方向等。(8)IHTMLStyle对应于HTML文档中的样式信息,据此可以设置和获取文档中相关元素的样式。(9)IHTMLTable和IHTMLTableCell分别对应于HTML文档中表格和单元格元素,结合使用IHTMLTableRow、IHTMLTableCol对象,可以设置和获取表格相关的属性信息,如表格的长、宽、背景、边框样式、行列数,单元格合并情况等。(10)IHTMLTitleElement对应于HTML文档标题,通过它的text属性可以设置和获取网页标题。具体用法参见应用举例。此外,IHTMLElement也是一个常用的集合对象,代表网页中指定标记的集合,通过这个集合对象也可以得到网页上特定标记的内容。IHTMLElement有4个主要属性:①InnerText:开始标记和结束标记之间的文本;②lnnerHTML:开始标记和结束标记之间的文本和HTML;③OuterText:对象的文本;④OuterHTML:对象的文本