单词的检索与计数

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

内江师范学院计算机科学学院数据结构课程设计报告课题名称:文本文件单词的检索与计数姓名:学号:专业班级:软件工程系(院):计算机科学学院设计时间:20XX年X月X日设计地点:成绩:数据结构课程设计报告11.课程设计目的(1).训练学生灵活应用所学数据结构知识,独立完成问题分析,结合数据结构理论知识,编写程序求解指定问题。(2).初步掌握软件开发过程的问题分析、系统设计、程序编码、测试等基本方法和技能;(3).提高综合运用所学的理论知识和方法独立分析和解决问题的能力;(4).训练用系统的观点和软件开发一般规范进行软件开发,巩固、深化学生的理论知识,提高编程水平,并在此过程中培养他们严谨的科学态度和良好的工作作风。2.课程设计任务与要求:文本文件单词的检索与计数软件任务:编写一个文本文件单词的检索与计数软件,程序设计要求:1)建立文本文件,文件名由用户键盘输入2)给定单词的计数,输入一个不含空格的单词,统计输出该单词在文本中的出现次数要求:(1)、在处理每个题目时,要求从分析题目的需求入手,按设计抽象数据类型、构思算法、通过设计实现抽象数据类型、编制上机程序和上机调试等若干步骤完成题目,最终写出完整的分析报告。前期准备工作完备与否直接影响到后序上机调试工作的效率。在程序设计阶段应尽量利用已有的标准函数,加大代码的重用率。(2)、设计的题目要求达到一定工作量(300行以上代码),并具有一定的深度和难度。(3)、程序设计语言推荐使用C/C++,程序书写规范,源程序需加必要的注释;(4)、每位同学需提交可独立运行的程序;(5)、每位同学需独立提交设计报告书(每人一份),要求编排格式统一、规范、内容充实,不少于8页(代码不算);(6)、课程设计实践作为培养学生动手能力的一种手段,单独考核。3.课程设计说明书一需求分析3.1串模式匹配算法的设计要求在串的基本操作中,在主串中查找模式串的模式匹配算法——即求子串位置的函数Index(S,T),是文本数据结构课程设计报告2处理中最常用、最重要的操作之一。所谓子串的定位就是求子串在主串中首次出现的位置,又称为模式匹配或串匹配。模式匹配的算法很多,在这里只要求用最简单的朴素模式匹配算法。该算法的基本思路是将给定子串与主串从第一个字符开始比较,找到首次与子串完全匹配的子串为止,并记住该位置。但为了实现统计子串出现的个数,不仅需要从主串的第一个字符位置开始比较,而且需要从主串的任一给定位置检索匹配字符串,所以,首先要给出两个算法:1.标准的朴素模式匹配算法2.给定位置的匹配算法3.2文本文件单词的检索与计数的设计要求要求编程建立一个文本文件,每个单词不包含空格且不跨行,单词由字符序列构成且区分大小写;统计给定单词在文本文件中出现的总次数;检索输出某个单词出现在文本中的行号、在该行中出现的次数以及位置。该设计要求可分为三个部分实现:其一,建立文本文件,文件名由用户用键盘输入;其二,给定单词的计数,输入一个不含空格的单词,统计输出该单词在文本中的出现次数;其三,检索给定单词,输入一个单词,检索并输出该单词所在的行号、该行中出现的次数以及在该行中的相应位置。1.建立文本文件2.给定单词的计数3.检索单词出现在文本文件中的行号、次数及其位置4.主控菜单程序的结构二概要设计2.1建立文本文件定义一个串变量,定义文本文件,输入文件名,打开该文件,循环读入文本行,写入文本文件,关闭文件。2.2给定单词的计数逐行扫描文本文件。匹配一个,计数器加1,直到整个文件扫描结束;然后输出单词的次数2.3检索单词出现在文本文件中的行号、次数及其位置逐行扫描文本文件。扫描一个单词,单词数加1,匹配一个,计数器加1,输出该单词数,行数到底,以此,行数加1,单词数清零,直到整个文件扫描结束;然后输出单词的次数,行号,第几个单词。三详细设计朴素模式匹配算法该算法的基本思想是:设有三个指针——i,j,k,用i指示主串S每次开始比较的位置;指针j,k分别指示主串S和模式串T中当前正在等待比较的字符位置;一开始从主串S的第一个字符(i=0;j=1)和模式T的第一个字符(k=0)比较,若相等,则继续逐个比较后续字符(j++,k++)。否则从主串的下一个字符(i++)起再重新和模式串(j=0)的字符开始比较。依此类推,直到模式T中的所有字符都比较完,而且一直相等,数据结构课程设计报告3则称匹配成功,并返回位置i;否则返回-1,表示匹配失败。顺序串的模式匹配算法如下:intindex(SStringS,SStringT){//求子串T在主串S中首次出现的位置inti,j,k,m,n;m=T.length;//模式串长度赋mn=S.length;//目标串长度赋nfor(i=0;i=n-m;i++){j=0;k=i;//目标串起始位置i送入kwhile(j=m&&s.ch[k]==t.ch[j]){k++;j++;}//继续下一个字符的比较if(j==m)//若相等,则说明找到匹配的子串,返回匹配位置i,//否则从下一个位置重新开始比较returni;}//endforreturn-1;}//endIndex给定位置的串匹配算法该算法要求从串S1(为顺序存储结构)中第k个字符起,求出首次与字符串S2相同的子串的起始位置。该算法与上面介绍的模式匹配算法类似,只不过上述算法的要求是从主串的第一个字符开始,该算法是上述算法的另一种思路:从第k个元素开始扫描S1,当其元素值与S2的第一个元素的值相同时,判定它们之后的元素值是否依次相同,直到S2结束为止。若都相同,则返回当前位置值;否则继续上述过程,直至S1扫描完为止,其实现算法如下:IntPartPosition(SStringS1,SStringS2,intk){inti,j;i=k-1;//扫描s1的下标,因为c中数组下标是从0开始,串中序号相差1j=0;//扫描s2的开始下标while(is1.length&&js2.length)if(s1.ch[i]==s2.ch[j]){i++;j++;//继续使下标移向下一个字符位置}else{i=i-j+1;j=0;//使i下标回溯到原位置的下一个位置,使j指向s2的第一个字符,再重新比较}if(j=s2.length)returni-s2.length;//表示s1中存在s2,返回其起始位置elsereturn-1;//表示s1中不存在s2,返回-1}//函数结束说明:以上两个算法可统一为一个算法,即在子串定位算法Index(S,T)的参数中增加一个起始位置参数即可。数据结构课程设计报告4建立文本文件建立文件的实现思路是:(1)定义一个串变量;(2)定义文本文件;(3)输入文件名,打开该文件;(4)循环读入文本行,写入文本文件,其过程如下:While(不是文件输入结束){读入一文本行至串变量;串变量写入文件;输入是否结束输入标志;}(5)关闭文件。给定单词的计数该功能需要用到前一节中设计的模式匹配算法,逐行扫描文本文件。匹配一个,计数器加1,直到整个文件扫描结束;然后输出单词出现的次数。其实现过程如下:(1)输入要检索的文本文件名,打开相应的文件;(2)输入要检索统计的单词;(3)循环读文本文件,读入一行,将其送入定义好的串中,并求该串的实际长度,调用串匹配函数进行计数。具体描述如下:While(不是文件结束){读入一行并到串中;求出串长度;模式匹配函数计数;}(4)关闭文件,输出统计结果。检索单词出现在文本文件中的行号、次数及其位置这个设计要求与上一个类似,但要相对复杂一些。其实现过程描述如下:(1)输入要检索的文本文件名,打开相应的文件;(2)输入要检索统计的单词;(3)行计数器置初值0;(4)while(不是文件结束){读入一行到指定串中;求出串长度;行单词计数器置0;调用模式匹配函数匹配单词定位、该行匹配单词计数;行号计数器加1;If(行单词计数器!=0)输出行号、该行有匹配单词的个数以及相应的位置;数据结构课程设计报告5}运行主控程序主控菜单程序的结构要求内容如下:(1)头文件包含;(2)菜单选项包括:1.建立文件2.单词计数3.单词定位4.退出程序(3)选择1——4执行相应的操作,其他字符为非法。四调试分析与测试结果4.1未输入文件前的页面4.2输入文本文件数据结构课程设计报告64.3文本单词汇总4.4单词定位数据结构课程设计报告7五用户手册该软件界面简洁,操作简单,运行程序后根据提示就可完成相关操作。六附录(源程序清单)#includestdio.h#includestdlib.h#includestring.h#defineLIST_INIT_SIZE500/*线性表存储空间的初始分配量*/#defineLISTINCREMENT10/*线性表存储空间的分配增量*/#defineFILE_NAME_LEN20/*文件名长度*/#defineWORD_LEN20/*单词长度*/#defineMaxStrSize256#definellength110/*规定一行有110个字节*/#defineMaxStr258#defineWORD21typedefstruct{charch[MaxStr];/*ch是一个可容纳256个字符的字符数组*/intlength;数据结构课程设计报告8}string;/*定义顺序串类型*/typedefstruct{charword[WORD];/*存储单词,不超过20个字符*/intcount;/*单词出现的次数*/}elem_type;typedefstruct{elem_type*elem;/*存储空间基址*/intlength;/*当前长度*/intlistsize;/*当前分配的存储容量*/}sqlist;intsqlist_init(sqlist*sq,elem_type*et){sq-elem=et;sq-length=0;return0;}intsqlist_add(sqlist*sq,elem_type*et,char*word){inti;intj;for(i=0;isq-length;i++){/*当前单词与加入的单词相同,直接统计,不做插入*/if(strcmp(et[i].word,word)==0){et[i].count++;return0;}if(strcmp(et[i].word,word)0){break;}}if(sq-length==LIST_INIT_SIZE){printf(空间不足,单词[%s]插入失败\n,word);return0;}for(j=sq-length;ji;j--){memcpy(et+j,et+j-1,sizeof(elem_type));数据结构课程设计报告9}sq-length++;strcpy(et[i].word,word);et[i].count=1;return0;}intsqlist_count(sqlist*sq,elem_type*et){inti,j=0;for(i=0;isq-length;i++)j=j+et[i].count;returnj;}intcreat_text_file(){elem_typew;sqlists;charfile_name[FILE_NAME_LEN+1],yn;FILE*fp;printf(输入要建立的文件名:);scanf(%s,file_name);fp=fopen(file_name,w);yn='n';/*输入结束标志初值*/while(yn=='n'||yn=='N'){printf(请输入一行文本:);gets(w.word);gets(w.word);s.length=strlen(w.word);fwrite(&w,s.length,1,fp);fprintf(fp,%c,10);/*是输入换行*/printf(结束输入吗?yorn:);yn=getchar();}fclose(fp);/*关闭文件*/printf(建立文件

1 / 15
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功