-1-自考02331数据结构重点总结(最终修订)第一章概论1.瑞士计算机科学家沃思提出:算法+数据结构=程序。算法是对数据运算的描述,而数据结构包括逻辑结构和存储结构。由此可见,程序设计的实质是针对实际问题选择一种好的数据结构和设计一个好的算法,而好的算法在很大程度上取决于描述实际问题的数据结构。2.数据是信息的载体。数据元素是数据的基本单位。一个数据元素可以由若干个数据项组成,数据项是具有独立含义的最小标识单位。数据对象是具有相同性质的数据元素的集合。3.数据结构指的是数据元素之间的相互关系,即数据的组织形式。数据结构一般包括以下三方面内容:数据的逻辑结构、数据的存储结构、数据的运算①数据的逻辑结构是从逻辑关系上描述数据,与数据元素的存储结构无关,是独立于计算机的。数据的逻辑结构分类:线性结构和非线性结构。线性表是一个典型的线性结构。栈、队列、串等都是线性结构。数组、广义表、树和图等数据结构都是非线性结构。②数据元素及其关系在计算机内的存储方式,称为数据的存储结构(物理结构)。数据的存储结构是逻辑结构用计算机语言的实现,它依赖于计算机语言。③数据的运算。最常用的检索、插入、删除、更新、排序等。4.数据的四种基本存储方法:顺序存储、链接存储、索引存储、散列存储(1)顺序存储:通常借助程序设计语言的数组描述。(2)链接存储:通常借助于程序语言的指针来描述。(3)索引存储:索引表由若干索引项组成。关键字是能唯一标识一个元素的一个或多个数据项的组合。(4)散列存储:该方法的基本思想是:根据元素的关键字直接计算出该元素的存储地址。5.算法必须满足5个准则:输入,0个或多个数据作为输入;输出,产生一个或多个输出;有穷性,算法执行有限步后结束;确定性,每一条指令的含义都明确;可行性,算法是可行的。算法与程序的区别:程序必须依赖于计算机程序语言,而一个算法可用自然语言、计算机程序语言、数学语言或约定的符号语言来描述。目前常用的描述算法语言有两类:类Pascal和类C。6.评价算法的优劣:算法的正确性是首先要考虑的。此外,主要考虑如下三点:①执行算法所耗费的时间,即时间复杂性;②执行算法所耗费的存储空间,主要是辅助空间,即空间复杂性;③算法应易于理解、易于编程,易于调试等,即可读性和可操作性。以上几点最主要的是时间复杂性,时间复杂度常用渐进时间复杂度表示。7.算法求解问题的输入量称为问题的规模,用一个正整数n表示。8.常见的时间复杂度按数量级递增排列依次为:常数阶0(1)、对数阶0(log2n)、线性阶0(n)、线性对数阶0(nlog2n)、平方阶0(n2)立方阶0(n3)、…、k次方阶0(nk)、指数阶0(2n)和阶乘阶0(n!)。9.一个算法的空间复杂度S(n)定义为该算法所耗费的存储空间,它是问题规模n的函数,它包括存储算法本身所占的存储空间、算法的输入输出数据所占的存储空间和算法在运行过程中临时占用的存储空间。第二章线性表1.数据的运算是定义在逻辑结构上的,而运算的具体实现是在存储结构上进行的。2.只要确定了线性表存储的起始位置,线性表中任意一个元素都可随机存取,所以顺序表是一种随机存取结构。3.常见的线性表的基本运算:(1)置空表InitList(L)构造一个空的线性表L。(2)求表长ListLength(L)求线性表L中的结点个数,即求表长。(3)GetNode(L,i)取线性表L中的第i个元素。(4)LocateNode(L,x)在L中查找第一个值为x的元素,并返回该元素在L中的位置。若L中没有元素的值为x,则返回0值。(5)InsertList(L,i,x)在线性表L的第i个元素之前插入一个值为x的新元素,表L的长度加1。(6)DeleteList(L,i)删除线性表L的第i个元素,删除后表L的长度减1。4.顺序存储方法:把线性表的数据元素按逻辑次序依次存放在一组地址连续的存储单元里的方法。顺序表(SequentialList):用顺序存储方法存储的线性表称为顺序表。顺序表是一种随机存取结构,顺序表的特点是逻辑上相邻的结点其物理位置亦相邻。顺序表中结点ai的存储地址:LOC(ai)=LOC(a1)+(i-1)*c1≤i≤n,-2-5.顺序表上实现的基本运算:(1)插入:该算法的平均时间复杂度是O(n),即在顺序表上进行插入运算,平均要移动一半结点(n/2)。在第i个位置插入一个结点的移动次数为n-i+1(2)删除:顺序表上做删除运算,平均要移动表中约一半的结点(n-1)/2,平均时间复杂度也是O(n)。删除第i个结点移动次数为n-i6.采用链式存储结构可以避免频繁移动大量元素。一个单链表可由头指针唯一确定,因此单链表可以用头指针的名字来命名。①生成结点变量的标准函数p=(ListNode*)malloc(sizeof(ListNode));//函数malloc分配一个类型为ListNode的结点变量的空间,并将其首地址放入指针变量p中②释放结点变量空间的标准函数free(p);//释放p所指的结点变量空间③结点分量的访问方法二:p-﹥data和p-﹥next④指针变量p和结点变量*p的关系:指针变量p的值——结点地址,结点变量*p的值——结点内容7.建立单链表:(1)头插法建表:算法:p=(ListNode*)malloc(sizeof(ListNode));①//生成新结点p-data=ch;②//将读入的数据放入新结点的数据域中p-next=head;③head=p;④(2)尾插法建表:算法:p=(ListNode*)malloc(sizeof(ListNode));①//生成新结点p-data=ch;②//将读入的数据放入新结点的数据域中if(head==NULL)head=p;//新结点插入空表elserear-next=p;③//将新结点插到*r之后rear=p;④//尾指针指向新表尾(3)尾插法建带头结点的单链表:头结点及作用:头结点是在链表的开始结点之前附加一个结点。它具有两个优点:⒈由于开始结点的位置被存放在头结点的指针域中,所以在链表的第一个位置上的操作就和在表的其它位置上操作一致,无须进行特殊处理;⒉无论链表是否为空,其头指针都是指向头结点的非空指针(空表中头结点的指针域空),因此空表和非空表的处理也就统一了。头结点数据域的阴影表示该部分不存储信息。在有的应用中可用于存放表长等附加信息。具体算法:r=head;//尾指针初值也指向头结点while((ch=getchar())!='\n'){s=(ListNode*)malloc(sizeof(ListNode));//生成新结点s-data=ch;//将读入的数据放入新结点的数据域中r-next=s;r=s;}-3-r-next=NULL;//终端结点的指针域置空,或空表的头结点指针域置空以上三个算法的时间复杂度均为O(n)。8.单链表上的查找:(带头结点)(1)按结点序号查找:序号为0的是头结点。算法:p=head;j=0;//从头结点开始扫描while(p-next&&ji){//顺指针向后扫描,直到p-next为NULL或i=j为止p=p-next;j++;}if(i==j)returnp;//找到了第i个结点elsereturnNULL;//当i0或i0时,找不到第i个结点时间复杂度:在等概率假设下,平均时间复杂度为:为n/2=O(n)(2)按结点值查找:具体算法:ListNode*p=head-next;//从开始结点比较。表非空,p初始值指向开始结点while(p&&p-data!=key)//直到p为NULL或p-data为key为止p=p-next;//扫描下一结点returnp;//若p=NULL,则查找失败,否则p指向值为key的结点时间复杂度为:O(n)9.插入运算:插入运算是将值为x的新结点插入到表的第i个结点的位置上,即插入到ai-1与ai之间。s=(ListNode*)malloc(sizeof(ListNode));②s-data=x;③s-next=p-next;④p-next=s;⑤算法的时间主要耗费在查找结点上,故时间复杂度亦为O(n)。10.删除运算r=p-next;②//使r指向被删除的结点aip-next=r-next③;//将ai从链上摘下free(r);④//释放结点ai的空间给存储池算法的时间复杂度也是O(n).p指向被删除的前一个结点。链表上实现的插入和删除运算,无须移动结点,仅需修改指针。11.单循环链表—在单链表中,将终端结点的指针域NULL改为指向表头结点或开始结点即可。判断空链表的条件是head==head-next;12.仅设尾指针的单循环链表:用尾指针rear表示的单循环链表对开始结点a1和终端结点an查找时间都是O(1)。而表的操作常常是在表的首尾位置上进行,因此,实用中多采用尾指针表示单循环链表。判断空链表的条件为rear==rear-next;13.循环链表:循环链表的特点是无须增加存储量,仅对表的链接方式稍作改变,即可使得表处理更加方便灵活。若在尾指针表示的单循环链表上实现,则只需修改指针,无须遍历,其执行时间是O(1)。-4-具体算法:LinkListConnect(LinkListA,LinkListB){//假设A,B为非空循环链表的尾指针LinkListp=A-next;//①保存A表的头结点位置A-next=B-next-next;//②B表的开始结点链接到A表尾free(B-next);//③释放B表的头结点B-next=p;//④returnB;//返回新循环链表的尾指针循环链表中没有NULL指针。涉及遍历操作时,其终止条件就不再是像非循环链表那样判别p或p->next是否为空,而是判别它们是否等于某一指定指针,如头指针或尾指针等。在单链表中,从一已知结点出发,只能访问到该结点及其后续结点,无法找到该结点之前的其它结点。而在单循环链表中,从任一结点出发都可访问到表中所有结点,这一优点使某些运算在单循环链表上易于实现。14.双向链表:双(向)链表中有两条方向不同的链,即每个结点中除next域存放后继结点地址外,还增加一个指向其直接前趋的指针域prior。①双链表由头指针head惟一确定的。②带头结点的双链表的某些运算变得方便。③将头结点和尾结点链接起来,为双(向)循环链表。15.双向链表的前插和删除本结点操作①双链表的前插操作voidDInsertBefore(DListNode*p,DataTypex){//在带头结点的双链表中,将值为x的新结点插入*p之前,设p≠NULLDListNode*s=malloc(sizeof(DListNode));//①s-data=x;//②s-prior=p-prior;//③s-next=p;//④p-prior-next=s;//⑤p-prior=s;//⑥}②双链表上删除结点*p自身的操作-5-voidDDeleteNode(DListNode*p){//在带头结点的双链表中,删除结点*p,设*p为非终端结点p-prior-next=p-next;//①p-next-prior=p-prior;//②free(p);}//③与单链表上的插入和删除操作不同的是,在双链表中插入和删除必须同时修改两个方向上的指针。上述两个算法的时间复杂度均为O(1)。16.顺序表和链表比较时间性能:a、线性表:经常性的查找;b、链式存储结构:经常插入删除操作;空间性能:a、对数据量大小事先能够知道的用线性表;b、数据量变化较大的用链式存储结构。存储密度越大,存储空间的利用率越高。显然,顺序表的存储密度是1,链表的存储密度肯定小于1。第三章栈和队列1.栈称为后进先出(LastInFirstOut)的线性表,简称为LIFO表。栈是运算受限的线性表,顺序栈也是用数组表示的。进栈操作:进栈时,需要将S->top加1,①S->top==StackSize-