全国计算机等级考试二级公共基础知识第一章数据结构与算法(30%)考试大纲1.算法的基本概念;算法复杂度的概念和意义(时间复杂度与空间复杂度)。2.数据结构的定义;数据的逻辑结构与存储结构;数据结构的图形表示;线性结构与非线性结构的概念。3.线性表的定义;线性表的顺序存储结构及其插入与删除运算。4.栈和队列的定义;栈和队列的顺序存储结构及其基本运算。5.线性单链表、双向链表与循环链表的结构及其基本运算。6.树的基本概念;二叉树的定义及其存储结构;二叉树的前序、中序和后序遍历。7.顺序查找与二分法查找算法;基本排序算法(交换类排序,选择类排序,插入类排序)。知识点归纳算法的基本概念所谓算法是指解题方案的准确而完整的描述。严格来说,一个算法必须具有以下五个主要特征:可行性确定性有穷性输入输出综上,所谓算法,是一组严格定义运算顺序的规则,而且每一个规则都是有效且明确的,此顺序将在有限的次数终止。算法的基本概念算法的组成要素算法中对数据的运算和操作算法的控制结构算法设计基本方法列举法归纳法递推递归减半递推回溯法算法的复杂度算法的复杂度可分为时间复杂度和空间复杂度,是衡量算法优劣的量度。1.算法的时间复杂度算法的时间复杂度是指执行算法所需要的工作量。一般情况下,算法中的基本操作重复执行的次数是问题规模n的某个函数f(n)。算法的时间量度记作:T(n)=O(f(n)),表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称为算法的(渐进)时间复杂度。算法的复杂度何估算算法的时间复杂度?任何一个算法都是由一个“控制结构”和若干“原操作”组成的,因此一个算法的执行时间可以看成是所有原操作的执行时间之和∑(原操作(i)的执行次数×原操作(i)的执行时间)则算法的执行时间与所有原操作的执行次数之和成正比。从算法中选取一种对于所研究的问题来说是基本操作的原操作,以该基本操作在算法中重复执行的次数作为算法时间复杂度的依据。这种衡量效率的办法所得出的不是时间量,而是一种增长趋势的量度。它与软硬件环境无关,只暴露算法本身执行效率的优劣。算法的复杂度算法的空间复杂度算法的空间复杂度是指执行这个算法所需要的内存空间。空间复杂度作为算法所需存储空间的量度,记作:S(n)=O(g(n)),其中n为问题的规模,表示随问题规模的增大,算法运行所需存储量的增长率与g(n)的增长率相同。数据结构利用计算机进行数据处理是计算机应用的一个重要领域。数据结构主要研究和讨论以下三个方面的问题:1.数据集合中各数据元素之间的逻辑关系,即数据的逻辑结构。2.在对数据进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构。3.对各种数据结构进行的运算。数据的逻辑结构数据逻辑结构是对数据元素之间存在的逻辑关系的描述,它可以用一个数据元素的集合和定义在此集合上的若干关系表示。与数据在计算机中的存储位置无关,是独立于计算机的。数据的存储结构数据的存储结构是数据元素及其关系在计算机存储器中的表示。存储结构的主要内容是指在存储空间中使用一个存储结点来存储一个数据元素,在存储空间中建立各存储结点之间的关联,来表示数据元素之间的逻辑关系。常见的存储结构:顺序存储结构链式存储结构索引存储结构散列存储结构线性结构和非线性结构线性结构在数据元素的非空有限集合中,线性结构的逻辑特征如下:存在一个唯一的被称为“第一个”的数据元素存在一个唯一的被称为“最后一个”的数据元素除第一个之外,集合中的每个数据元素均有且只有一个直接前驱除最后一个之外,集合中的每个数据元素均有且只有一个直接后继非线性结构非线性结构的逻辑特征是:一个结点可能有多个直接前驱和直接后继,树和图都属于非线性结构。线性表通常以下列n个数据元素的序列”表示线性表:(a1,a2,...,ai,...,an)序列中数据元素的个数n定义为线性表的表长;n=0时的线性表被称为空表。称i为ai在线性表中的位序。线性表的顺序存储线性表的顺序存储结构用一组地址连续的存储单元依次存放线性表中的数据元素,即以“存储位置相邻”表示“位序相继的两个数据元素之间的前驱和后继的关系,并以表中第一个元素的存储位置作为线性表的起始地址,称作线性表的基地址。所有数据元素的存储位置均可由第一个数据元素的存储位置得到ADR(ai)=ADR(a1)+(i-1)×C↑↑基地址一个数据元素所占存储量线性表的插入和删除运算插入运算是指在线性表的某个指定位置增加一个新结点。一般情况下,要在第i(1≤i≤n)个元素之前插入一个新元素时,首先要从最后一个元素开始,直到第i个元素之间共n-i+1个元素依次向后移动一个位置,然后将新元素插入到第i项。删除运算是指撤销结构中的某个结点。一般情况,要删除第i(1≤i≤n)个元素,要从第i+1个元素开始,直到第n个元素,共n-i个元素依次向前移动一个位置。栈栈是限定仅在表的一端进行插入和删除操作的线性表。允许插入和删除的一端称为栈顶,另一端称为栈底。栈顶元素总是最后被插入的元素,从而也是最先被删除的元素;栈底元素总是最先被插入,也是最后被删除的元素。因此,栈是一种后进先出的线性表。通常用指针top指示栈顶位置,用指针bottom指示栈底位置。……a2a1an栈顶top栈底bottom入栈出栈栈的顺序存储及运算用一维数组S(1:m)作为栈的顺序存储空间,m为栈的最大容量。top=0表示栈为空,top=m表示栈满。栈的操作入栈:在栈顶位置插入一个新元素,栈顶指针top加1。退栈:取出栈顶元素并赋值给一个指定的变量,栈顶指针top减1。取栈顶元素:将栈顶元素的值赋给一个指定的变量,不删除栈顶元素,栈顶指针不变。队列队列是一种先进先出的线性表,它只允许在表的一端插入元素(队尾),在另一端删除元素(队头)。通常定义头指针front指向队头元素的前一个位置,定义尾指针rear指向队尾元素的位置。队列是一种先进先出的数据结构。向队尾插入一个元素的操作称为入队,从队头删除一个元素的操作称为退队。ABEDCF入队退队FrontRear循环队列将队列存储空间的最后一个位置绕到第一个位置,形成逻辑上的环状空间。循环队列初始状态为空,即front=rear=m。入队操作时,rear加1,若rear=m+1,则置rear=1;退队操作时,front加1,若front=m+1,则置front=1。在循环队列为空或为满时,均有front=rear,因此需要设置标志s进行区分,定义s=0表示队列为空,s=1表示队列非空。单链表线性表的链式存储结构的特点是用一组任意的存储单元(可以连续,也可以不连续)存储线性表的数据元素,为了表示每个数据元素ai与其直接后继元素ai+1之间的逻辑关系,对数据元素ai来说,除了存储其本身的信息(数据域)之外,还需要存储其后继元素的存储位置信息(指针域)。指针域中存储的信息称为指针或链,N个结点链接成一个链表,即为线性表的链式存储结构。由于结点中只包含一个指针域,故称为单链表。单链表通常以单链表中第一个数据元素的存储地址作为作为单链表的地址,称为头指针。整个链表的存储必须从头指针开始(顺序存取),头指针指示链表中第一个结点的存储位置。最后一个数据元素没有直接后继,其指针域为空。单链表的插入和删除abpxpxabpxpxabpc双向链表和循环链表在双向链表中的结点包含两个指针域,其中一个指向直接后继,另一个指向直接前驱。循环链表的特点是表中最后一个结点的指针域指向第一个结点,整个链表成为一个由链指针相链接的环。据此,从表中任一节点出发均可找到表中其它结点。在循环链表中增加了一个表头结点,其指针域指向第一个元素结点,头指针则指向头结点。HEAD…∧…∧HEAD…HEAD树及其基本概念树是一种简单的非线性结构,在树中,所有的数据元素之间具有明显的层次性关系。树是(n≥0)个结点的有限集合,在任意一棵非空树中:(1)有且仅有一个特定的结点称为根结点。(2)当n1时,其余的结点可分为m个互不相交的子集T1,T2,…Tm,其中每个有限子集本身又是一棵树,并且称为根的子树。集合为空的树简称为空树;树中的元素称为结点。树的主要术语结点的度:结点拥有的子树数。叶节点(终端结点):度为0的结点。双亲、孩子和兄弟:结点的子树的根节点称为该结点的孩子,该结点称为孩子结点的双亲结点。同一个双亲结点的孩子互称为兄弟。层次:结点的层次从根开始定义,根为第一层,根的孩子为第二层。深度:树中结点的最大层次称为树的深度或高度。二叉树二叉树是n(n≥0)个数据元素的有限集,它或为空集,或者含有唯一的称为根的元素,且其余元素分成两个互不相交的子集,每个子集自身也是一棵二叉树,分别称为根的左子树和右子树。二叉树是另一种树型结构,其特点是每个结点至多有两棵子树,并且二叉树的子树有左右之分,其顺序不能任意颠倒。二叉树的基本性质性质1在二叉树的第i层上至多有2i-1个结点(i≥1)性质2深度为k的二叉树至多有2k-1个结点(k≥1)性质3对任何一棵二叉树T,如果其终端结点数为n0,度为2的结点数为n2,则:n0=n2+1性质4具有n个结点的二叉树,其深度至少为[log2n]+1满二叉树和完全二叉树满二叉树除最后一层外,每一层上的所有结点都有两个子节点,也就是说每一层上的结点数都达到最大值,即在满二叉树的第k层上有2k-1个结点,且深度为m的满二叉树有2m-1个结点。完全二叉树除最后一层外,每一层上的结点数均达到最大值,在最后一层上只缺少右边的若干结点。具有n个结点的完全二叉树,其深度为[log2n]+1。从以上定义可知,满二叉树也是完全二叉树,反之则不然。满二叉树最大层的结点均向左靠齐完全二叉树ADCBEF二叉树的基本性质性质5如果对一棵有n个结点的完全二叉树(其深度为[log2n]+1)的结点按层序(从第1层到第[log2n]+1层,每层从左到右)从1起开始编号,则对任一编号为i的结点(1≤i≤n),则:(1)如果i=1,则编号为i的结点是二叉树的根,无双亲;如果i1,则其双亲结点parent(i)的编号是[i/2]。(2)如果2in,则编号为i的结点无左孩子(编号为i的结点为叶子结点);否则其左孩子结点lChild(i)的编号是2i。(3)如果2i+1n,则编号为i的结点无右孩子;否则其右孩子结点rChild(i)的编号是结点2i+1。二叉树的链式存储结构在二叉树的链式存储结构中,每个结点设置三个域,即数据域,左指针域和右指针域,两个指针域分别存储左右子树根节点的存储位置,即指针。L(i)V(i)R(i)LchildvalueRchild二叉树的链式存储结构FPHBGDAECFC0E0A0D0G0B00H00P011311582964BTL(i)R(i)V(i)i10P020A0346F9513G162C87811D090E510110B012130H0BT二叉树的遍历二叉树的遍历指不重复地访问二叉树的所有结点。从二叉树的结构定义得知,二叉树是由根结点、左子树和右子树三部分构成,则遍历二叉树的操作可分解为访问根结点、遍历左子树和遍历右子树三个子操作,并且由二叉树的递归定义可知,遍历左子树和遍历右子树可如同遍历二叉树一样递归进行。先序遍历二叉树中序遍历二叉树后序遍历二叉树若二叉树为空,则空操作;否则(1)访问根结点;(2)先序遍历左子树;(3)先序遍历右子树。若二叉树为空,则空操作;否则(1)中序遍历左子树;(2)访问根结点;(3)中序遍历右子树。若二叉树为空,则空操作;否则(1)后序遍历左子树;(2)后序遍历右子树;(3)访问根结点。二叉树的遍历先序遍历:ABDEGHCFIJ中序遍历:DBGEHACIJF后序遍历:DGHEBJIFCA查找查找是指在一个给定的数据结构中查找某个指定的元素。顺序查找顺序查找一般是指在线性表中查找指定元素,基本方法如下:从线性表的第一个元素开始,依次将线性表