指针1指针是什么1.1指针是一类数据类型的统称对于C语言来说,计算机的内存由连续的字节(byte)构成。这些连续的字节同样被连续地编上了号码以相互区别,这个号码就是所谓的地址(Address),如图9-1所示。图9-1内存单元与地址指针(Pointer)是C语言中的一类数据类型的统称。这种类型的数据专门用来存储和表示内存单元的编号,以实现通过地址得以完成的各种运算。这样看来指针似乎就是地址,然而,事实上却并非如此。后面将会看到,地址只是指针内涵中的一部分,甚至只是一小部分内容而远非其全部。片面地把地址理解为指针的全部,永远学不好指针。为了使得语言具有广泛的适用性,C语言标准允许编译器自行选择指针类型数据的长度。在不同的编译环境下,指针数据类型的长度可能不同;甚至相同的编译环境中不同的指针数据类型,也可能有不同的大小。为了叙述的方便,本书中的指针数据类型一律假设为具有32bit的长度。这样并不影响对指针本质的描述,但涉及指针数据类型长度的代码(极少)在不同的编译环境中可能具有不同的结果,这点请读者加以注意。C语言同样不规定地址这种内存单元的编号在内存中的存储格式,但在现实中目前这种编号多数是与二进制的unsignedint数据类型的存储格式一样,这是本章的另一个假定。这意味着程序可以访问的内存的大小最大为2的32次方(4GB)。但这绝对不意味着指针类型等同于unsignedint数据类型,因为它们的运算规则截然不同。1.2指针是派生数据类型指针数据类型和数组、结构体、联合体等一样,也是一种派生数据类型(DerivedTypes)。也就是说,指针数据类型是一种借助其他数据类型构造出来的数据类型。对于任何类型,都可以构造出与之相对应的指针数据类型。因此指针数据类型实际上有无穷多种。没有纯粹的指针,正如同没有纯粹的数组一样。数组是在其他数据类型的基础上构造出来的,指针也必须与其他数据类型一道才能构成自己。指针让人感到比较复杂的原因之一在于,各种不同类型的指针都有自己的运算规则,尽管它们都被叫做指针。这一点请特别留意,不同类型的指针有不同的运算种类和不同的运算规则。综上所述,每一种特定的指针类型都是一种派生数据类型,其值表示某个内存单元的地址,其用途是完成与地址有关的计算。1.3指针是一类数据的泛称当某个数据的数据类型是指针时,通常也简称这个数据是一个指针。很显然,在这里“指针”具有“名词”的含义。而指针表示“数据类型”含义时,显然具有“形容词”的意味。这种“一词多用”的现象,对于熟悉C语言特点的人来说并不值得大惊小怪,C语言本身也是这样的。比如,“[]”既可以作为类型说明符也可以作为运算符。1.4指针专用的类型说明符—“*”数组这种构造性的数据类型有自己特定的类型说明符—“[]”,这种类型说明符用于定义数组或描述数组名的类型。结构体和联合体数据类型特定的类型说明符分别是关键字“struct”和“union”。指针也有自己的特定的类型说明符—“*”。和仅靠“[]”无法完成数组的描述一样,指针也需要“*”与其他的类型说明符一道才能完成对指针类型的完整描述。由于“其他的类型说明符”有无限多种,所以指针的类型也有无限种可能。可以构造出“int*”类型的指针、“char*”类型的指针、“double*”类型的指针、“void*”类型的指针……。指针的一个重要特点是,它总是和另外一种数据类型联系在一起的。1.5指针的分类尽管有无穷多种指针类型,但从指针所关联的数据类型方面看,指针可以分为3类:指向数据对象的指针(ObjectPointer)、指向函数的指针(FunctionPointer)、指向虚无的指针(“void*”类型)。前两者都与内存中的实体(数据和一段函数的执行代码)有关,而“void*”类型的指针则仅仅是一个值,是纯粹的地址。“指针就是地址”这样的说法对于“void*”这种类型的指针是成立的。但对于与一段具体内存实体相关联的指针类型来说,这种说法是极其片面的,甚至片面到了几乎完全忽略了指针的本质而只剩下了指针的皮毛的地步。正确的说法是,指针的值(右值)是地址,这与“指针就是地址”是完全不同的概念。学习指针最重要的内容通常是关心指针的值以外的东西,而指针的值—下面将会看到,那几乎倒是无关紧要的。从所具有的运算方面看,这3类指针各自拥有不同的运算种类的集合。有的运算种类多些,有的少些。2指向数据对象的指针2.1什么是“数据对象”所谓“数据对象”(Object),含义如下。(1)是内存中一段定长的、以byte为基本单位的连续区域。(2)这段内存区域中的内容表示具有某种类型的一个数据。数据对象的类型不一定是简单数据类型(int、long、double等),也可以是派生类型,比如数组,甚至指针等。而所谓的“指向”(Pointerto)的含义是指针与这块具有类型含义的整体的关联。例如,对于inti;“i”可以表示它所占据的内存块,当说到某个指针指向“i”时,其确切的含义是指向“i”所占据内存的整体。显然这里提到的“i”是左值意义上的“i”。函数类型不属于数据对象。2.2一元“&”运算尽管前面各章从来没有提到指针,但实际上在前面编程的过程中已经和指针打过无数次交道了。这可能令人感到吃惊,但却是事实。比如,在调用scanf()函数输入变量值的时候,在实参中经常可以看到的“&”,实际上就是在求一个指向某个数据对象的指针。对于下面的变量定义doubled;表达式“&d”就是一个指针类型的数据,类型是“double*”,这种类型的指针被称为是指向“double”类型数据的指针。前面讲过,作为二元运算符,“&”是按位与运算。当“&”作为一个一元运算符时,要求它的运算对象是一个左值表达式(一块内存),得到的是指向这块内存(类型)的指针。而一个变量的名字的含义之一就是这个变量所占据的内存。大多数人在多数情况下关心的只是变量名的另一个含义—值,这可能是学不好指针以及C语言的一个主要原因。在此,简要地复习一下C语言的一些最基本的内容。假如有如下定义:doubled=3.0;那么,应该如何理解表达式“d=d+5.0”呢?这是一个赋值表达式,表示的确切含义是“取出变量‘d’的值与常量‘5.0’相加,然后把结果放到变量‘d’所在的内存中去”。请特别注意在赋值号“=”的左边和右边,“d”这个标识符的含义是不同的:在赋值号“=”右边的“d”表示的是“d”的值,计算机的动作是取出这个值(本质上是在运算器中建立“d”的副本),并不关心“d”存放在内存中的什么地方;而在赋值号“=”左边的“d”表示的是“d”所在的内存空间,是把一个值放入这块内存中去,后一个动作与“d”中的值没有什么关系(只是把原来的值擦除),“d”中原来有什么值都不妨碍把一个新的值放入其中,也对新的值没有任何影响。由此可见,同一个变量名确实有两种含义。针对两种不同的含义,计算机能进行的操作也不同。换句话说,对于某些运算,变量名的含义是其右值;而对于另一些运算,变量名的含义是其左值。编译器根据上下文来分辨变量名究竟是哪种含义。对于用C语言编程的人来说,不分辨清楚这两种含义就不可能透彻地理解C语言。再举个例子,在“sizeofd”这个表达式中,“d”的含义也是“d”占据的内存而不是“d”的值—无论“d”的值是多少,表达式“sizeofd”的值都为8。在表达式“&d”中,“d”的含义也是“d”所在的内存而不是“d”的值,“d”的值是多少都对“&”的运算结果没有任何影响。有一种说法称一元“&”运算是求地址运算,这种说法既是片面的,也是不严格的,同时对于学习指针有很大的负面作用。理由如下。在C语言中根本没有“地址”这种数据类型,只有“指针”数据类型,而指针的值才是一个地址。用地址即指针的值的概念偷换指针的概念,显然是以偏概全。更为严重的是,这种说法使得许多人根本就不知道“&d”是个指针,也掩盖了“&d”指向一块内存的事实,因为“&d”的值仅仅是“d”所占据的那块内存单元中第一个byte的编号。那么“&d”的值是多少呢?实际上多数情况下,尤其是对于初学者来说,根本没必要关心这个值是多少,也不可能事先知道这个值。因为为变量“d”安排存储空间是编译器的工作,编译器是根据程序运行时内存中的实际情况“随机”为变量“d”安排内存的。源程序的作者是永远不可能为变量“指定”一块特定的存储空间,同样也不可能改变“d”在内存中的存储位置。这样,“&d”就是一个既不可能通过代码被赋值也不可能通过代码被改变的值,因而是个常量,叫做指针常量,类型是“double*”。这样的常量不可以被赋值也不可以进行类似“++”、“−−”之类的运算,因为改变“&d”的值就相当于改变了变量“d”的存储空间的位置,然而这是根本不可能的。当然,在程序运行之后,具体来说是“d”的存储空间确定之后(也就是定义了变量“d”之后,因为这时“d”才开始存在),“&d”的值是确实可以知道的(其实知道了也没什么用)。如果想查看一下,可以通过调用printf()函数用“%p”格式输出(指针类型数据的输出格式是“%p”)。如下面所示。程序代码9-1#includestdio.h#includestdlib.hintmain(void){doubled;printf(%p\n,&d);system(PAUSE);return0;}这段代码的程序运行结果并不能事先确定,这和程序运行的具体环境有关。在作者的计算机上,其运行结果如图9-2所示。图9-2一元“&”运算这个运行结果表示的含义如图9-3所示。图9-3指针与地址应该注意到“d”没有被赋值,但程序没有任何问题。这再次说明了“&d”与“d”的值没有任何关系,在表达式“&d”中的“d”表示的仅仅是变量所在的内存而不是这块内存的值。一元“&”运算符的优先级和其他一元运算符(比如逻辑非“!”)一样,次于“()”、“[]”等运算符,结合性为从右向左。这个运算符叫做关联运算符(ReferencingOperator)。其确切的含义是,运算所得到与运算对象所占据的那块内存相关联的指针,其值为那块内存单元中起始byte的地址,也可以将之称为求指针运算符。大多数情况下,“&”的运算对象是一个变量名(或数组名、函数名)。但一般的,它的运算对象可以是一个表达式,只要这个表达式能够表示一块内存,比如对于数组longa[100];“a[0]”就是一个表达式,由于这个表达式既可以表示“a[0]”的值,也可以表示“a[0]”所占据的内存,所以“&a[0]”是合法的、有意义的C语言运算,结果就是一个“long*”类型的指针。而另一些表达式,比如“a[0]+3”,由于只有值(右值)的含义而不代表一块内存,所以“&(a[0]+3)”是没有意义的非法的表达式。代码中的常量,由于只有右值的含义,因而不可以进行“&”运算。比如“&5”,是没有意义的非法的表达式。对于符号常量也同样不可以做“&”运算。练习编写程序验证一下“&d”不可以被赋值也不可以进行类似“++”、“−−”之类的运算。2.3数据指针变量的定义数据指针变量的定义,是指用完整的指针类型说明符(这里所谓的“完整”是指用*和另一种完整数据类型的名称共同的意思)来说明一个变量标识符的性质,并为这个变量标识符开辟存储空间。比如:int*p_i;这样就定义了一个指向“int”类型数据的指针变量“p_i”。其中“int”是另一种数据对象的类型的名称,“*”是指针类型说明符。类似地,定义:char*p_c;double*p_d;分别被称为定义了一个指向“char类型”数据的指针变量“p_c”和定义了一个指向“double类型”数据的指针变量“p_d”。至于所谓“指向‘int’类型数据”的含义,是指:如果“p_i”的值为3456H,那么“p_i”指向的是3456H、3457H、3458H、3459H这4个字节,因为“int”类型数据占据的内存空间的大小是“sizeof(int)”,即4,如图9-4所示。图9-4数据指针类型的含义由此可见“指向‘int’类型数据”的确切含义是指向一块大小为“sizeof(int)