第一章、软件工程学概述软件危机:是指在计算机软件的开发和维护过程中所遇到的一系列严重问题。软件危机包含下述两个方面的问题:1.如何开发软件,以满足对软件日益增长的需求。2.如何维护数量不断膨胀的已有软件。具体的说,软件危机主要有以下一些典型表现:1.对软件开发成本的进度的估计常常很不准确。2.用户对“已完成的”软件系统不满意的现象经常发生3.软件产品的质量往往靠不住。4.软件常常是不可维护的。5.软件通常没有适当的文档材料。6.软件成本在计算机系统总成本中所占的比例逐年上升。7.软件开发生产率提高的速度,远远跟不上计算机应用迅速普及深入的趋势。软件生命周期:一个软件从定义、开发、使用和维护,知道最终被废弃,要经历一个漫长的时期,通常把软件经历的这个漫长的时期称为生命周期。软件配置:程序、文档和数据。软件工程学的一个重要的目标:就是提高软件的可维护性,减少软件维护的代价。软件:是程序、数据及相关文档的集合。程序:是能够完成预定功能和性能的可执行的指令序列。数据:是使程序能够适当地处理信息的数据结构。文档:是开发、使用和维护程序所需要的图文资料。软件工程:指导计算机软件开发和维护的一门工程学科。软件工程具有下属的本质特性:1.软件工程关注于大型程序的构造。2.软件工程的中心课题是控制复杂性。3.软件经常变化。4.开发软件的效率非常重要。5.和谐地合作是开发软件的关键。6.软件必须有效地支持它的用户。7.在软件工程领域中通常由具有一种文化背景的人替具有另一种文化背景的人创造产品。软件工程的7条基本原理:1.用分阶段的生命周期计划严格管理。2.坚持进行阶段评审。3.实行严格的产品控制4.采用现代程序设计技术。5.结构应能清楚的审查。6.开发小组的人员应该少而精。7.承认不断改进软件工程实践的必要性。软件工程:包括技术和管理两方面的内容,是技术与管理紧密结合所形成的工程学科。通常把在软件生命周期全过程中使用的一整套技术方法的集合称为方法学,也称为泛型。软件工程方法学(包括传统方法学、面向对象方法学)包含三个要素:方法、工具和过程。方法:是完成软件开发的各项任务的技术方法,回答“怎样做”的问题。工具:是为运用方法而提供的自动的或半自动的软件工程支撑环境。工程:是为了获得高质量的软件所需要完成的一系列任务的框架,它规定了完成各项任务的工作步骤。面向对象方法学:把数据和行为看成是同等重要的,它是一种以数据为主线,把数据和对数据的操作紧密地结合起来的方法。面向对象方法学具有下述四个要点:1.把对象作为融合了数据及在数据上的操作行为的统一的软件构件。2.把所有对象都划分成类。3.按照父类与子类的关系,把若干个相关类组成一个层次结构的系统。4.对象彼此间仅能通过发送消息互相联系。面向对象方法学的优点:降低了软件产品的复杂性,提高了软件的可理解性,简化了软件的开发和维护工作。软件生命周期:软件定义、软件开发和运行维护。软件定义:问题定义、可行性研究和需求分析。软件开发:总体设计,详细设计,编码和单元测试,综合测试。1.问题定义:问题定义阶段必须回答的关键问题是:“要解决的问题是什么?”。2.可行性研究:这个阶段回答的关键问题是:“对于上一个阶段所确定的问题有行得通的解决办法吗?”3.需求分析:确定目标系统必须具备哪些功能。4.总体设计:这个阶段必须回答的关键问题是:“概括地说,应该怎样实现目标系统?”总体设计又称为概要设计。5.详细设计:这个阶段应回答的关键问题是:“应该怎样具体地实现这个系统呢?”6.编码和单元测试:这个阶段的关键任务是写出正确的容易理解、容易维护的程序模块。7.综合测试:这个阶段的关键任务是通过各种类型的测试使软件达到预定的要求。8.软件维护:关键任务是通过各种必要的维护活动使系统持久地满足用户的需要。软件工程过程:是为了获得高质量软件所需要完成的一系列任务的框架,它规定了完成各项任务的工作步骤。生命周期模型:规定了把生命周期划分成哪些阶段及各个阶段的执行顺序,因此,也称为过程模型。生命周期模型包括:瀑布模型、快速原型模型、增量模型、螺旋模型、喷泉模型、瀑布模型的特点:1.阶段间具有顺序性和依赖性。2.推迟实现的观点。3.质量保证的观点。快速原型:是快速建立起来的可以在计算机上运行的程序,它所能完成的功能往往是最终产品能完成功能的一个子集。增量模型:它分批地逐步向用户提交产品,整个软件产品被分解成许多个增量构件,开发人员一个构件一个构件地向用户提交产品。螺旋模型:基本思想是使用原型及其他方法来尽量降低风险。理解这种模型的一个简单方法,是把它看作在每个阶段之前都增加了风险分析过程的快速原型模型。(使用于内部开发的大规模软件项目)喷泉模型:是典型的面向对象的软件过程模型之一。面向对象方法学的四个要点:面向对象方法=对象+类+继承+用消息通信第二章、可行性研究可行性研究的目的:就是用最小的代价在尽可能短的时间内确定问题是否能够解决。必须记住,可行性研究的目的不是解决问题,而是确定问题是否值得去解决。对每种解法都应该仔细研究它的可行性,一般说来,至少应该从下述3个方面研究每种解法的可行性:1)技术可行性2)经济可行性3)操作可行性可行性研究最根本的任务:是对以后的行动方针提出建议。典型的可行性研究有下述一些步骤:1.复查系统规模和目标。2.研究目前正在使用的系统3.导出新系统的高层逻辑模型4.进一步定义问题5.导出和评价供选择的解法6.推荐行动方针7.草拟开发计划8.书写文档提交审查。系统流程图:是概括性地描绘物理系统的传统工具,它的基本思想是用图形符号以黑盒子形式描绘组成系统的每个部件。系统流程图表达的是数据在系统各部件之间流动的情况,而不是对数据进行加工处理的控制过程,因此尽管系统流程图的某些符号和程序流程图的符号形式相同,但是它却是物理数据流图而不是程序流程图。数据流图:是一种图形化技术,它描绘信息流和数据从输入移动到输出的过程中所经受的变幻。数据存储是处于静止状态的数据,数据流是处于运动中的数据。数据流图的基本要点:是描绘“做什么”,而不考虑“怎么做”。为数据流命名:1)名字应代表整个数据流的内容,而不是仅仅反映它的某些成分。2)不要使用空洞的、缺乏具体含义的名字。3)如果在为某个数据流起名字时遇到了困难,则很可能是因为对数据流图分解不恰当造成的,应该试试重新分解,看是否能克服这个困难。画数据流图的基本目的是利用它作为交流通信的工具。数据字典:是关于数据的信息的集合,也就是对数据流图中包含的所有元素的定义的集合。数据字典的作用:在软件分析和设计的过程中给人提供关于数据的描述信息。系统的逻辑模型:由数据流图和数据字典共同构成,没有数据字典,数据流图就不严格,然而没有数据流图,数据字典也难于发挥作用。数据字典应该由对下列4类元素的定义组成:数据流、数据流分量、数据存储和处理。由数据元素组成数据的方式只有下述3种基本类型:顺序、选择、重复和可选。数据字典最主要的用途:就是作为分析阶段的工具。成本/效益分析的目标:正式要从经济角度分析开发一个特定的新系统是否划算,从而帮助客户组织的负责人正确地做出是否投资于这项开发工程的决定。系统流程图:实质上是物理流程图,它描绘组成系统的主要物理元素以及信息在这些元素间流动和处理的情况。第三章、需求分析需求分析的任务是:准确地回答“系统必须做什么”这个问题。需求分析方法应遵循的准则:1.必须理解并描述问题的信息域,根据这条准则应该建立数据模型。2.必须定义软件应完成的功能,这条准则要求建立功能模型。3.必须描述作为外部事件结果的软件行为,这条准则要求建立行为模型。4.必须对描述信息、功能和行为的模型进行分解,用层次的方式展示细节。通常对软件系统有以下几方面的综合要求:1.功能需求2.性能需求3.可靠性和可用性需求4.出错处理需求5.接口需求6.约束7.逆向需求8.将来可能提出的要求软件系统本质上是信息处理系统,而任何信息处理系统的基本功能都是把输入数据转变成需要的输出信息。需求分析的目标之一:就是把数据流和数据存储定义到元素级。快速建立软件原型是最准确、最有效、最强大的需求分析技术。快速原型就是快速建立起来的旨在演示目标系统主要功能的可运行的程序。快速原型应该具备的特性:1.快速2.容易修改模型:就是为了理解事务而对事务做出的一种抽象,是对事务的一种无歧义的书面描述。通常,模型由一组图形符号和组织这些符号的规则组成。需求分析过程应该建立三种模型:数据模型(实体-联系图)、功能模型(数据流图)和行为模型(状态转换图)。概念数据模型:是一种面向问题的数据模型,是按照用户的观点对数据建立的模型。它描述了从用户角度看到的数据,它反应了用户的现实环境,而且与在软件系统中的实现方法无关。数据模型中包含3中相互关联的信息:数据对象、数据对象的属性及数据对象彼此间相互连接的关系。数据对象:是对软件必须理解的复合信息的抽象。复合信息:是指具有一系列不同性质或属性的事物,仅有单个值的事物不是数据对象。属性:定义了数据对象的性质。联系:数据对象彼此之间相互连接的方式称为联系,也称为关系。联系可分为以下三种类型:一对一,一对多和多对多。第一范式:每个属性值都必须是原子值,即仅仅是一个简单值而不含内部结构。第二范式:满足第一范式条件,而且每个非关键字属性都由整个关键字决定。第三范式:符合第二范式的条件,每个非关键字属性都仅由关键字决定,而且一个非关键字属性不能仅仅是对另一个非关键字属性的进一步描述。状态转换图:通过描绘系统的状态及引起系统状态转换的事件,来表示系统的行为。事件:是在某个特定时刻发生的事情,它是对引起系统做动作或从一个状态转换到另一个状态的外界事件的抽象。IPO图:是输入、处理、输出图的简称,能方便地描绘输入数据、对数据的处理和输出数据之间的关系。模块:在程序中是数据说明、可执行语句等程序对象的集合,或者是单独命名和编址的元素,在软件的体系结构中,模块是可组合、分解和更换的单元。第四章、形式化说明技术按照形式化的程度,可以把软件工程使用的方法划分成:非形式化、半形式化和形式化3类形式化方法:是描述系统性质的基于数学的技术,也就是说,如果一种方法有坚实的数学基础,那么它就是形式化的。矛盾:指一组相互冲突的陈述。二义性:是指读者可以用不同方式理解的陈述。不完整性:可能是在系统规格说明中最常遇到的问题之一。形式化规格说明技术的优点:形式化的规格说明技术可以用数学方法研究、验证。此外,形式化的规格说明消除了二义性,而且它鼓励软件开发工程过程的早期阶段使用更严格的方法,从而可以减少差错。第五章、总体设计总体设计的基本目的:就是回答“概括地说,系统应该如何实现”这个问题,因此总体设计又称为概要设计或者初步设计。总体设计的另一项重要任务是:设计软件的结构,也就是要确定系统中每个程序是由哪些模块组成的,以及这些模块相互间的关系。在详细设计之前先进行总体设计的必要性:可以站在全局高度上,花较少成本,从较抽象的层次上分析对比多种可能的系统实现方案和软件结构,从中选出最佳方案和最合理的软件结构,从而用较低成本开发较高质量的软件系统。总体设计过程通常由两个主要阶段组成:系统设计阶段,确定系统的具体实现方案;结构设计阶段,确定软件结构。典型的总体设计过程包括下述9个步骤:1.设想供选择的方案2.选取合理的方案3.推荐最佳方案4.功能分解5.设计软件结构6.设计数据库7.制定测试计划8.书写文档9.审查和复审模块:是由边界元素限定的相邻程序元素的序列,而且有一个总体标识符代表它。模块化:就是把程序划分成独立命名且可独立访问的模块,每个模块完成一个子功能,把这些模块集成起来够成一个整体,可以完成指定的功能满足用户的需求。抽象:抽出事物的本质特性而暂时不考虑它们的细节。逐步求精:为了能集中精力解决主要问题而尽量推迟对问题细节的考虑。为什么模块独立很重要呢?主要有两条理由:第一,有效的模块化的软件比较容易开发出来。第二,独立的模块比较容易测试和维护。模块的独立程度可以由两个定性标准度量,这两个标准分别称为内聚和耦合。耦合:是对一个