数据库的现状及发展趋势数据库是数据管理的最新技术,是计算机科学的重要分支。今天信息资源已成为各个部门的重要财富建立一个满足各级部门信息处理要求的行之有效的信息系统也成为一个企业或组织生存和发展的重要条件。因此作为信息系统核心和基础的数据库技术得到越来越广泛的应用,从小型单项事务处理系统到大型信息系统,从联机事务处理到联机分析处理,从一般企业管理到计算机辅助设计与制造,计算机集成制造系统,电子政务,电子商务地理信息系统等,越来越新的应用领域采用数据库技术来存储和处理信息资源。对于一个国家来说,数据库的建设规模,数据库信息量的大小和使用频度已成为衡量这个国家信息化程度的重要标志。数据库是长期存储在计算机内有组织的大量的共享的数据的集合。数据库系统的出现使信息系统从加工数据的程序为中心转向围绕共享的数据库为中心的新阶段。这样既便于数据的集中管理,又有利于应用程序的研制和维护,提高了数据的利用率和相容性,提高了决策的可靠性。数据库已成为现代信息系统的重要组成成分。具有数百G,数百T,甚至数百P字节的数据库已普遍存在于科学技术,工业,农业,商业,服务业和政府部门的信息系统中。数据库技术是计算机领域中发展最快的技术之一。数据库系统一般由数据库,数据库管理系统,应用系统和数据库管理员构成。数据库系统有以下的特点:数据结构化;数据的共享性高,冗余度低,易于扩充;数据独立性高;数据由DBMS统一管理和控制。数据库系统数据量都很大,加之DBMS丰富的功能使得自身的规模也很大,因此整个数据库系统对硬件资源提出了较高的要求:(1)要有足够大的内存,存放操作系统,DBMS的模块,数据缓冲区和应用程序;(2)有足够大的磁盘或磁盘阵列等设备存储数据库,有足够大的磁带或光盘作数据备份;(3)要求系统有较高的通道能力,以提高数据传送率。数据库系统的软件主要包括:(1)DBMS。DBMS为数据库的建立,使用和配置的系统软件。(2)支持DBMS运行的操作系统。(3)具有与数据库接口的高级语言及其编译系统,便于开发应用程序。(4)以DBMS为核心的应用开发工具。(5)为特定应用环境开发的数据库应用系统。数据库的人员包括:(1)数据库管理人员。具体职责是决定数据库中的信息内容和结构;决定数据库的存储结构和存取策略;定义数据的安全性要求和完整性约束条件;监控数据库的使用和运行;数据库的改进和重组重构。(2)系统分析员和数据库设计人员。分析员负责应用系统的需求分析和规范要求确定系统的硬件软件配置,并参与数据库的概要设计。设计人员负责数据库中数据的确定,数据库各级模式的设计,必须参加用户需求调查和系统分析,然后进行数据库设计。(3)应用程序员负责设计和编写应用系统的程序模块,并进行调试。(4)用户。包括复杂用户简单用户和偶然用户。考虑数据库系统的结构可以有不同的层次或不同的角度。从数据库最终用户角度看,数据库系统的结构分为单用户结构,主从结构,分布式结构,客户/服务器,浏览器/应用服务器/数据库服务器多层结构等,这是数据库的外部体系结构。从数据库管理系统角度看,数据库系统通常采用三级模式结构;这是数据库管理系统内部的系统结构。模式是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及到型的描述,不涉及到值的描述。模式的一个具体值称为模式的一个实例。同一个模式可以有很多实例。模式是相对固定的,而实例是相对变动的,因为数据库中的数据时不断更新的。模式反应映的是数据的结构和联系,而实例反映的是数据库某一刻的状态。虽然数据库管理系统产品种类很多,它们支持不同的数据模型,使用不同的数据库语言,建立在不同的操作系统之上,数据的存储结构也个不相同,但它们在体系结构上通常具有相同的特征,即采用三级模式结构(早期微机上的小型数据库系统除外)并提供两级映像功能。数据库的三级模式结构是指数据库系统由外模式,模式和内模式三级构成。一模式。模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图、它是数据库系统模式结构的中间层,既不涉及数据的物理存储细节和硬件环境,也与具体的应用程序,所使用的应用开发工具及高级语言程序设计无关。模式实际上是数据库数据在逻辑级上的视图。一个数据库只有一个模式。数据库模式以某一种数据模型为基础,综合统一的考虑了所有用户的需求,并将这些需求有机的结合成一个逻辑整体。定义模式时不仅要定义数据的逻辑结构,而且要定义与数据有关的安全性和完整性。二外模式。其也称子模式或用户模式,它是数据库用户能够看见和使用局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式通常是模式是子集。一个数据库可以有多个外模式,由于它是各个用户的数据视图,如果不同的用户在应用需求,看待数据的方式,对数据的保密程度等方面有差异,则其外模式描述就是不同的。即使对模式中同一数据,在外模式中的结构,类型,长度,保密级别等都可以不同。另一方面,同一外模式可以为某一用户的多个应用系统所使用,但一个应用程序只能使用一个外模式。每个用户只能看见和访问所对应的外模式中的数据,数据库中的其它数据是不可见的。三内模式。也称存储模式,一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据在数据库中的表示方式。数据库系统的三级模式是对数据的三个抽象级别,它把数据的具体组织留给DBMS管理,使用户能逻辑地抽象的处理数据,但为了能够在系统内部实现这3个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两层映像。1.外模式/模式映像2.模式/内模式映像。当模式改变时,数据库管理员对外模式与模式的映像作相应的改变,可以使外模式不变。应用程序是依据数据库外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性。模式与内模式的映像定义了数据全局逻辑结构与存储结构之间的对应关系。当数据库的存储结构改变,数据库管理员对模式/内模式作相应的改变,从而使模式保持不变。保证了数据与程序的物理独立性。数据库的二级映像保证了数据库外模式的稳定性,从而从底层保证了应用程序的稳定性。数据与程序间的独立性,使得数据的定义与描述可以从应用程序中分离出去。另外,由于数据的存储由DBMS管理,用户不必考虑细节,从而简化了应用程序的编写,大大减小了应用程序的维护和修改。数据库中的数据如此重要,所以我们规定关系数据库用数学的方法来处理它。而关系数据库采用关系模型作为数据的组织方式。关系数据库是关系模式在某一时刻对应的关系集合,称为关系数据库。关系模型由关系数据结构,关系操作和完整性约束组成。而关系的完整性约束包括:实体完整性;参照完整性;用户定义完整性。在关系数据库中关系语言十分重要。关系语言由关系代数语言,关系演算语言和具有关系代数与关系演算双重特点的语言组成。关系语言是具有完备的表达能力的一种高度非过程化的集合操作语言,功能极强,能嵌入高级语言。关系代数是一种抽象的查询语言,它用于对关系运算的查询。关系代数的运算是关系,结果还是关系。运算对象,运算符,运算结果是运算的三大要素。关系代数用到的运算符包括:集合运算符,专门的关系运算符,算术比较符,逻辑运算符。其中集合运算包括:并,交,差,笛卡尔积。关系运算包括:选择,投影,连接,除。而SQL是关系数据库的标准化语言,它是一个功能极强的通用的关系数据库语言。SQL集数据查询,数据操纵,数据定义和数据控制功能与一体。主要特点包括:1.综合统一。SQL集DDL,DML,DCL功能与一体,2.高度非过程化。存取路径和操作过程由系统自动完成。3.面向集合的操作方式。4.以同一种语法结构提供多种使用方式。5.语言简单,易学易用。支持SQL的DBMS同样支持关系数据库的三级模式结构。其中外模式对应于视图和部分基本表,模式对应于基本表,内模式对应于存储文件。用户可以用SQL对基本表和视图进行查询或其他操作,基本表和视图一样,都是关系。基本表是本身独立存在的表,在SQL中一个关系就对应一个基本表。一个基本表对应一个存储文件,一个表可以带若干索引,索引存放在存储文件中。视图是从一个多个基本表导出的表。它本身不独立存储在数据库中,即数据库中只存放视图的定义而不存放视图对应的数据。这些数据仍存放在导出视图的基本表中。SQL的功能包括:数据的定义有模式,表,视图和索引的定义;数据的查询,数据库中最核心的操作是数据库查询。SQL提供了SELECT语句进行数据库的查询,该语句使用方式灵活且具有丰富的功能。连接查询是关系数据库中最主要的查询,包括等值连接查询,自然连接查询,非等值连接查询;数据的更新,即向表中添加若干行数据,修改表中的数据和删除表中的若干行数据。以上是数据库的现状,现在就对其发展趋势进行浅谈。数据,应用需求和计算机相关的技术是推动数据库发展的3个动力或因素。1.信息特性和来源的变化。数据库领域已经从获取,组织,存取,分析和恢复结构化数据扩展到文本,时间,空间,声音,图像图形,视频等多媒体数据,HTML,XML等非结构化和半结构化数据,还有程序数据,流数据和队列数据等等。数据类型的多样化,处理这些数据的方法复杂化以及数据量越来越巨大是现代数据库面临的巨大挑战。在DBMS系统中可能会增加对复杂数据的存储和处理功能,还可能会将新的数据结构移植到传统的框架上。2.应用领域的变化。应用领域变化中,INTERNET是最主要的驱动力,在INTERNET应用环境下所有应用已从企业内部扩展为跨企业间的应用,这需要DBMS对信息安全和信息集成提供更有力的保障和支持。另一个重要领域是科学研究。这些研究产生大量的复杂数据,这要求更新的数据库产品的支持。此外,还会对数据分析器产生的数据进行管理,需要存储有序的数据和对它们查询(如时间序列,图像分析,网络计算和地理信息)。3.相关技术的发展。相关技术的发展会推动数据库研究发展的方向。不仅有一些新信息管理的挑战,还有数据模型,存取方法,查询算法,查询语言及用户操作界面的变化使得我们对传统的数据库踩踩管理和查询算法重新加以评价。另外,处理器高速缓存暴曾且增加了层次,这使得DBMS能充分利用高缓。这样一个全新的信息管理框架将会形成。4.当前若干研究热点。一些新的信息包括:信息集成,移动数据管理,网络数据管理,传感器数据技术,DBMS自适应管理等。这样使得数据库系统的最终目标是“没有可调部分”,即所有的调整均由DBMS自动完成。它可以依据缺省规则,也可以依据用户的需求制定规则。因此,建立能够清楚的描述用户行为和工作负载的更为完善的模型,是这一领域发展的先决条件,除了不用手工调整,DBMS还需要能够发现系统组件内部及组件间的故障,辨别数据冲突,侦查应用失败,并且做出相应的处理。数据库管理系统已经成为软件产业的重要组成部分,是信息化过程中最重要的技术基础之一。我国要振兴软件产业,就必须发展自己的数据库系统。我们这一代人必须好好学习数据库。面对新的挑战,我们要继承数据库技术和其他技术相结合的优良传统,努力探索新的途径,新的方法,新的技术,来提高和改善对新的数据和信息的使用。