基础教育资源搜索引擎数据库设计报告文件状态:[√]草稿[]正式发布[]正在修改文件标识:数据库设计(SearchEngine)当前版本:1.0作者:基础教育资源搜索引擎开发小组完成日期:2003-12-19机构图标南京师范大学教育技术系基础教育搜索引擎开发小组版本历史版本/状态作者参与者起止日期备注1.0开发小组开发小组2003.12~目前初稿目目录录0.文档介绍......................................................................................................................................40.1文档目的................................................................................................................................40.2文档范围................................................................................................................................40.3读者对象................................................................................................................................40.4参考文献................................................................................................................................40.5术语与缩写解释....................................................................................................................41.数据库环境说明..........................................................................................................................51.1数据库环境............................................................................................................................51.2系统开发环境:....................................................................................................................52.数据库的命名规则......................................................................................................................53.逻辑设计......................................................................................................................................63.1数据流程图............................................................................................................................63.2E-R图(CN)........................................................................................................................83.2E-R图(EN)........................................................................................................................94.物理设计....................................................................................................................................104.0表汇总..................................................................................................................................104.0表详细说明..........................................................................................................................125.安全性设计................................................................................................................................185.1防止用户直接操作数据库的方法......................................................................................185.2视图设计...............................................................................................................................185.3角色与权限..........................................................................................................................186.存储过程设计............................................................................................................................197.数据库管理与维护说明............................................................................................................200.文档介绍0.1文档目的起草本文档主要是为了统一开发小组及用户对本项目中所使用的名词术语的认识,规范开发小组成员在开发过程名词术语的使用习惯和变量命名习惯,帮助开发小组成员熟悉系统的数据处理流程和相关数据存储,加深对系统的认识。0.2文档范围本文档主要内容有系统术语定义、数据库环境说明、数据库命名规则、数据库物理表设计及数据库的安全管理设计等。0.3读者对象本文档的适用对象主要有系统设计人员、系统编程人员、系统测试评估人员及系统运行维护人员。0.4参考文献《基础教育教学资源元数据应用规范》《基础教育教学资源数据规范》《教育资源建设规范》《网络教育技术标准》《教育信息化标准》《自动分类分析设计文档(田起草)》《基础教育资源的分类(谭起草)》0.5术语与缩写解释缩写、术语解释SPP精简并行过程,SimplifiedParallelProcessSD系统设计,SystemDesign…1.数据库环境说明1.1数据库环境服务器:曙光CPU:PIII800(双)RAM:512MB操作系统:Windows2000Server数据库服务器:SQLServer20001.2系统开发环境:本系统主要有三个模块:蜘蛛程序、索引器(分词、标引)、搜索器(用户搜索界面),在原型开发阶段,开发平台主要是:1、蜘蛛程序:系统平台:Windows2000、SQLServer2000开发工具:Java2、索引器系统平台:Windows2000、SQLServer2000开发工具:C#.net3、搜索器系统平台:Windows2000、SQLServer2000、IIS5.0开发工具:ASP、Dreamweaver说明:在系统原型开发阶段主要使用Windows平台及相关开发工具。在系统正常运行后逐步移植到Linux系统下,并完成相关模块的移植。2.数据库的命名规则在本数据库中,主要采用驼峰法的命名方法和缩写法,主要规定如下:(1)所有对象的命令都应遵循见名知义原则;(2)所有对象名称的缩写应遵循大家的使用习惯;(3)数据库中各对象命名遵从系统类图中名对象的命名(参考系统分析设计文档);(4)表名都以T(Table)开头,如语种信息数据表命名为:TLanguage;(5)视图名都以V(View)开头,后面以相关表名的第二个字母表示,如ViewCorporationKeyword(公司与所注册关键字信息);(6)在数据表中,实体的属性以实体名的缩写+属性英文缩写表示,如语种名称用LanName表示;(7)SQLServer中数据库命名为BERSE;(8)对于各表间有联系的列(主键、外键等)仍使用原表中的列名;3.逻辑设计3.1数据流程图基础教育专业搜索引擎在功能模块上主要分为四个部分:Spider程序、Indexer标引程序、用户检索程序、词库自学习模块。这四个部分间的关系如下图所示:Internet文档Spider下载输入数据1文档处理标引获取一篇数据库存储1倒排档索引数据库主词库同义词库特征词库分词降维分类下游用户检索程序检索分词处理检索结果输出上游客户竞价信息上游用户竞价排名信息输入界面上游用户服务程序-输入上游用户信息数据存储2系统初始URL输入界面文档训练界面文档训练读取训练文档生成同义词库、主词库维护界面词库管理程序输入关键词建立下游用户检索词条3.2E-R图(CN)3.2E-R图(EN)4.物理设计4.0表汇总表名说明SQL脚本Category文档类别库,有三个维度:学段(学前、学段、资源类型)、学科(语文、数学、物理、……)、资源类型(课件、教案、……),具体参考《基础教育资源的分类(谭起草)》CREATETABLECategory(CategoryIDUNIQUEIDNOTNULL,CategoryNameCHAR(10)NULL);Category1文档一级特征分类,按学科、学段进行分类CREATETABLECategory1(CategoryID1BYTENOTNULL,CategoryIDUNIQUEIDNOTNULL,CategoryName1CHAR(10)NULL);Category2文档二级分类,如小学语文、小学……、初中语文、初中……、高中语文、高中……等CREATETABL