基于信息元的教学资源组织系统设计与实现摘要:本文以文本类型教学资源为研究对象,在领域知识可拓信息网模型和CELTS-3的基础上,阐述了基于信息元的教学资源组织系统设计与实现过程,包括:信息特征元数据描述框架、特征词获取、信息元距离度量、信息元匹配规则以及匹配算法等。该系统通过有限的信息元描述无限的资源,实现了教学资源的高效组织,支持学习过程中资源自动重组。关键词:教学资源;信息元;特征词;元数据描述框架;匹配规则;匹配算法DesignandImplementationofTeachingResourcesOrganizingSystemBasedonInformationUnits【Abstract】OnthebasisofextensioninformationnetofafieldofknowledgeandCELTS-3,thispapertargetsattext-typedteachingresources,andelaboratestheprocessofdesignandimplementationofteachingresourcesorganizingsystembasedoninformationunits,includingaframedescribingbasicdataofinformationcharacteristic,obtainmentofcharacteristicwords,distancebetweeninformationunits,aswellasmatchingrulesandalgorithmofinformationunit,etc.Thesystemorganizesinfiniteteachingresourcesbyfiniteinformationunits,implementsefficientorganizationoftheteachingresources,andthussupportstheresourcesautomaticregroupingintheprocessoflearning.【Keywords】TeachingResource;InformationUnit;CharacteristicWord;FrameDescribingBasicData;MatchingRule;MatchingAlgorithm随着网络教育和教育信息化建设的发展,教育资源的质量对现代网络教育起着决定性作用[1],教师的意图、观点和思路只有通过教育资源的形式才能得以体现。当前在教育资源建设中存在的问题主要有[1-4]:资源库之间的互操作缺乏相应规范;资源独占系统导致了资源开发的低水平重复和可共享范围小;资源可重用性差,不能根据个性化学习的需要自动重组等。普遍认为上述问题存在的原因主要包括[1-4]:(1)教学资源不规范。资源开发缺乏统一的元数据描述标准,有着各自的开发目的,使用不同的开发系统。(2)教学资源不独立。长期以来教学软件的开发,教学资源都依附于教学管理系统。(3)教学资源的管理技术落后。由于大部分教学资源都不是结构化的,即不是计算机可理解的信息,导致这些资源在序列化存储、检索、重组等信息处理方面存在较大的难度。本文以文本类型教学资源为研究对象,在领域知识可拓信息网模型和CELTS-3(教育信息化技术标准一学习对象元数据)的基础上,阐述了基于信息元的教学资源组织系统设计与实现过程。该系统通过有限的信息元描述无限的资源,实现了教学资源的高效组织,支持学习过程中资源自动重组。1教学资源组织模型研究1.1信息元物元理论告诉我们,物元是度量与非度量的结合,一个信息的定量部分和定性部分在物元概念下可以很好的统一起来。可以认为,信息是一种特殊的物元,将信息用n维物元表示,即R=(N,C,V),C(C1,C2,C3,...Cn),V(v1,v2,v3,...vn),我们称之为信息元[5],其中N为信息所涉及到的事物,C为给定事物具有的某一广义特征,V是N关于C的广义量值。1.2领域知识可拓信息网模型信息元一个最主要的特征是可拓性,以信息元R为起点,在某限制条件下向外开拓,可以得到2很多相关和相似的信息元,称}{}{~}{}{}{}{)(0RRRRRRRRWvcn为R的可拓信息域,其中nR表示R的同物信息元集,cR表示R的同征信息元集,vR表示R的同值信息元集,~R表示R的相关信息元集,R表示R的蕴含信息元集,R表示R的共轭信息元集。所有这些信息元将组成赋权网络,如图1所示。某领域知识的基本信息元采用指针形式连接起来,指针分为4类,发散类(E类指针),相关类(I类指针),蕴含类(P类指针),共轭类(F类指针)。网络的连接框架采用3条总线结构:事物总线、特征总线、量值总线。每条总线分为若干域,如事物总线按照类事物分域,特征总线按照实义特征、性质特征、功能特征分域。量值总线按照数值型和非数值型分域。这样建立起一个关于某领域知识的可拓信息网络。2教学资源组织系统设计2.1功能需求分析本系统针对互联网上海量的教学资源进行更好的获取、标识、组织与管理,并提供给用户学习。具体包括两个功能需求:a.教学资源的收集在收集过程中对教学资源进行拆分,以信息元为单位选取、收集各类教学资源。b.有效的资源管理根据资源的信息特征对资源的内容属性进行元数据标引,使资源与多个信息元相关联。利用可拓信息网络对教学资源进行有效管理和利用,实现教学资源在多种学习情境下被重用,而且可由挂靠在信息元上的资源自动拼接成个性化的学习页面。2.2教学资源组织系统的设计方案教学资源的组织要解决两个问题:一是如何组织教学资源数据;二是如何组织各种类型的教学资源。教学资源组织分为资源描述、资源存取和资源挂靠三个过程。下面详细介绍设计方案。a.教学资源元数据描述框架教学资源的元数据描述是教学资源组织的重要环节,缺乏描述的资源不可能被有效共享和利用,同时也直接影响教学资源的查找和管理。本文把教学资源元数据分为基本元数据和信息特征元数据。基本元数据主要用于描述教学资源的外在特征。在基本元数据描述中,采用CELTS-3标准[6-8],并对其元数据或元数据的取值进行取舍和改进。同时,为了实现基于信息元的教学资源组织,支持学习过程中教学资源自动重组,采用信息特征元数据描述框架来精确描述教学资源的内容特征。如表1所示。表1信息特征元数据框架名称作用说明描述Description教学资源的文字描述。教学资源内容的描述。关键词Keyword教学资源的关键词。描述教学资源特征的关键词。*构件类型ComponentType教学资源描述的信息特征形如简介、定义、说明、总结、RR0R1R6R7R8R9R5R2R3R4图1领域知识可拓信息网络图3式。分析、讲解、练习、公式等。*描述形式ConfigurationType教学资源的描述形式。如陈述、列表、例题、过程、模型、演示等。*主题Subject教学资源尽可能准确和细化的所属信息元。文本资源由信息元分析给出列表供用户选择,其它类型资源在信息特征树上选择得到。特征关联Relation从教学资源中提取出的信息特征之间的关联。文本类型教学资源根据信息元分析获取。其它类型教学资源采取用户输入。b.教学资源存取方案通过两层架构,6种教学资源状态(正在收录collecting、已收录collected、已删除deleted、已挂靠referenced、已收录入库embodied、正在收录入库embodying)间转换来实现教学资源的数据库存取。用户对教学资源的各种操作,如添加、删除、更新、编辑等都全部统一在两层架构的第一个操作层面进行,而所有的真正数据库存取操作在第二个操作层面完成。c.教学资源挂靠策略为实现教学资源基于信息元的组织,一方面必须构建领域知识可拓信息网模型对领域知识进行描述;另一方面需要将教学资源与该模型中的信息元相互关联,即资源挂靠。信息特征元数据描述框架中的构件类型项和描述形式项描述了教学资源与所挂靠的信息元之间的关联关系。2.3数据库设计教学资源组织系统的数据库主要包括了教学资源库,知识库和挂靠库三个部分。教学资源库主要用于保存教学资源的信息,包括资源数据和资源描述信息;知识库作为领域知识可拓信息网模型的实现[9],可以认为是整个教学资源组织系统的“中心发动机”;挂靠库可看作是教学资源库和知识库之间的桥梁,其中保存了教学资源的挂靠信息。此外,数据库中还包括为实现文本结构分析和设计的文本结构临时表T_TextSplit,用于保存正在分析的文本对象的文本结构信息。3系统功能实现3.1教学资源收集模块教学资源的收集模块主要包括:录入接口、元数据描述和数据库存取。教学资源收集的录入接口有三种:工具栏添加、剪贴板、悬浮窗口。教学资源描述的元数据较多,系统将元数据分为几类分别放在不同的选项卡上,系统通过调用元数据检查函数保证元数据描述框架中的核心必选元素其值不为空。数据库的存取主要包括:a.由知识库中的信息通过递归过程动态生成信息特征树,并且保存信息特征到相关结构体中。b.从正在收录资源表中下载资源数据,并更新教学资源列表和资源描述信息区。3.2教学资源挂靠模块教学资源挂靠模块实现资源和信息元之间的挂靠。对文本资源,系统通过信息元的置信度计算提供资源挂靠的候选关联信息元集。对其它类型的教学资源,用户可以在信息特征树上选择资源要挂靠的信息元,在挂靠列表中将显示信息元在信息特征树上的全名。3.3教学资源管理模块教学资源管理主要是针对资源库中已收录的教学资源的管理,包括资源检索和资源编辑等。资源编辑包括对教学资源、资源描述信息和挂靠信息的编辑。a.教学资源的检索系统提供多种检索方式供用户查找教学资源库中的教学资源。检索方式主要包括:包含文字、资源类型、资源大小、资源收录日期、关联信息元、构件类型、描述形式、难度、面向用户等。b.检查资源所在文件的位置系统提供自动检查和更新教学资源所在文件位置的功能。4c.资源编辑资源编辑包括编辑文本资源信息、编辑资源的挂靠信息、编辑资源的描述信息、删除教学资源。4关键技术4.1特征词的获取领域X的文本资源所包含的信息可以用一组信息元|XRRN抽象表示,而信息元R具有特征词集RC,可拓信息网XN中所有信息元的特征词集构成领域X特征词典XG。选择领域特征词典XG作为分词词典,采用逐词遍历法[10]提取文本资源中的特征词集C,集合C就是能够表示文本资源的特征词集合。算法流程如图2所示。4.2信息元匹配算法信息元匹配的目的就是用一个或若干个信息元来描述文本资源的内容特征。用领域知识可拓信息网作为模板,通过信息元的匹配,可以用该网的一个子网来表示该领域教学资源的信息特征。a.信息元匹配规则[11]设R表示可拓信息网XN中的信息元节点,.RC表示信息元R的属性,.RCc表示.RC的属性值,.RB表示信息元R的行为,.RBb代表一个行为属性的具体取值。设IP是在匹配过程中新增加图2逐词遍历分词算法流程图5的节点集,IE为新增加的边集,IP、IE初始为。下面给出信息元匹配规则集I的主要部分:(1)若1.wRC,则设2wR,IP=IP∪{2w},IE=IE∪{21ww};(2)若1.wRCc,则设2wR,3.wRC,IP=IP∪32,ww,IE=IE∪1332,;(3)若1.wRBb,则设2wR,3.wRB,IP=IP∪32,ww,IE=IE∪1332,;(4)若1122.,.wRCcwRCc,则设34152,.,.wRwRCwRC,IP=IP∪543,,IE=IE∪25145343,,,;(5)若12,.|.wRwRCcRBb,如果21wwLi则设3.wRC;如果12wwLi则设3.wRB,IP=IP∪3w,IE=IE∪2331,;(6)若1122,.wRwRCc,