研究人员:
顾进广、张智、张铭辉
研究内容:
XML 数据库作为半结构化型数据表示语言的典型代表,在实际生活中日益发挥着重要作用。然而XML 数据库现有的事务处理机制存在许多不足,表现在事务处理粒度太大,并发能力比较低,封锁代价成本太高,不支持主流的XML 数据处理语言等多方面。因此,提高XML 数据库事务处理机制的性能具有十分重要的理论研究和实际应用价值,将有效推动XML 技术在社会生活中各个方面的应用和普及,会给信息处理技术带来革命性的变化。 本项目拟设计一种细粒度封锁机制,其目标是有效降低现有XML 数据库不同事务间的封锁冲突,提高并发处理能力。在此基础上设计相应的原型系统,在研究中,同时考虑面向纯XML 数据库(Native XML Database, NXD)和基于关系数据库扩展(XML Enabled Database, XED)支持XML 数据处理等两种应用环境;设计XML 数据处理的查询优化策略,降低封锁复杂度和成本开销,进一步提高事务处理系统的并发处理能力。
研究成果:
本项目目前成功申请湖北省教育厅项目一项,在国内外学术期刊发表论文两篇,EI收录两次。
本课题目前阶段重点研究基于语义缓存的XML代数查询优化技术。传统的关系数据库为了提高查询响应速度,除了进行查询语句改写、查询计划优化和基于代价的执行顺序选择之外,缓存也是查询优化的一项重要技术。数据库管理系统有选择的对查询结果进行缓存,把经常被查询的数据(即“热数据”)保存在缓存中。当新的查询来到时,数据库管理系统首先检查是否可以由缓存中的数据进行回答,如果可以,则直接从缓存中返回查询结果,这样就避免了I/O开销较大的磁盘数据读取从而提高了查询响应速度。当前XML数据库系统的缓存技术研究主要集中在语义缓存上,所谓语义缓存指的是把用户的查询请求与结果数据对应起来,一起保存到缓存中。语义缓存查询处理的基本思想是:首先确定是否有缓存项与查询请求间存在精确匹配的关系,如果有,查询请求可以由本地缓存处理;若没有,但存在缓存项与查询是包含匹配关系,这时需要进行查询剪裁,得到缓存能够回答的探测查询和不能回答的剩余查询,剩余查询需送到服务器处理,查询的最终结果集由探测查询的结果和剩余查询的结果合并而成。在对XML数据的缓存过程中,主要研究以下几个方面:①缓存数据的选择:选择并保存常用的数据。②缓存数据的格式:即以什么样的形式来表示XML数据。③缓存匹配算法:对于新的查询,需要恰当的匹配算法来确定已缓存的查询结果是否可以回答此查询。
项目组提出了基于语义缓存的XML代数查询优化的思路,并设计了相应的语义缓存查询优化和缓存置换算法,实验结果表明该算法在大量数据查询请求的情况下,对提高查询效率效果明显。在国内核心期刊发表论文两篇,指导两名学生完成硕士论文。