研究人员

        顾进广、金瑜、张智、李鹏、刘宇

研究内容

        随着网络与信息技术的迅速发展,因特网的规模急遽扩大并已渗入到人们日常工作与生活的各个角落。网络的广泛普及使网络信息源的格局发生了很大变化,主要表现为小型组织机构与个人建立的中小型数据源大量增加,导致网络中出现广泛分布的信息服务器与大量的自治信息节点并存的情况。这些自治节点主要采用了对等网(P2P,Peer to Peer)计算模式来组织并共享资源,在P2P计算系统中,各自治节点地位相同,节点可自由地形成虚拟组织,可向其他节点提供资源服务或接受其他节点的服务,也可动态的加入和退出系统。P2P计算一经提出便在网络计算领域得到广泛应用,以BitTorrent和eMule等为代表的P2P应用已经将数以亿计的自治节点组织起来在网络中提供各种文件资源共享,而P2P计算也迅速成为广大网民最为热衷的网络资源共享方式,被称为“面向网民的计算”。
        然而,目前的P2P技术除了在提高分布式计算领域发挥重要作用外,在信息共享领域还只是停留在文件共享的层面上。如果能够使P2P计算开始从单一的文件共享向复杂的信息共享过渡,对信息处理技术将是一个非常大的贡献。例如,一个由消费者建立的P2P虚拟组织可能会在组织内动态地发布各地各种商品的零售价格,这种价格信息与网站公布的价格信息相比,其信息量更大,内容更加及时准确,更能满足相关组织或个人了解物价情况的需要。
        P2P节点由单纯的文件数据源向真正意义上的信息源转化,则需要节点提供的信息包含更加复杂的语义,并且促使信息源的组织方式由集中式向全分布式过渡,信息源间的联系由紧耦合转向松散耦合,并呈现出分布、松散、虚拟和动态等特征。基于对等网的信息源这种新格局为研究其信息共享问题提出了新的要求。分布异构信息源的集成一直是数据库理论与应用的一个重要研究课题,被认为是解决因特网中信息共享的主要方法。传统信息集成技术着重于研究对信息服务器的数据集成。与信息服务器相比,P2P计算中的自治信息节点具有节点数目多、数据量相对较小、数据模式异构情况广泛存在、节点在线时间不固定等等特点,这使得传统信息集成技术难以直接应用于P2P信息集成。相应地,P2P信息集成作为对传统信息集成的适用于新网络格局的补充,成为当前网络计算与信息集成的一个重要研究课题。
        另外,国内外目前所进行的有关P2P信息集成技术的研究主要集中于对等网环境下数据管理技术的研究(PDMS),它对数据源有比较高的要求,一般是指数据源是结构化或者半结构化的数据库系统。但目前的个人业务处理和互联网环境下,信息的表现形式丰富多彩,例如电子邮件、办公处理文件、基于Web Service的应用系统和常规应用系统数据、基于文本的数据信息等。这类信息源不仅存在数据结构和数据模式(Schema)的异构,而且存在语义(Semantic)上的异构。
        采用基于本体的语义信息来处理对等网环境下的信息集成将是解决上述问题的有效手段,它将解决对等网环境下不同信息节点的语义异构问题,并且有效解决信息查询过程中数据不完全或者不一致的问题。另外,通过构建信息节点的语义环境,可以支持基于语义的查询,并通过语义信息对所有信息节点进行基于语义聚类或语境的分类,缩小查询范围,提高查询效率。对等网环境下基于语义的信息集成技术的研究,将扩展P2P技术的应用领域,并将为语义P2P的研究作出相应的贡献。

研究成果

        本课题目前成功申请中国博士后科研基金一等金、湖北省教育厅科研基金项目各一项,在国内外学术期刊、学术会议发表论文多篇,多篇被 SCI-E、EI和ISTP收录。出版学术专著一本。

研究人员

        顾进广、刘钊、符海东、金瑜 、涂新辉、罗景

研究内容

       本项目旨在针对目前基于语义的信息集成中存在的问题,重点研究(1)松耦合环境下语义不一致及语义演化对信息集成的影响,(2) 支持更丰富语义关联的融合机制,(3)以上述两种机制为基础研究支持语义信息集成的语义通信机制、基于语义的信息查询机制等。
        研究内容主要包括:(1) 松耦合环境下语义演化的捕获、传播和量化机制。(2)语义聚合方面,在现有国内外专家研究的基础上,侧重于研究支持更丰富语义关联的语义聚合机制及相应的语义通信和语义信息访问机制。(3)具有典型意义和实用价值的实验原型系统。

研究成果

        本项目成功申请国家自然科学基金项目一项。

研究人员

顾进广、张智、李鹏、刘宇

研究内容

       传统的个人计算机采用两种方式来管理个人计算机的资源。第一种方式是以目录和文件名的方式来管理资源,包括本地计算机的目录和网络目录及每个资源文件的名称等。通过操作系统提供的API,用户可以在命令行模式下或通过图形界面查找、浏览和操作(如创建新文件、拷贝、删除文件,执行文件等)相应的资源文件。另一种方式是通过应用程序来管理资源文件,每一种类型的资源文件与一个或多个应用程序相关联,只能通过相应的应用程序来操作相应的资源文件的内容,例如Word文件只能由Microsoft Word应用软件来处理,视频文件可能由Microsoft Media Player、Real Player等应用程序来处理等。这两种方式构成了目前个人计算机管理资源的主要方式。然而,随着个人计算机与互联网络的发展和普及,传统的个人计算机资源管理方式已经不能很好地满足用户的实际需求,主要表现在以下方面:
        1) 个人计算机的硬盘容量越来越大,一台计算机拥有80G的硬盘已经非常常见,而且每台计算机上存储的信息资源也越来越丰富。但是,用户每天不得不花费大量的时间来寻找、定位所需要的资源文件,即使用户知道文件所在的目录,也需要花费相当多的时间来处理。
        2) 目录并不能完整反映资源或文件的分类结构。许多用户为了有条理地管理个人的信息资源,采用目录分类的方式来存取所有的文件,但由于一个文件在语义上类属的多样性,不可能简单地采用目录分类的方式进行安排,例如:用户从网络上下载一篇有关语义网方面的学术文章,他可能会将这篇文章放置于“学术文章/智能信息处理/语义网”这个目录下,但这篇文章的内容也可能隶属网格计算、数据库处理或者分布式信息处理等研究领域,如果用户以后按“学术文章/分布式计算/网格计算”将无法寻找到这篇文章。
        3) 无法反映不同资源之间的语义联系。两个不同的文件资源虽然所处的目录不同,文件格式不同,但在语义上可能存在着某种联系,例如一封电子邮件的内容可能描述了存在于某一个目录中的一个Word文档A.doc的主要内容,这样这封电子邮件与这个Word 文档A.doc之间存在就存在语义上的联系。在传统的方式下,用户在浏览电子邮件的内容时,无法直接通过相关的语义联系直接找到对应的Word文档,而不得不按目录进行浏览。
        另一方面,由于互联网技术的日益普及和发展,人们对于互联网的要求也越来越高,表现在两个方面:(1)更有效和准确的获取互联网上的资源,提高资源共享的能力和层次;(2)现有现在互联网的应用模式,从互联网使用者被动参与变为参与者与互联网互动。基于这些需求,语义网(Semantic Web)、WEB 2.0和P2P等技术应运而生。然而,传统的采用文件名称和目录等手段管理本地计算机资源的个人计算机并不能为上述技术提供良好的支撑和应用平台。
        因此,改变现在的计算机资源管理方式,不仅具有十分重要的现实意义,而且将会为新的技术发展提供基础支撑环境及应用空间,在理论上也具有十分重要的价值。本项目研究的主要目的是利用智能信息处理技术如数据挖掘技术、语义网的技术来为个人计算机提供一个基于本体的动态语义视图,建立文件资源之间的语义联系,消除目录及不同应用程序之间的复杂度,达到提高资源管理的效率及资源共享能力的目的。并希望在此基础上进一步为基于P2P的语义网提供新的研究思路;提高目前互联网资源共享的模式,实现语义资源共享的目的。

研究成果

        设计了语义桌面原型系统,目前正在此基础上使其达到实用化。申请江苏省博士后研究基金项目一项,发表论文一篇,出版学术专著一本(其中一章)。指导一名学生完成硕士论文。