通信技术期刊投稿企业关联数据应用模式与案例综析

所属栏目:通信论文 发布日期:2015-06-04 14:58 热度:

  通信技术已经在各行各业普及了,我们平时用的手机,网络都属于通信技术。其他的还有一些监控系统,学校的信息管理系统等都属于通信技术的范畴。关联数据就是通信系统中发表数据的途径之一,本文是一篇围绕关联数据展开论述的文章,是一篇通信技术期刊投稿论文范文,文章题目是企业关联数据应用模式与案例综析。

   摘 要:Tim Berners-Lee提出的“关联数据”概念目前是图书馆学、情报学、计算机科学、信息管理和信息系统等学科的研究热点。关联数据作为语义网的一种实现方式,正在引领一场网络革命,它不仅使许多新应用付诸实践,也为一些特殊领域的应用提供了契机。论文分析了关联数据技术的背景和现状以及企业应用关联数据的原因、意义和模式,根据关联数据的层次模型以及基于关联数据的企业信息资源集成的目标取向和功能配置构建了企业关联数据应用模型,在逻辑上将其分为支撑环境层、信息资源层、信息处理层和应用层,并结合Google、BBC和Renault三大公司的应用案例探讨了企业如何利用关联数据技术创新盈利模式、改善效益,为关联数据在企业的应用提供了参照。

  关键词:通信技术期刊,关联数据,语义网,企业,应用模式

  1 概述

  关联数据作为发布数据的途径之一,可以视为语义网的一种实现方式。它采用RDF数据模型,利用URI命名数据实体,来发布和部署实例数据和类数据,从而实现数据的相互关联和易于人机理解,并可通过HTTP协议揭示和获取数据[1]。关联数据网络不仅使许多新应用付诸实践[2],也为一些特殊领域的应用提供了新的契机[3]。

  关联数据网络可以视为一个与传统的文件网络紧密交织并有许多相同属性的附加层,它包含了各种类型的数据,允许任何人发布数据,对数据表达词表的选择没有限制;此外,实体通过RDF链接相连,因而全球数据资源得以广泛相连,新的数据资源也能够及时被发现。

  开放数据项目(Linking Open Data, LOD)是关联数据应用的典型案例之一。2007年1月,LOD项目由民间发起并获得了W3C语义网教育和外联组织的支持。该项目以通过定义已有并可公开使用的数据集、根据关联数据原则将其转换为RDF并上网发布,从而改善数据网络为目标,早期参与者主要是大学实验室和小公司的研发人员,随着项目深入开展,一些大型机构比如BBC、Thomson Reuters和国会图书馆也积极加入。LOD项目的进展得益于它的开放性:参与者只要根据关联数据原则发布数据集并将其与已有数据集相连即可[4]。据统计,开放数据网络已包含了300多亿条RDF语句,这些语句被逾5亿个RDF链接相连。

  除了LOD项目,关联数据应用的典型例子还有关联数据浏览器、关联数据搜索引擎和索引。关联数据浏览器使得用户能够通过由RDF语句表达的链接在不同的数据源之间浏览,结果是用户可能从一个数据源开始浏览并且跟随RDF逐渐遍历网络。Disco超数据浏览器则可以被视为超文本浏览范例在数据网络的一项直接应用[6]。关联数据搜索引擎能够通过跟踪RDF链接从而在网络上抓取关联数据,并且在大量数据中进行检索[7]。大体上来看,关联数据搜索引擎可分为两类,即面向用户的搜索引擎和面向应用的索引。

  关联数据在具体领域的应用案例亦层出不穷,例如基于关联数据原则和语义网技术的通用审查和评价网站Revyu,运行于iPhone及其它手机设备上的定位感知的关联数据浏览器DBpedia Mobile,面向大学师生的基于网络的资源列表管理应用Talis Aspire等等;数据整合平台DERI Pipes使得数据源能够相互沟通从而形成新的数据;BBC公司内部则使用关联数据作为一项轻量级数据集成技术,本文将选取部分具有代表性的案例进行详细讨论。

  2 企业应用关联数据的意义

  企业界广泛采用电子信息系统已经有30多年历史。随着各企业全面实施企业资源计划(ERP)、供应链管理(SCM)、客户关系管理(CRM)和电子商务(EC)等管理信息系统,整合各系统内部及系统之间数据的访问势在必行。关联数据为这一问题提供了答案,它通过整合所有数据的访问,降低生产运营成本,提高企业现代化管理和科学决策的效率和水平,提升企业核心竞争力,创造经济效益。

  首先,关联数据可有效实现企业信息资源整合。企业将RDF模型应用于非结构化、半结构化和结构化的数据与内容,可以消除企业内部数据相互分隔的弊端。基于RDF,企业可以通过关联数据描述信息资源,从而串联起非结构化、半结构化和结构化的数据与内容,如图1所示。此外,通过使用关联数据以及建立在各个数据库中数据集的链接,使得企业各数据库可以相互链接,从而实现数据库的整合,如图2所示。当企业、行业、开放式订阅系统和开放数据都使用相同的命名规则和术语等,关联数据即可以方便快捷地将其链接,有效地整合内部和外部数据。

  企业在生产经营过程中,产生了大量自主、异构和分布的数据,包括各种数据库、文件、电子文档和网络资源等,这些数据不仅存在语义异构的问题,而且缺乏统一规划和标准;由于数据零散分布,企业也难以有效筛选和过滤出所需的特定信息。对于这些遗留模式的数据而言,关联数据可实现完全的模型化;因为RDF使用标准的数据模型,用户无需学习特殊语法即可直接操作数据,因此现有模式几乎完全可重复利用并且易于拓展、更新和变更。企业无需因为商业模式的改变、并购或其它原因而重构遗留的数据模式,通过关联数据,可以将遗留数据和现有数据进行语义链接,从而实现了非重构环境下的数据使用,如图3,通过使用已有的数据库管理程序和设施,企业还可以实现内部关联数据存储。

  此外,企业还可利用关联数据创建报表模板及实施数据检索,节省人工操作,降低生产经营成本和风险;数据访问、分析和操作并推送到用户层,为企业决策提供科学依据,提高企业现代化管理水平,改善效益。

  3 企业关联数据应用模式

  企业数据处理的主要目的就是通过对企业数据的观察、分析、传送或进一步处理,推导出对企业有价值的信息,为行动和决策提供依据;通过保存和管理经过处理的企业数据,方便而充分地利用宝贵的信息资源产生利润。   传统的企业数据处理主要是事务性的,数据类型主要是结构化的,不同的信息系统采用的数据格式往往也不一样(即异构数据)。这不仅为企业用户、系统分析人员、系统设计人员和编程人员之间交流增加了困难,而且当需求发生变化、增加新的需求或者采用新的信息系统后,原有数据(即遗留数据)就需要转换。这些情况下,常常需要对系统作大量的修改,结果往往是一再返工,甚至推倒重来,不断增加投资,浪费时间,用户意见大。

  关联数据为企业提供了一种全新的模式,它对于企业数据处理的各个步骤都提供了极大的便利,包括数据的收集、转换、筛选、组织、运算、存储、检索和输出等等。关联数据技术可以整合企业所有的数据:包括内部和外部数据,当前数据和遗留数据,结构化、半结构化和非结构化的数据;并可随着商业模式的改变或信息系统的升级进行灵活的改变或更新,具有很强的适应性。关联数据的出现无疑为数据处理的三大难题给出了最佳答案,即数据的存储形式、利于数据存取的数据结构以及数据检索的方法。此外,利用关联数据技术还可促进企业之间的数据交换、共享和开放。

  根据关联数据的层次模型[8]以及基于关联数据的企业信息资源集成的目标取向和功能配置[9],可以构建企业关联数据应用模型,在逻辑上可分为4层结构,自下而上分别为支撑环境层、信息资源层、信息处理层和应用层,如图4。

  3.1 支持环境层

  支撑环境是企业关联数据应用模型存在与运行的基础,可以分为硬件支撑环境和软件支撑环境。硬件方面主要包括企业存储设施、服务器、网络等基础设施架构;软件方面主要包括技术支撑,例如数据库技术、语义网技术、网络技术、人工智能技术和信息检索技术等,以及企业经营管理机制和社会政治、经济环境等。

  3.2 信息资源层

  该层为资源集成处理层提供丰富的数据源,可分为内部信息源和外部信息源。

  企业内部信息源包括企业内部各部门的管理信息系统和内部网络信息等,它们可提供信息系统运行数据、业务数据、供应商数据、客户数据等信息资源。外部信息源包括关联数据开放项目(LOD)、大众媒体、会议信息、关联数据搜索引擎等。信息收集则采用人工和自动相结合的方式进行,一方面利用信息检索法、问卷调查法等方式人工获取信息资源,另一方面则由企业管理信息系统等自动记录和生成。

  3.3 信息处理层

  该层通过分析企业信息资源内部的特定关联,并利用HTTP和RDF的关联数据描述方式来加以表达,对企业信息资源进行挖掘、重组和集成。通过抽取、标识、RDF发布,将RDF格式的信息资源生成RDF链接,应用手动或自动链接的方式实现不同资源之间的语义关联,从而构建起企业异构和分布信息资源之间的语义链接,并将经过处理后的企业信息资源用于界面管理、信息传递、功能整合、业务集成等具体应用中。

  3.4 应用层

  该层能根据用户需求提供多样化的关联数据应用,提供丰富的浏览途径以及信息资源检索、调用和集成功能。用户或应用程序可通过统一的入口无缝访问到集成后的各种关联数据,获取SPARQL、关联数据浏览等建立在关联数据技术上的应用。

  4 企业关联数据应用案例

  4.1 Google

  直到2007年,Google还无法搜索Flash中包含的非文本信息和其它富媒体中隐含的信息。随着大数据时代的降临,网络信息数据膨胀变大之迅猛,尤其是其中海量的多媒体信息资源呈指数级增长,对Google提出了严峻的挑战。

  2009年9月,Google正式支持使用Facebook Share和Yahoo! SearchMonkey的RDFa标记视频内容。网站管理员可以在HTML中嵌入视频的描述信息,Google则将这些信息显示于搜索结果页面,这可以说是Google在关联数据上的一次突破。当年11月,Google支持并开放了两种用于标记结构化数据的开放标准--微格式和 RDFa,并首先应用于搜索结果的摘要,从而在搜索结果中为用户提供更多详情,帮助他们了解网页的价值。如果用户得到更多信息,从中看出网页搜索结果与其搜索请求之间的相关程度,他们就更有可能通过点击查看完整页面。这种结构化数据也可供用户网站中的自定义搜索引擎使用,使其能够显著加强用户对自定义搜索引擎行为的控制力度。

  在面临挑战的两年内,Google正式支持使用Facebook Share和Yahoo! SearchMonkey的RDFa标记的视频内容,成功地运用关联数据技术迎接挑战并提高了搜索质量。目前,Google可以接受微数据、微格式和RDFa三种标记格式,并支持对评价、人物、商品、商家和组织、食谱、活动和音乐等内容类型进行网页摘要的丰富,还可接受视频内容标记并可用于改进搜索结果。关联数据在Google的成功运用为未来搜索引擎的发展指明了一个方向,即搜索不仅仅局限于简单的文本信息,更包括了海量丰富的多媒体信息,搜索引擎就是在不断满足用户需求中实现变革和发展,从而变得越来越智能化和人性化。

  4.2 BBC

  BBC公司(The British Broadcasting Corporation,BBC)内部使用关联数据作为一项轻量级的数据集成技术。该公司是世界上最大的广播电视公司之一,运营着大量电台和电视频道,传统情况下,这些电台电视分别使用不同的内容管理系统(CMS)。然而近年来,BBC公司已开始使用关联数据技术并使用DBpedia和MusicBrainz作为控制词表,从而将位于不同地点的相同主题相互链接,并且利用公开数据链接云(Linking Open Data cloud)中的其它数据扩充内容。基于这些链接,BBC为其所有的音乐和节目建立了关联数据站点[10]。

  BBC的项目支持、音乐挖掘以及自然史内容等都都可被逆向引用至HTML、RDF、JSON等,从而获取节目、艺术家、种类和产地的同一HTTP URI,并使用概念自有的URI而不是编造新的URI。此外,BBC电台的大部分音乐都通过一个名为VCS的系统播放--其实质是一个企业规模的MP3播放器。它不仅将音乐插入广播链中,还在内部发布正在播放的音乐的数据。音乐挖掘小组将资源和档案相链接,将音轨和目录数据以及MusicBrainz音乐家ID相链接,并将所得数据插入节目中从而使单个节目可以提供艺术家的演出数据。BBC发布的音乐测试版网站是BBC音乐在线和整个bbc.co.uk数据结构的一次巨大改进。BBC不仅使用关联数据实现了系统之间基于目标的数据资源集成,还致力于资源公开。为了便于用户使用BBC数据,BBC将所有的音乐测试版网页做成了XML、YAML、JSON和RDF版[11],用户不仅可以通过网页间的链接从音乐链至节目,还可以从节目页面上的专辑曲目反向链接至音乐。BBC认为关联数据技术使其网站和数据的可用性大大增强,用户体验得到巨大提升,搜索引擎的查询效果得到优化,资源的可查找性、可点击性和可传播性都得到极大提高。[12]   4.3 Renault

  Renault是世界十大汽车公司之一,关联数据为阻碍其IS结构的两大难题--数据存储和服务--提供了有效的解决方案;并提供了一个易于启动和链接的REST服务结构。Renault将关联数据原则付诸实践并促进了语义网技术在公司内部的应用,包括将数据仓储作为关联数据发布、实施了一个简单的RDF浏览器、从外部应用访问已发布数据的样品并研究了关联数据相关问题等等。

  Renault选择其售后维修文件部门创建的数据库进行尝试和探索,该数据库也是文件作者在描述维修方法时可能用到的术语词典,其主要功能就是赋予所有文件对事物共同的命名方案。这些术语被译成不同语言,然后按照一个类似SKOS的层级进行分类;并且该数据库也包含一个到不同部门的数据集的链接,每个部门负责将一列所谓“通用部分”与各个术语相连。首先,Renault为数据库构造了URI。其次,在引用非信息资源的URI时,Renault采用了逆向引用非信息资源的URI,即当代理获得了一个非信息资源的URI,程序组件必须回应以一个303 HTTP 状态代码,并且重新定向至信息资源的URI,该信息资源最符合该请求的接收HTTP header的偏好。最后,Renault使用客户端的java脚本从RDF数据产生页面,该方法的优点有:提供了“观点”和“模型”的清晰分离以及先前的GUI小部件的重复利用;减少了服务器上的下载;使得无需发送新请求到服务器即可改变客户端的显示成为可能;允许增加RDF寄存[2]。Renault使用java和java脚本将数据库作为关联数据发布,它由一个程序组件构成,该程序组件使用包含RDF数据的Jena模型,并可在遵循非信息资源的原则下保证逆向引用URI。

  关联数据原则对网络和公司信息系统同样有益。在Renault公司一项关于语义网技术的发布中,他们发布了一个关联数据库并展示了如何从外部应用连至所需服务。大部分代码可重复利用且可扩展,比如他们可以在短期内发布由SOAP网络服务提供的数据RDF。

  整合一个大公司的异构应用和数据源代价十分高昂,使用语义网技术可以大量裁减花费;通过RDF这一成熟的标准,公司在数据模型的交流、整合以及查询信息方面将更为方便。这一案例证明了利用数据关联技术可以极大地促进公司的数据整合、交流和查询。Renault公司的实践改善了RDF浏览器并实施了基于被逆向引用的资源类型而自定义描述的模板,减少了客户端应用开发的费用。

  5 结语

  关联数据作为语义网的一种实现方式,正在引领一场网络革命。关联数据网络不仅使许多新应用付诸实践,也为一些特殊领域的应用提供了契机。关联数据可为企业带来诸多益处,企业通过使用关联数据创新盈利模式,改善效益。关联数据为企业数据处理的各个步骤都提供了极大的便利,它不仅可以整合企业所有的数据还可随着商业模式的改变或信息系统的升级进行灵活的改变或更新,具有很强的适应性。此外它还可促进企业之间的数据交换、共享和开放。根据关联数据的层次模型以及基于关联数据的企业信息资源集成的目标取向和功能配置,本文构建了企业关联数据应用模型,在逻辑上可分为4层结构,自下而上分别为支撑环境层、信息资源层、信息处理层和应用层,为关联数据在企业的具体应用提供了参照。

  一些国外企业成功应用关联数据技术获得效益的经验对于企业界具有重要指导意义。Google运用关联数据技术支持使用Facebook Share和Yahoo! SearchMonkey的RDFa标记的视频内容,从而解决了不能搜索富媒体内容的难题,并尝试了开放和支持标记结构化数据。BBC公司内部使用关联数据技术并使用DBpedia和MusicBrainz作为控制词表,从而将位于不同地点的相同主题相互链接,并且利用公开数据链接云中的其它数据扩充内容;基于这些链接,BBC为其所有音乐和节目建立了关联数据站点。Renault公司发布了一个关联数据库并展示了如何从外部应用连至所需服务,证明了利用数据关联技术可以极大地促进公司的数据整合、交流和查询。随着研究的日益深化以及技术难题的逐步解决,关联数据在企业中的应用也日趋广泛。

  参考文献

  [1] Structured Dynamics LLC. Linked Data FAQ [EB/OL]. http://structureddynamics.com/linked_data.html.2014-2-22.

  [2] Aman Shakya, Hideaki Takeda, Vilas Wuwongse. Community-driven linked data authoring and production of consolidated linked data[J], International Journal on Semantic Web and Information Systems[J], 2009, 5(3): pp.23-48.

  [3] Fran?ois-Paul Servant. Linking enterprise data[EB/OL]. http://events.linkeddata.org/ldow2008/papers/21-servant-linking-enterprise-data.pdf. 2014-2-25.

  [4] Tim Berners-Lee. Linked data[EB/OL]. http://www.w3.org/DesignIssues/LinkedData.html. 2014-3-7.

  [5] Christian Bizer, Tom Heath, Tim Berners-Lee. Linked data-the story so far[J], International Journal on Semantic Web and Information Systems, 2009, 5(3): pp.1-22.

  [6] Chris Bizer, Tobias Gau?. Disco - Hyperdata Browser [EB/OL]. http://www4.wiwiss.fu-berlin.de/bizer/ng4j/disco. 2014-3-16.

  [7] Gong Cheng, Yuzhong Qu. Searching linked objects with Falcons: approach, implementation and evaluation[J], Internation Journal on Semantic Web and Information Systems, 2009, 5(3): pp.49-70.

  [8] 潘有能,张悦. 关联数据研究与应用进展[J], 情报科学, 2011, 29(1):pp.124-130.

  [9] 吴泱. 关联数据驱动的企业信息资源集成研究[D]. 硕士学位论文, 华中师范大学, 2012.

  通信技术论文发表期刊推荐《数字通信》开办已历时六年之久。在这六年中我们再不断的努力,不断的超越。以最前沿的时尚数码资讯,最专业的评测内容在数码杂志业稳局第一宝座。同时也拥有了大批读者与客户并得到百分好评!

文章标题:通信技术期刊投稿企业关联数据应用模式与案例综析

转载请注明来自:http://www.sofabiao.com/fblw/dianxin/tongxin/27003.html

相关问题解答

SCI服务

搜论文知识网的海量职称论文范文仅供广大读者免费阅读使用! 冀ICP备15021333号-3