以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 云计算,网格,SaaS,P2P 』   (http://bbs.xml.org.cn/list.asp?boardid=57)
----  [转帖]会见专家:Susan Malaika 讨论 XML 标准和网格计算  (http://bbs.xml.org.cn/dispbbs.asp?boardid=57&rootid=&id=14591)


--  作者:admin
--  发布时间:2/18/2005 8:55:00 PM

--  [转帖]会见专家:Susan Malaika 讨论 XML 标准和网格计算
用于电子商务的数据库技术
IBM 硅谷实验室
2002 年 11 月

按此在新窗口浏览图片
  


按此在新窗口浏览图片

Susan Malaika 从 1995 年以来一直是 IBM 技术研究院(Academy of Technology)的成员。她在 1996 年与人合著了一本有关 Web 的书。她从 1998 年开始从事 DB2 工作,并专攻 XML 和 Web 技术,包括网格计算。她的个人兴趣包括歌剧、电影、戏剧以及后来的科幻小说。

如果您有关于 XML 或 XML 标准的问题,并希望 Susan 在今后的专栏文章中对此加以解答,那么请在[URL=http://www7b.software.ibm.com/dmdd/zones/expert/questionform.html]这里[/URL]提交。请注意,与本主题无关的问题将不做解答。

DB2DD:Susan,非常感谢您能和我们谈论这个重要的主题。XML 是这样普及的技术。您能说明一下为何数据管理开发人员和 DBA 需要知道 XML 发生了什么吗?

Susan:数据管理开发人员需要熟悉 XML,是因为 XML 被广泛用作计算机之间数据交换的表示法。XML 支撑着 Web 服务和网格计算,它为计算机系统和应用程序通信提供了基础架构。

它越来越多地被用于:

将保存在数据库中的数据标注和发布为 XML,用于数据交换。
将用传入的 XML 文档来驱动的数据库处理。
将被存储和搜索的 XML 文档。

DB2DD:我发现 XML 人员非常频繁地使用“文档”这个词。在这个环境中该词的特殊含意是什么呢?

Susan:基本上,XML 块称为 XML 文档。这里有个样本 XML 文件,其中 name、last 和 first 是元素名(标记名),salary 和 band 是属性名:

<personnelRec>
 <person salary="999000" band="A">
  <name>
   <last>Austen</last>
   <first>Jane</first>
  </name>
  <email>austen@bath.org</email>
 </person>
</personnelRec>


请注意标记是如何分层次的。这是 XML 文档的要求。

DB2DD:您能说明一下为什么这个相对简单的概念变得这么流行吗?

Susan:软件在不同的平台和操作环境上运行,可以产生注释成 XML 的数据,这使得在相同或不同的系统上运行的软件能更容易地处理 XML 数据,而不用进行许多规划。另外,还有相当多的处理 XML 的通用软件和工具使得开发支持 XML 的应用程序更加容易。所有这些特征使得 XML 在 1998 年的万维网联盟(World Wide Web Consortium,W3C)上首次成为候选推荐之后就流行了起来。

DB2DD:但是如果我们考虑了关系数据的情况,为什么还使用 XML 呢?为什么不在系统之间交换关系结果呢?

Susan:有两个特性使得 XML 适合用于计算机之间的数据交换,此前它们没有彼此引入:

在 XML 文档中编码字符的方法是在 XML 自身中通过编码声明定义的。编码声明告诉处理软件文档所遵循的 XML 规范的级别,以及文档采用了什么编码(最好是用 Unicode)。
对 XML 文档内容的附加约束可以分别用以下方式之一来详细说明:
文档类型定义(Document Type Definition,DTD)
XML 模式(Schema)(也是 XML 文档)
可以在本地或通过网络放置 DTD 和 XML 模式,而且可以使用 URL 的通用表示法来找到它们。

软件通过查询 XML 文档本身的编码声明并有所选择地查看适当的 DTD 或模式(如果要求进行严格地检查和分析的话),可以处理合乎 XML 规范的 XML 文档。处理软件不需要检查 XML 生成器。

比较这个和关系结果集处理:只有产生结果集的数据库系统才知道所产生的结果的描述,并且,如果数据库被另一家公司或组织所拥有,可能不允许处理结果集的软件访问数据库系统以进行查询。我们越来越多地看到发布为 XML 的有附带模式的关系型结果集,这使得结果集的处理有可能独立于产生结果集的数据库系统。为使之更容易,各个联盟正在定义用于交换银行、保险或医疗信息的 XML 模式,这些信息通常保存在关系数据库中。您可以在 OASIS 联盟中找到这样的模式列表。

DB2DD:您刚才说什么呢?您的意思是这就是关系数据库的结束吗?

Susan:不是,当然不是。更确切地说,这是层次数据交换格式与关系数据存储格式集成的开始。关系数据库拥有极好的特征:通过规范化后的数据独立性达到的高性能处理,并且是个很高级的查询语言。XML 缺乏这两个特性,尽管通过 SQL/XML 和 XQuery 可以使用 XML 查询语言。相反,XML 拥有可能独立于它的生成器而解释 XML 文档内容的机制。您可以认为 XML 文档是从关系数据的不同层次排列或视图构造而来,然后用一组完全不同的基本的规范化的表在另一个系统中进行处理。因为您的系统可以用另一个系统(也许是另一家公司的)所创建的 XML 文档进行驱动,而您有时会想要存储和搜索您接收到的 XML 文档,以及将 XML 文档作为数据输入源用于您的系统,因此需要集成层次数据和关系数据。

DB2DD:您提到了 SQL/XML 和 Xquery。它们是什么呢?

Susan:这些是数据管理社区非常感兴趣的主题。SQL/XML 由 SQL 语言中所定义的扩展组成,以显式支持 XML。SQL/XML 中首要步骤之一是在 XML 和关系系统之间映射数据类型和名称;例如,如何在关系列名和 XML 元素或属性名之间映射。还定义了从关系表到 XML 文档的映射。另一个步骤是定义 SQL 函数,将来自 SQL 查询的关系结果表示成 XML。SQL/XML 工作已在美国标准组织的 SQL 小组(NCITS H2)的 H2.3 子组中完成了。SQL/XML 扩展出现在 [URL=http://www-3.ibm.com/software/data/db2/udb/]DB2 V8.1[/URL] 中。

XQuery 是一种语言,在 W3C 上被定义成直接查询 XML 并返回 XML 结果。这是个振奋人心的举动。创造一种卓越的新查询语言并不是件寻常事。

DB2DD:您提到了 Web 服务和网格计算。它们是什么呢?它们与 XML 有什么关系?它们和数据库系统有关吗?

Susan:Web 服务提供了定义软件接口(方法名、输入参数和输出参数等)的方式,在 W3C 上作了标准化,名为 Web 服务定义语言(WSDL)。通过检查 WSDL,有可能推断在客户机和服务器之间的网络上流动的请求和应答消息。为了跨语言和平台互操作性,WSDL 消息用 XML 注释。多台不同客户机和支持特殊 WSDL 接口的服务器之间的互操作性是 Web 服务的目标之一。进一步的 Web 服务相关标准正在开发,例如 OASIS 的 Web 服务安全性(WS-Security)。

DB2&reg; 通过以简单的方式生成适当的 WSDL 来支持 Web 服务,这使得可以将 DB2 数据和存储过程作为 Web 服务来访问。DB2 应用程序还可能用作 Web 服务客户机。您可以在 [URL=http://www-900.ibm.com/developerWorks/cn/dmdd/]DB2 开发者园地[/URL]的 [URL=http://www-900.ibm.com/developerWorks/cn/webservices/]Web 服务专区[/URL]中阅读关于 DB2 中所支持的 Web 服务的更多信息。

网格计算定义系统软件组件之间标准接口,以便做到诸如这样的事:一台计算机能将工作调度到另一台计算机上运行,或者可以使用标准化的接口访问来自分布式源的数据。网格计算接口通过 WSDL 进行定义并通过全球网格论坛(Global Grid Forum,GGF)进行标准化。用于文件和数据库的基于 Web 服务的接口已开始在数据库访问和集成服务工作小组(Database Access and Integration Services Working Group,DAIS-WG)的 GGF 上作定义。IBM 积极参与 DAIS-WG 的 GGF。可在 [URL=http://www.cs.man.ac.uk/grid-db/papers/dams.pdf]http://www.cs.man.ac.uk/grid-db/papers/dams.pdf[/URL] 上获取 GGF5 中所提供的文章。

请密切关注网格计算 - 正如您可以从最近的 IBM 大张旗鼓地报导 [URL=http://www-3.ibm.com/e-business/doc/content/feature/vision.html?P_Site=S645&P_Campaign=102BWW5R&P_Creative=B1VI00LM]eBusiness on demand[/URL] 中看到的那样,IBM 正在越来越努力使网格计算成为商业现实。

DB2DD:显然,XML 成功的关键因素是有许多与 XML 相关的标准,但是要跟上它们的步伐很难。由于它发展得如此快,标准化进程如何跟得上呢?

Susan:的确如此,因为事实上需要进行非常多的工作,所以有许多联盟等正在进行标准化工作。让我们把标准分成四个种类,如[URL=http://www-900.ibm.com/developerWorks/cn/dmdd/library/techarticles/0211malaika/index.shtml#fig1]图 1[/URL] 所示;用下列方法去思考会更加容易:

首先,XML 有许多要依靠的标准,比如 Unicode 和 URL 表示法。
接着,是用于 XML 基本定义和组成部分的标准。这些标准使得可以通过不同类的系统和应用程序交换 XML,并可以编写基本的 XML 应用程序。这些标准包括 XML 规范(包括 DTD)本身和 XML 模式规范、XML 段、XInclude 等。
接着,这些标准是用于 XML 数据和系统的构件。这些标准有助于构造高级的 XML 应用程序和格式。它们包括 XML 转换技术(例如通过 XSL、XSLT 转换来的样式表)、查询语言(例如 SQL/XML 和 XQuery)和 XML 导航接口(例如 DOM)。
接着是帮助构建应用程序的标准,这些应用程序以标准的方式(例如 Web 服务和网格计算)在网络上通过 XML 表示法通信。

图 1. 一些与 XML 相关的标准
按此在新窗口浏览图片

DB2DD:说到标准,我们已经听说了 XML 1.1。它是什么?重要吗?

Susan:是的,XML 1.1 很重要,因为它提供了对 Unicode 最新版本的支持,因此 XML 1.1 也引入对一个字符的支持,该字符在 z/OS™ 系统上用来表示文档中行结束(类似于换行或回车字符)。在 XML 解析器支持 XML 1.1 之前,z/OS 用户可能发现,只要该字符在 XML 文档中出现,他们的 XML 文档就有可能因为格式不对或无效而遭拒绝。

DB2DD:您已谈到了 XML 是如何影响应用程序的。那么 XML 的成功是如何影响数据管理系统的,比如说 DB2?

Susan:作为交换格式的 XML 表示法的普及对数据库管理系统提出了很多要求,包括:

当有更多 XML 的交换数量时,需要存储和搜索 XML。
当有更多 XML 的存储数量时,需要查询和更新 XML。
当需要定义更多的表示成 XML 的数据时,需要将 XML 转换成其它的 XML 格式。
当 XML 需要用于驱动许多现有的和新的商业应用程序时,需要将 XML 转换成关系格式。
当有更多公司、系统和应用程序以 XML 格式交换数据时,需要将关系数据转换成 XML。

DB2DD:看来我们应该和您谈谈这些要求是如何体现为 DB2 的变化的。

Susan:我很乐意。

DB2DD:您有什么总结性想法要补充吗?

Susan:现在是研究数据管理的好时机。关于数据有许多新的机会。把握住它们吧!

参考资料
位于 [URL=http://www.w3.org/]http://www.w3.org/[/URL] 上的 W3C(World Wide Web Consortium)。
位于 [URL=http://www.ietf.org/]http://www.ietf.org/[/URL] 上的 IETE
位于 [URL=http://www.oasis-open.org/]http://www.oasis-open.org/[/URL] 上的 OASIS 联盟
位于 http://www.ncits.org/tc_home/h2.htm 上的 SQL 标准
位于 http://www.w3.org/TR/xquery/ 上的 XQuery
位于 [URL=http://www.w3.org/TR/wsdl]http://www.w3.org/TR/wsdl[/URL] 上的 WSDL(网络服务定义语言)
位于 [URL=http://www.gridforum.org/]http://www.gridforum.org/[/URL] 上的 GGF(全球网格论坛)
位于 [URL=http://www.gridforum.org/6_DATA/dais.htm]http://www.gridforum.org/6_DATA/dais.htm[/URL] 上的 DAIS-WG
位于 [URL=http://www.w3.org/TR/xml11/]http://www.w3.org/TR/xml11/[/URL] 上的 XML 1.1
声明


所有有关 IBM 的未来方向或意向的信息都可以随时更改,而不另行通知,它们仅表示了目的和目标而已。


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
46.875ms