新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论DOM, SAX, XPath等。
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - XML技术『 DOM/SAX/XPath 』 → dom4j解析大xml文件(20M左右)的问题。。。。。。,高手请进 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 14501 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: dom4j解析大xml文件(20M左右)的问题。。。。。。,高手请进 举报  打印  推荐  IE收藏夹 
       本主题类别: XML文档存取技术(DOM, SAX)    
     anchorTan 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:14
      积分:115
      门派:XML.ORG.CN
      注册:2005/4/25

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给anchorTan发送一个短消息 把anchorTan加入好友 查看anchorTan的个人资料 搜索anchorTan在『 DOM/SAX/XPath 』的所有贴子 引用回复这个贴子 回复这个贴子 查看anchorTan的博客楼主
    发贴心情 dom4j解析大xml文件(20M左右)的问题。。。。。。,高手请进

    用dom4j解析一20M左右的xml文件时,在设置了jvm的内存后,能够运行,要不然会报outofmemory错误,但是,我想把读入的xml文件内容显现出来的时候,我用了document.toXml()方法,但是得到的内容好像只是原来xml文件的一部分,比如说有些节点的子节点就没了,请高人指点这是怎么回事?,document不应该包含整个xml文件的吗?????

    SAXReader saxReader = new SAXReader();
    Document document = saxReader.read(new File("aaa.xml"));
    String content = document.toXML();


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/1/15 14:43:00
     
     Qr 帅哥哟,离线,有人找我吗?
      
      
      威望:9
      等级:博士二年级(版主)
      文章:4392
      积分:29981
      门派:XML.ORG.CN
      注册:2004/5/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Qr发送一个短消息 把Qr加入好友 查看Qr的个人资料 搜索Qr在『 DOM/SAX/XPath 』的所有贴子 访问Qr的主页 引用回复这个贴子 回复这个贴子 查看Qr的博客2
    发贴心情 
    DOM方式无法处理大型XML文档的,因为其解析方式是将XML完全读入内存中处理,20M的文件最少需要200M的内存空间,不报outofmemory才怪。
    要处理大型XML文档,用SAX吧。

    ----------------------------------------------
    没人帮忙,那就靠自己,自己才是最好的老师!本人拒绝回答通过站内短消息提出的问题!

    blog:http://Qr.blogger.org.cn

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/1/15 15:31:00
     
     Qr 帅哥哟,离线,有人找我吗?
      
      
      威望:9
      等级:博士二年级(版主)
      文章:4392
      积分:29981
      门派:XML.ORG.CN
      注册:2004/5/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Qr发送一个短消息 把Qr加入好友 查看Qr的个人资料 搜索Qr在『 DOM/SAX/XPath 』的所有贴子 访问Qr的主页 引用回复这个贴子 回复这个贴子 查看Qr的博客3
    发贴心情 
    document不应该包含整个xml文件的吗?????

    因为DOM的问题,内存无法完全加载XML文档。至于节点保留多少、遗漏多少,这个要看内存的大小。

    ----------------------------------------------
    没人帮忙,那就靠自己,自己才是最好的老师!本人拒绝回答通过站内短消息提出的问题!

    blog:http://Qr.blogger.org.cn

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/1/15 15:34:00
     
     anchorTan 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:14
      积分:115
      门派:XML.ORG.CN
      注册:2005/4/25

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给anchorTan发送一个短消息 把anchorTan加入好友 查看anchorTan的个人资料 搜索anchorTan在『 DOM/SAX/XPath 』的所有贴子 引用回复这个贴子 回复这个贴子 查看anchorTan的博客4
    发贴心情 
    好像SAX好像不太适合对XML文件进行修改......
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/1/18 13:13:00
     
     Qr 帅哥哟,离线,有人找我吗?
      
      
      威望:9
      等级:博士二年级(版主)
      文章:4392
      积分:29981
      门派:XML.ORG.CN
      注册:2004/5/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Qr发送一个短消息 把Qr加入好友 查看Qr的个人资料 搜索Qr在『 DOM/SAX/XPath 』的所有贴子 访问Qr的主页 引用回复这个贴子 回复这个贴子 查看Qr的博客5
    发贴心情 
    以下是引用anchorTan在2009-1-18 13:13:00的发言:
    好像SAX好像不太适合对XML文件进行修改......


    你用DOM方式修改大型XML文档看看,偶不相信你会觉得DOM适合。

    ----------------------------------------------
    没人帮忙,那就靠自己,自己才是最好的老师!本人拒绝回答通过站内短消息提出的问题!

    blog:http://Qr.blogger.org.cn

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/1/18 18:03:00
     
     anchorTan 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:14
      积分:115
      门派:XML.ORG.CN
      注册:2005/4/25

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给anchorTan发送一个短消息 把anchorTan加入好友 查看anchorTan的个人资料 搜索anchorTan在『 DOM/SAX/XPath 』的所有贴子 引用回复这个贴子 回复这个贴子 查看anchorTan的博客6
    发贴心情 
    非常感谢,那请问一下,用SAX怎么修改XML中的element或则attribute,能给个简单的实例吗,谢谢,不胜感激
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/1/19 16:23:00
     
     Qr 帅哥哟,离线,有人找我吗?
      
      
      威望:9
      等级:博士二年级(版主)
      文章:4392
      积分:29981
      门派:XML.ORG.CN
      注册:2004/5/15

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Qr发送一个短消息 把Qr加入好友 查看Qr的个人资料 搜索Qr在『 DOM/SAX/XPath 』的所有贴子 访问Qr的主页 引用回复这个贴子 回复这个贴子 查看Qr的博客7
    发贴心情 
    SAX不提供修改功能函数。要实现SAX“修改”XML,只有另想办法,但是不同的解析器,用法不同。只有根据特定的解析器,设计不同的算法来进行。

    ----------------------------------------------
    没人帮忙,那就靠自己,自己才是最好的老师!本人拒绝回答通过站内短消息提出的问题!

    blog:http://Qr.blogger.org.cn

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2009/1/19 20:38:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 DOM/SAX/XPath 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/12 13:20:35

    本主题贴数7,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    78.125ms