首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2511787
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
文本分类研究进展(2001年)
数据挖掘者 发表于 2007/6/21 13:55:28
附件:500)this.width=500'>文本分类研究进展.pdf 这篇文章是我读博时和清华大学的唐春生博士等人合写的,当时在做文本挖掘方面的研究。未曾发表。重新把它翻出来,给研究同仁做个简单参考吧,也免得它在历史的垃圾堆里化为尘土;) 文本分类研究进展唐春生1  张磊2  潘东3 王珊4 摘要:随着Internet的飞速发展,网上电子文档和电子邮件的信息量成爆炸趋势,大规模的文本处理已经成为一个挑战,而文本自动分类是将文本划分到预定义的类中,帮助人们检索、查询、过滤和利用信息的有效手段。本文讨论了文本分类的一般过程,介绍了基于统计和机器学习以及基于语义的文本分类方法及性能评价方法,并针对Web文档的特殊性特别说明了Web文档分类中的链接分析技术,最后对文本分类的发展方向进行了有益的探讨。 关键词:文本分类、统计、机器学习、概念网络

阅读全文(9800) | 回复(2) | 编辑 | 精华
回复:文本分类研究进展(2001年)
LEILEI(游客)发表评论于2008/1/15 20:42:57
能多多提供点文本分类的资料吗?

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
回复:文本分类研究进展(2001年)
snow(游客)发表评论于2007/12/20 18:49:42
真是谢谢了,我是一名在读研究生,研究中文网页分类,找了很长时间这方面的文章,谢谢啦
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
» 1 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.234 second(s), page refreshed 144794496 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号