Blog信息 |
|
blog名称:IDMer (数据挖掘者) 日志总数:175 评论数量:848 留言数量:119 访问次数:2511787 建立时间:2005年6月24日 |
我的相册 |
|

|
联系方式 |
 |
|
| |
公告 |
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com 我的新浪微博:@张磊IDMer |
网络日志 |
|
文本分类研究进展(2001年) |
|
|
|
|
|
数据挖掘者 发表于 2007/6/21 13:55:28 |
|
|
|
附件:500)this.width=500'>文本分类研究进展.pdf
这篇文章是我读博时和清华大学的唐春生博士等人合写的,当时在做文本挖掘方面的研究。未曾发表。重新把它翻出来,给研究同仁做个简单参考吧,也免得它在历史的垃圾堆里化为尘土;)
文本分类研究进展唐春生1 张磊2 潘东3 王珊4
摘要:随着Internet的飞速发展,网上电子文档和电子邮件的信息量成爆炸趋势,大规模的文本处理已经成为一个挑战,而文本自动分类是将文本划分到预定义的类中,帮助人们检索、查询、过滤和利用信息的有效手段。本文讨论了文本分类的一般过程,介绍了基于统计和机器学习以及基于语义的文本分类方法及性能评价方法,并针对Web文档的特殊性特别说明了Web文档分类中的链接分析技术,最后对文本分类的发展方向进行了有益的探讨。
关键词:文本分类、统计、机器学习、概念网络 |
|
|
|
阅读全文(9800) | 回复(2) | 编辑 | 精华 |
|
|
|
|
|
|
|
回复:文本分类研究进展(2001年) |
|
|
|
|
|
LEILEI(游客)发表评论于2008/1/15 20:42:57 |
|
|
|
能多多提供点文本分类的资料吗? |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:文本分类研究进展(2001年) |
|
|
|
|
|
snow(游客)发表评论于2007/12/20 18:49:42 |
|
|
|
真是谢谢了,我是一名在读研究生,研究中文网页分类,找了很长时间这方面的文章,谢谢啦 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
| » 1 »
| |