首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2513254
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
TO BE A WELL ORGANIZER
数据挖掘者 发表于 2005/7/25 13:08:34
目标:随着经验和知识的不断积累,需要对这些资源进行良好的整理,能够很好地组织自己的知识和经验以及收集的资源,是使自己的水平更上一层楼的必要前提。 背景:关于知识的组织,特别是电脑上的信息资源的组织,是我一直没能很好解决的问题。原来的方法一般都是用文件系统来管理,建立起比较清晰的目录结构,类似于图书馆里的分类工作。但当文档越来越多,这种方法的缺点也日益凸现出来,表现为: l         主题交叉问题:很多文档常常是隶属多个分类的,分类体系很难把握。比如某篇文档可能被放在电信行业的某个项目目录下,但它也可以放在数据挖掘的某个专题下。 l         文档冗余问题:由于分类体系的子类很难做到是完全排它的,所以可能造成一篇文档被放在多个目录下,保存了多个副本。同时由于缺乏有效的版本控制,查找某个文档的最新版本常常也很困难。 l         垃圾信息多:比如在项目中积累的资料,实际上相当一部分文档在项目结束后是可以丢弃的,但因为担心误删了重要文件,所以很少进行清理工作,占据了大量的存储空间。 l         检索困难:单纯用Windows和Office的查找功能还不够,一方面无法检索PDF等文件,另一方面缺乏相关性的排序。建议采用Google的桌面搜索。 l         缺乏导航:当需要某方面主题的资料时,简单地进行搜索也并非上策。建立基本的导航信息还是很重要的,对文件系统的目录结构和各目录下的重要文档进行简要描述。(是否可以参考Amazon的网站组织)。 解决方法:合理稳定的目录结构+Google桌面搜索+导航程序+文档增强 l         合理稳定的目录结构:整理出目录结构模板,原则是以主题+项目为主线,尽量少地变动现有目录,只需对前两至三级结构进行规范。 l         Google桌面搜索:安装Google桌面搜索,并限制其对某些隐私文件的访问,避免潜在的信息泄漏。 l         导航程序:以Microsoft Access为基础,对文件进行结构化信息描述,列出主题相关的重要文档和项目的整体框架导引。 l         文档增强:养成良好的习惯,在OFFICE文档、PDF文档等中一定要填写关键的属性信息,包括作者、主题、类别、关键字等,同时文件名尽量和文档标题一致,以确保信息检索更准确。

阅读全文(2835) | 回复(0) | 编辑 | 精华

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.047 second(s), page refreshed 144810809 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号