Blog信息 |
|
blog名称:IDMer (数据挖掘者) 日志总数:175 评论数量:848 留言数量:119 访问次数:2513254 建立时间:2005年6月24日 |
我的相册 |
|

|
联系方式 |
 |
|
| |
公告 |
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com 我的新浪微博:@张磊IDMer |
网络日志 |
|
TO BE A WELL ORGANIZER |
|
|
|
|
|
数据挖掘者 发表于 2005/7/25 13:08:34 |
|
|
|
目标:随着经验和知识的不断积累,需要对这些资源进行良好的整理,能够很好地组织自己的知识和经验以及收集的资源,是使自己的水平更上一层楼的必要前提。
背景:关于知识的组织,特别是电脑上的信息资源的组织,是我一直没能很好解决的问题。原来的方法一般都是用文件系统来管理,建立起比较清晰的目录结构,类似于图书馆里的分类工作。但当文档越来越多,这种方法的缺点也日益凸现出来,表现为:
l 主题交叉问题:很多文档常常是隶属多个分类的,分类体系很难把握。比如某篇文档可能被放在电信行业的某个项目目录下,但它也可以放在数据挖掘的某个专题下。
l 文档冗余问题:由于分类体系的子类很难做到是完全排它的,所以可能造成一篇文档被放在多个目录下,保存了多个副本。同时由于缺乏有效的版本控制,查找某个文档的最新版本常常也很困难。
l 垃圾信息多:比如在项目中积累的资料,实际上相当一部分文档在项目结束后是可以丢弃的,但因为担心误删了重要文件,所以很少进行清理工作,占据了大量的存储空间。
l 检索困难:单纯用Windows和Office的查找功能还不够,一方面无法检索PDF等文件,另一方面缺乏相关性的排序。建议采用Google的桌面搜索。
l 缺乏导航:当需要某方面主题的资料时,简单地进行搜索也并非上策。建立基本的导航信息还是很重要的,对文件系统的目录结构和各目录下的重要文档进行简要描述。(是否可以参考Amazon的网站组织)。
解决方法:合理稳定的目录结构+Google桌面搜索+导航程序+文档增强
l 合理稳定的目录结构:整理出目录结构模板,原则是以主题+项目为主线,尽量少地变动现有目录,只需对前两至三级结构进行规范。
l Google桌面搜索:安装Google桌面搜索,并限制其对某些隐私文件的访问,避免潜在的信息泄漏。
l 导航程序:以Microsoft Access为基础,对文件进行结构化信息描述,列出主题相关的重要文档和项目的整体框架导引。
l 文档增强:养成良好的习惯,在OFFICE文档、PDF文档等中一定要填写关键的属性信息,包括作者、主题、类别、关键字等,同时文件名尽量和文档标题一致,以确保信息检索更准确。 |
|
|
|
阅读全文(2835) | 回复(0) | 编辑 | 精华 |
|
|
|
|
|
|
| |