首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2506014
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
留言板(签写留言)

请教关于RapidMiner中文数据显示问题。
Reya(游客)发表留言于2008/3/29 14:26:47
你好:
      我目前在linux 平台下使用RapidMiner,发现它无法显示中文数据内容。请问你知道怎么解决吗?

以下为blog主人的回复:

没有在linux平台上用过RapidMiner,建议你可以直接向RapidMiner的开发者咨询。

| 编辑 | 主人回复 | 删除
您好,有问题请教,谢谢帮助,希望能得到您的恢复
veraxxrr(游客)发表留言于2008/3/28 9:36:47
您好,非常抱歉打扰您了,但是我目前的学习遇到了很大的困难,希望能得到您的帮助,问题是这样的:
 
    现在有心脏病人的大量体检数据,囊括各种常见体检指标,我希望能够搭建一个模型,实现对发病概率的预测。比如,来一个病人的体检信息,能够预测他未来1年,3年,5年的发病概率,用曲线图展示出来。
 
    我觉得朴素贝叶斯分类器可能比较适合,因它可得出概率值,但是跟时间没有关联。
 
    暂时没有任何其它思路,您怎样认为呢,盼给出具体的建议,谢谢赐教,盼百忙中能帮忙
 
我的邮箱veraxxrr@126.com

以下为blog主人的回复:

我的建议是分年度建立模型,分别预测未来1年、3年、5年的发病概率。很多算法都可以用来建模,比如决策树、Logistic Regression、神经网络等等。

时间序列算法好像只能根据单个变量的历史走势来预测其未来发展,无法把其它自变量的内在关系反映出来。(这个我没有仔细研究,希望对时间序列精通的同行指正)

| 编辑 | 主人回复 | 删除
网站日志挖掘相关问题
lily(游客)发表留言于2008/3/19 10:51:23

您好,看了您的博客感觉受益匪浅。我是网站设计人员,最近正在对网站进行改版,想从网站日志中挖掘出用户的频繁访问路径、频繁访问页面组(或者叫关联页面),我们网站现在用的日志分析软件是awstats,可是这个软件分析得不详细。所以想问问您,有什么好的方法或者日志分析软件可以分析得到我需要的内容?非常感谢您

以下为blog主人的回复:

据我所知的,SAS有Web Analytics可以做这些分析。可能还有其它的软件也可以进行类似的分析,我就不太了解了。

| 编辑 | 主人回复 | 删除
支持你
瘦影秋水照(游客)发表留言于2008/3/18 15:13:53
真是谢谢你了,你的博客里面有许多有用的东西

以下为blog主人的回复:

;) You are welcome!

| 编辑 | 主人回复 | 删除
留言数:135  « 1 2 3 4 5 6 7 8 9 10 »
给idmer签写留言:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写留言内容!)


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.078 second(s), page refreshed 144762451 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号