您好,非常抱歉打扰您了,但是我目前的学习遇到了很大的困难,希望能得到您的帮助,问题是这样的:
现在有心脏病人的大量体检数据,囊括各种常见体检指标,我希望能够搭建一个模型,实现对发病概率的预测。比如,来一个病人的体检信息,能够预测他未来1年,3年,5年的发病概率,用曲线图展示出来。
我觉得朴素贝叶斯分类器可能比较适合,因它可得出概率值,但是跟时间没有关联。
暂时没有任何其它思路,您怎样认为呢,盼给出具体的建议,谢谢赐教,盼百忙中能帮忙
以下为blog主人的回复:
我的建议是分年度建立模型,分别预测未来1年、3年、5年的发病概率。很多算法都可以用来建模,比如决策树、Logistic Regression、神经网络等等。
时间序列算法好像只能根据单个变量的历史走势来预测其未来发展,无法把其它自变量的内在关系反映出来。(这个我没有仔细研究,希望对时间序列精通的同行指正) | |