1、 1 目录 中文摘要 . 22 英文摘要 . 3 1 引 言 . - 3 - 1.1 研究背景和意义 . - 3 - 1.2 数据来源和预处理 . - 4 - 1.3 属性数据的相关概念 . - 5 - 1.3.1 属性数据的定义 . - 5 - 1.3.2 名义变量和有序变量的区别 . - 6 - 1.4 SPSS 和 SAS 介绍 . - 6 - 2 基本理论 . - 7 - 2.1 相关系数的定义 . - 7 - 2.2 相关系数的显著性检验 . - 8 - 2.3 Kendall 的 相关系数的定义 . - 8 - 2.4 聚类分析的定义 . - 9 - 2.5 聚类分析的统计量 .
2、- 10 - 2.5.1 距离系数 . - 10 - 2.5.2 聚类分析的方法 . - 13 - 2.6 用 VARCLUS 过程进行变量聚类 . - 14 - 2.6.1 VARCLUS 过程的原理 . - 14 - 2.6.2 VARCLUS 过程的步骤 . - 14 - 3 结果和分析 . - 15 - 3.1 相关性分析在 SPSS 中的实现 . - 15 - 3.1.1 相关性分析的结果分析 . - 15 - 3.2 聚类结果解释分析 . - 17 - 3.2.1 聚类分析的结论 . - 27 - 4 总结 . - 27 - 5 谢辞 . - 29 - 6 参考文献 . - 30
3、- 1 属性数据建模分析 某项调查数据的统计分析 中文摘要 摘 要: 本文的目的是通过对问卷调查中的数据进行相关性分析和聚类分析, 以便探索出影响女性健康的因素。首先,本文把问卷中的 20 个问题作为变量,并用 SPSS 软件计算它们的 Kendall 的 相关系数。其次,运用SAS 软件实现对这 20 个问题的聚类分析。 最终得出一些结论,如精神比较衰弱的女性心慌气短和胸闷的可能性较大,泌尿系统受感染的患者一般会有尿黄、尿频的症状等等。因此 相关性分析和聚类分析对医生诊断以及开药都具有很大的指导性,故本文建议医生在诊断时要善于参考相关性分析和聚类分析的结果。 关键词: 属性数据;女性健康;相关性分析;聚类分析