1、- 1 - 数据分析课程设计论文数据分析课程设计论文 题目:我国各省市自治区社 会发展的综合状况指标分析 学院学院: : 专业专业: : 姓名姓名: : 学号学号: : - 2 - 我国各省市自治区社会发展的综合状况我国各省市自治区社会发展的综合状况 指标分析指标分析 摘要摘要 一个地区的全面发展必须使经济和社会协调发展。 为了全面衡量社会发展水 平,有必要选择一套能反映社会发展的有代表性的社会指标进行综合评价,对每 个地区的社会发展水平进行测量分析,我们根据各地区统计指标,选择了有代表 性的社会经济指标,包括城镇居民可支配收入、农村居民可支配收入、在校学生 数、学校数、卫生机构数、固定资产投
2、资总额等方面数据进行综合考察,利用主 成分分析方法对各地区综合发展状况进行评价。 论文中主要运用的方法是主成份分析法。 主成份分析法的目的是利用降维的 思想,把多指标转化为少数几个综合指标。分析出主成分后,对数据进行综合排 名,能较直观的反应社会发展的综合状况,便于分析各省市自治区的社会发展情 况和影响因素。 关键词:各省自治区 社会发展综合状况指标 主成分分析 排名 - 3 - 目录目录 一、一、 问题的提出问题的提出 4 二、二、 基于主成份分析的社会发展综合状况指标的筛选基于主成份分析的社会发展综合状况指标的筛选 2.1原理概述 4 2.1.1主成分分析的一般数学模型 4 2.1.2主成
3、分分析确定的一般原则 5 2.1.3主成分分析的基本步骤 5 2.1.4主成分分析得到的主成分与原始变量之间的关系 5 2.2 原始数据及来源 6 2.3 对指标的主成分分析及筛选 7 2.3.1 操作过程 7 2.3.2 实验结果输出 8 2.3.3 实验结果分析 12 三、三、 总结总结 14 参考文献参考文献 16 附录附录 16 - 4 - 第一章第一章 问题的提出问题的提出 中国的经济和社会的发展如何让才能踏上一条内外和谐、 全面增长的稳健之 路,不但攸关中国自身的利益,也成为举世瞩目的焦点。本文根据各省的社会发 展指标,将全国主要省份社会实力进行排名,从而可以为政府决策部门对社会的
4、 发展规划提供一定的依据。 日后通过政府政策的调整, 各省再发挥各自优势力量, 抓住机遇,社会全发张和可持续发展能力一定会进一步提高。 社会发展状况评价的难点在于反映社会发展的指标众多, 每一项指标又会从 不同视角反映社会发展状况。所以,依据他们作综合评价有一定难度。我们可以 看到, 成份分析法的目的是利用降维的思想, 把多指标转化为少数几个综合指标, 从而很好地解决了这一问题。 第二章第二章 基于基于主成份分析的社会发展综合状况指标主成份分析的社会发展综合状况指标的筛选的筛选 2.12.1原理概述原理概述 主成分分析是考察多个定量(数值)变量间相关性的一种多元统计方法。它 是研究如何通过少数
5、几个主分量(即原始变量线性组合)来解释多变量的方差 协方差结构。具体地说,是导出少数几个主分量,使它们尽可能多地保留原始 变量的信息,且彼此间不相关。主成分分析常被庸吏寻找判断某种事物或现象的 综合指标,并给综合指标所蕴藏的信息以恰当解释,以便更深刻地解释事物内在 的规律。 2.1.12.1.1 主成分分析的一般数学模型主成分分析的一般数学模型 假设有n个样本,每个样本测得p项指标(pn)。由于这p项指标之间往往具 有相关关系,且每个样本各指标取值的单位和数量大小不同,使我们较难利用这 p项指标的信息区别这n个样本。因此,如何从这p项指标中找出少数几个综合指 标,使它们尽可能多地反应各项指标的信息,而且彼此之间不相关,这就成为一 个重要的问题。怎么解决这个问题,主成分分析给出了最好的方法。 如果记原来的变量指标为 p xxx 21, ,它们的综合指标新变量指标为 21, x x, m z(mp)。则 )2( 2211 22221212 12121111 pmpmmm pp pp xlxlxlz xl