1、 关于中小型银行大数据的统计分析 学 院 专 业 * 班 级 * 学 号 * 姓 名 指导教师 年 月 目录 前言 1 一、采集样本及数据整理 2 1、数据的搜集方法及说明 . 2 2、数据整理:给出频数、频率分布表及说明 . 5 3、画出直方图和折线图并给出说明 . 5 4、 画出经验分布函数 7 二、假定总体服从正态分布,给出, 2 的估计 . 8 1、矩估计法 . 8 2、极大似然估计 . 8 三、参数区间估计 . 10 1、方差 2 未知,求数学期望的置信区间 10 2、数学期望, 2 均未知,求方差 2 的置信区间 . 10 四、参数的假设检验 . 11 1.样本统计数据的 t 检验
2、 . 11 2.样本统计数据的 2 检验 . 11 五、 非参数假设检验 13 六、结论 . 15 参考文献 . 16 1 前言 数理统计是一门对随机现象进行有限次的观测或试验的结果进行数量研 究,并依之对总体的数理规律性作出具有一定可靠性推断的应用数学学科。也 就是说,数理统计学是统计学的数学基础,它是研究怎样有效地收集、整理和 分析带有随机性的数据,以对所考察的问题作出推断和预测,直至为采取一定 的决策和行动提供依据和建议的数学分支。近几十年来,数理统计的广泛应用 是非常引人注目的。在社会科学中,选举人对政府意见的调查、民意测验、经 济价值的评估、产品销路的预测、犯罪案件的侦破等,都有数理
3、统计的功劳1。 在经济领域,从某种商品未来的销售情况预测,甚至整个国家国民经济状况预 测及发展计划的制定都要用到数理统计知识2。在自然科学、军事科学、工农 业生产、医疗卫生等领域,哪一个门类都离不开数理统计。它的用处之大不胜枚 举。 笼统地说,数理统计学的理论和方法,与人类活动的各个领域在不同程度上都 有关联。 因为各个领域内的活动,都得在不同的程度上与数据打交道,都有如何收 集和分析数据的问题,因此也就有数理统计学用武之地。可以这么说,现代人的 生活、科学的发展都离不开数理统计。从某种意义上讲,数理统计在一个国家 中的应用标志着这个国家的科学水平3。 数理统计可以看做是概率论的推广应用,其众
4、多内容都是建立在概率论基 础之上的4。但是,数理统计作为纯数学的一个方向,如果仅仅研究数理统计 的数学性质,就脱离了数学在科学研究中应有的价值。正如数学以其逻辑性和 严密性被其他学科作为有力工具运用于分析应用中一样,数理统计也因为其逻 辑性和严密性被引用到银行的领域中。本文就是对这方面的应用,通过用计算 机领域中的信息安全技术,对全国中小型银行的大数据处理个数的统计。其间 分别进行了数据模型的选择和建立,数据的采集,数据的整理,对数据进行的 统计推断,给出矩法估计、极大似然估计、给出参数估计区间、给出 2 ,的 t 检验和 2 检验,进行非参数拟合优度检验,从而得出相应的结论。 2 一、采集样
5、本及数据整理 1、数据的搜集方法及说明 众所周知,数据的搜集方法有直接搜集方法和间接搜集方法,直接搜集是 直接向调查对象搜集反映调查单位的原始资料数据。而我采用的是间接搜集方 法,也就是通过网络搜集到已经加工整理过的、能够说明总体现象的数据。本 文采集的是2012年5 月1日中国部分中小型银行利用信息安全技术对大数据处 理个数。如表 11 所示: 表 1-1 中国部分中小型银行数据统计 地区地区 银行名称银行名称 截止时间截止时间 大数据大数据(亿)(亿) 湖北 孝感市商业银行 2011-10-1 78.54 辽宁 丹东市商业银行 2011-10-1 162.33 湖南 岳阳市商业银行 201
6、1-10-1 399.56 浙江 象山县绿叶城市信用社 2011-10-1 457 四川 宜宾市商业银行 2011-10-1 702.22 黑龙江 牡丹江市商业银行 2011-10-1 850.5 云南 曲靖市商业银行 2011-10-1 1000.55 山西 晋中市商业银行 2011-10-1 1023.4 山西 阳泉市商业银行 2011-10-1 1233.85 四川 遂宁市商业银行 2011-10-1 1355.7 湖北 黄石市商业银行 2011-10-1 1379.6 山东 枣庄市商业银行 2011-10-1 1388 重庆 重庆三峡银行 2011-10-1 1501 陕西 宝鸡市商业银行 2011-10-1 1503.8 河南 信阳市商业银行 2011-10-1 1722 辽宁 鞍山市商业银行 2011-10-1 1795.1 河北 邢台市商业银行 2011-10-1 1800 湖北 荆州市商业银行 2011-10-1 1800 河南 安阳市商业银行 2011-10-1 1800