1、 多元线性回归方法应用 摘要 回归分析是统计分析的重要组成部分,在生产实际和科学实验中有着广泛 应用,用回归分析方法建立模型来研究实际问题是一种常用的有效方法。它通过 研究随机变量之间的关系来描述数据群体的主要特征。 本文首先给出回归分析方法的主要内容及解决问题的一般步骤,简单的介 绍了变量间的两类关系,叙述了多元线性回归理论模型,列举了多元线性回归模 型应遵从的假定条件, 探讨了多元线性回归模型中未知参数的估计方法及其参数 的检验问题。 最后通过具体的案例来总结了多元回归分析在各个科学领域的广泛 应用, 重点描述了多元线性回归分析方法在自变量对因变量影响的显著性判断中 的应用。 关键词:关键
2、词:多元线性回归模型;模型检验;实例应用 引言引言 回归分析方法是统计分析的重要组成部分,在研究实际问题时,用回归分 析方法建立模型来研究问题就是一种常用的有效方法。 什么是回归分析呢?大家 知道:回归分析是研究随机变量之间的关系。回归分方法一般与实际联系比较密 切,因为随机变量的取值是随机的,大多数是通过实验得到的,这种来自于实际 中与随机变量相关的模型的准确度(可信度)如何,需通过进一步的统计实验来 判断其模型中随机变量(回归变量)的显著性,而且,往往需要经过反复地进行 检验和修改模型,直到得到最佳的结果,最后应用于实际中去。 回归分析是一种传统的应用性较强的科学方法,在各个科学领域都得到
3、了 广泛的应用。它不仅能够把隐藏在大规模原始数据群体中的重要信息提炼出来, 得到其变量间相关关系的数学表达式,从而把握住数据群体的主要特征,进而利 用相关概率统计知识以判别其有效性;另外,还可以利用关系式,由一个或多个 变量值去预测和控制另一个因变量的取值,从而知道这种预测和控制达到的程 度,并进行因素分析。 回归分析的主要内容是: (1) 从一组数据出发, 确定这些变量 (参数) 间的定量关系(回归模型) ; (2) 对模型的可信度进行统计检验; (3) 从有关的许多变量中,判断变量的显著性(即哪些是显著的,哪些 是不显著的,显著的保留,不显著的忽略); (4) 应用的结果是对实际问题作出的
4、判断。 在利用回归分析解决问题时,首先要建立模型,即函数关系式,其自变量称为回 归变量,因变量称为应变量或响应变量。如果模型中只含有一个回归变量,称为 一元回归模型,否则称为多元回归模型(实际中所见到的大都是线性回归模型, 非线性的一般可以化为线性的来处理) 2。 多元线性回归数学模型 许多现象往往不是简单的与某一因素有关,而是受多个因素的影响,此时就 需要用两个或两个以上的影响因素作为自变量来解释因变量的变化, 这就是多元 回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分 析就是多元线性回归。设可预测的随机变量为y,它受到p个非随机因素 p xxxx, 321 ,和不可
5、预测的随机因素的影响。多元线性回归数学模型为: pppp xxxxxy 113322110 其中),0( 2 N, p , 210 为回归系数,对y和 p xxxx, 321 分别进行n 次独立观测,取得n组数据(本)n,3,2,1(, 121 ixxxy ipiii 则有: nnppnn pp pp xxxy xxxy xxxy 1122110 212122221102 111112211101 (4) 其中 n , 321 相互独立,且服从),0( 2 N分布。 令 n y y y Y . . 2 1 , 1 2 1 . . p , 1 2 1 . . p 121 122221 111211 1 1 1 npnn p p xxx xxx xxx x 则式(4)用矩阵形式表式为 xy ),0( 2 n IN (5) 2.4 模型检验 多元线性回归数学模型建立后,是否与实际数据有较好的拟合度,其模型线 性关系的显著性如何等,还需通过数理统计进行检验。 多元性回归模型与一元线 性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检 验与评价,以决定