1、 统计软件及应用课程设计 -虫情危害预测虫情危害预测 学 院: 班 级: 学 号: 姓 名: 指导老师: 1 目录目录 一背景与意义 2 二问题重述. 2 三方法简介. 2 (一).判别分析 2 (二).BP 神经网络. 3 四数据处理与分析. 3 (一).数据预处理 4 (二).判别分析 4 1.模型建立. 4 2.模型优化. 6 3.模型应用. 7 (三).BP 神经网络. 7 1.模型建立. 7 2.模型优化. 8 3.建模重建. 10 4.模型应用. 11 五总结与建议. 12 2 一 背景与意义 农作物主要害虫常年对农作物造成严重危害,使农业经济遭到损失。预测害 虫未来的发生动态,可
2、以使治虫工作得以有目的、有计划、有重点的进行。害虫 的预测预报工作是进行害虫综合防治的必要前提。 只有对害虫发生危害的预测预 报做到及时、准确,才能正确的拟定综合防治计划,及时采取必要的措施,经济 有效的压低害虫的发生数量,保证农业的高产、稳产。 二 问题重述 本文选取的预测预报对象是安徽庐江的田间水稻。 水稻螟虫是水稻的重要害 虫之一,对农作物的危害极大,其数量的多少一定程度上决定着水稻受危害的 严 重程度。通过对此昆虫的基本了解,发现气候因素对昆虫的发生发展有着密切关 系, 可以直接影响昆虫的生长、 发育、 生存、 繁殖, 从而造成害虫不同的发生期、 发生量和危害程度。同时水稻螟虫是变温昆
3、虫,其生长、发育和繁殖与气象条件 的关系极为密切,所以我们从气候因素角度入手进行分析是合理的。 本文从影响害虫生存繁殖的气候因素角度入手, 结合往年的气象资料以及影 响害虫生存繁殖的重要气候因素,选取了平均气温、最低气温、日照时间及降雨 量四个主要影响因素,运用统计学方法确定虫害的发生量与气候因子的关系, 并 给出相应的预测方法。 三 方法简介 针对实际问题,我们需要通过对历史数据的分析,给出准则:当给定新时期 下每一样本对应的各项气候指标时,能准确的判断其对应的虫害程度。下面介绍 两种方法。 (一).判别分析 判别分析是在分类确定的条件下, 根据某一研究对象的各种特征值判别其类 型归属问题的
4、一种多变量统计分析方法, 是用以判别个体所属群体的一种统计方 法。根据判别中的组数,可以分为两组判别分析和多组判别分析;根据判别函数 的形式,可以分为线性判别和非线性判别;根据判别式处理变量的方法不同,可 以分为逐步判别、序贯判别;根据判别标准不同,可以分为距离判别、Fisher 判别、Bayes 判别法。 本文选用的是 Fisher 判别法。Fisher 判别,是根据线性 Fisher 函数值进 行判别,使用此准则要求各组变量的均值有显著性差异。该方法的基本思想是投 影,即将原来在 R 维空间的自变量组合投影到维度较低的 D 维空间去,然后在 D 维空间中再进行分类。投影的原则是使得每一类的
5、差异尽可能小,而不同类间投 影的离差尽可能大。Fisher 判别的优势在于对分布、方差等都没有任何限制, 应用范围比较广。另外,用该判别方法建立的判别方差可以直接用手工计算的方 法进行新样品的判别,这在许多时候是非常方便的。 3 (二).BP 神经网络 BP 神经网络是 1986 年由 Rumelhart 和 McCelland 为首的科学家小组提出, 是一种按误差逆传播算法训练的多层前馈网络, 是目前应用最广泛的神经网络模 型之一。BP 网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示 描述这种映射关系的数学方程。它的学习规则是使用梯度下降法,通过反向传播 来不断调整网络的权值和
6、阈值,使网络的误差平方和最小。BP 神经网络模型拓 扑结构包括输入层、隐藏层和输出层。 BP 神经网络,由信息的正向传播和误差的反向传播两个过程组成。输入层 各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内 部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单 隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处 理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。 当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按 误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息 正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习 训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预 先设定的学习次数为止。 本文运用的是单层前馈网络模型,一般称为三层前馈网或三层感知器,即: 输入层、中间层(也称隐层)和输出层。如下图所示它的特点是:各层神经元仅 与相邻层神经元之间相互全连接,同层内神经元之间无连接,各层神经元之