魅优论文范文网

 找回密码
 立即注册
查看: 12601|回复: 0
打印 上一主题 下一主题

[临床医学] 传染病的自组织神经网络预测研究

[复制链接]

3609

主题

3609

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
10917
跳转到指定楼层
楼主
发表于 2014-6-2 16:30:30 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【摘要】  针对传染病发病趋势的预测需要考虑许多因素的特点,提出了用改进的自组织神经网络方法对传染病发病趋势进行预测。改进的自组织神经网络的算法用免疫克隆选择算法的克隆算子和变异算子去改进自组织神经网络算法中的邻域大小和权值调整规则,使每个神经元的权值学习率和邻域大小随神经元的亲和力发生变化,从而保证网络在很大概率上收敛到全局最优,并克服了自组织神经网络分类效果受输入次序影响的不足。最后实例分析表明了该方法的实用性和有效性。

【关键词】  传染病; 自组织神经网络; 免疫克隆算法; 预测

  长久以来,传染病一直危害着人类的健康。历史上,传染病一次次的流行给人类生存和社会发展带来了巨大的灾难,如刚刚过去的禽流感、SARS以及正流行的甲型H1N1流感都给人类带来了重大威胁。长期以来,人类和各种流行病进行了不屈不挠的斗争,但是我们想要最终征服它,道路依然漫长曲折[1,2]。因此为了能揭示流行病的流行规律,预测其未来变化发展的趋势,已经有很多学者进行了相关的研究,其中建立数学模型研究传染病的传播过程动力学行为成为一个重要的研究方向,并且已取得了一些研究成果[3~6]。

  传染病发病会受到许多因素的影响,而且影响因素之间又存在着错综复杂的联系,很难运用结构式的因果模型加以解释,而数据之间的这种相互依存关系恰恰是研究对象最重要和最有用的特性,而且传染病的发生往往同时具有长期趋势、季节性、周期性、短期波动和不规则变动等特点,对这类资料进行预测分析常需要同时考虑这些特点。因此,针对传染病的这些特点,本研究提出用自组织神经网络(SOM)方法对传染病进行预测。SOM根据一定的学习规则,能对输入模式自动进行分类,即在无教师示教情况下,通过对输入模式的自组织学习,在竞争层将分类结果表示出来。这种分类方法减少了人为分类造成的主观性,保证分类结果的客观性。而且自组织神经网络方法与传统的统计方法相比,自组织神经网络方法能更好地从疾病的传播机理方面来反映流行规律,使人们能了解其流行过程中的一些全局性态。但是,SOM网络在应用中存在着分类结果与样本输入次序有关和易陷入局部最优的一些不足,故本研究用免疫克隆算法的克隆和变异机制进行改进,以期提高SOM算法分类的准确性和泛化性能,更好地反映传染病流行规律。

  1 自组织神经网络(SOM)

  自组织神经网络是在1981年由T.Kohonen提出的,由输入层和竞争层组成。自组织神经网络是一个简单的双层网络,每个输入节点通过权重W相联系,实现对输入信号的非线性降维映射。映射中保持拓扑不变性,即把拓扑意义下相似的输入映射到最近的输出节点上。SOM的典型结构如图1所示。

  图1 自组织神经网络的典型结构

  SOM网络由输入层和竞争层组成,输入层与竞争层各神经元之间完全连接。SOM神经网络结构有两个明显特点分别是:一是拓扑映射结构不是通过神经元的运动重新组织实现的,而是由各个神经元在不同兴奋状态下构成一个整体,所形成的拓扑结构;二是这种拓扑映射结构的形成具有自组织的特点。

  若输入n 维向量x=(x1,x2,…m) ,建立一个有m 个输出节点的二维网络,SOM网络算法的训练过程一般按照以下步骤来实现:

  Step1 初始化:对输出层各权向量赋[0,1]之间互不相同的随机数并进行归一化处理,得到W⌒j,j=1,2,…m ;建立初始优胜邻域Nj*(0) ;学习率η 赋初始值。

  Step2 接受输入:从训练集中随机选取一个输入模式并进行归一化处理,得到

  X⌒p, p∈{1,2,…,p} 。

  Step3 寻找获胜节点:计算X⌒p 与W⌒j 的点积,j=1,2,…m ,从中选出点积最大的获胜节点j* 。

  Step4 定义优胜邻域Nj*(t) 以j* 为中心确定t 时刻的权值调整域,一般初始邻域Nj*(0) ,训练过程中Nj*(t) 随训练时间逐渐收缩。

  Step5 调整权值:对优胜邻域Nj*(t) 内的所有节点调整权值:

  wji(t+1)=wij(t)+η(t)[xpi-wij(t)], i=1,2,…n,j∈Nj*(t) ,式中,η(t) 是训练时间t 和邻域内第j 个神经元与获胜神经元j* 之间的拓扑距离的函数,η(t)=η(0)(1-tT) 。

  Step6 结束检查:学习率是否衰减到零或某个预定的正小数。

  2 改进的SOM网络

  2.1 改进SOM算法的方法

  从SOM训练过程看,其权值修正公式Wij(t+1)=wij(t)+η(t)[xpi-wij(t)],由学习率函数修改公式η(t)=η(0)(1-tT) 可知,学习率函数η(t) 随着样本的输入线性递减,使权值的修改量随样本的输入而缩小,从而保证算法收敛,但是这就造成了网络的分类结果同样本的输入次序有关,另外,SOM网络的阈值Nj*(t)=Int[Nj*(0)(1-tT)] 是墨西哥帽函数的一种具体体现,这是一个随样本输入线性减小的函数,这样随着样本的输入获胜神经元的影响范围逐渐缩小,造成了对后续样本的不公平。因此本研究将免疫克隆选择算法的克隆和变异机制引入SOM的学习算法中,以克服SOM算法的这些不足。

  改进的SOM算法把免疫算法的抗原作为SOM算法的输入;B细胞受体作为SOM的权值;B细胞受体对抗原的识别过程作为SOM算法的学习过程。B细胞克隆的过程对应于SOM算法神经元的邻域调整过程,B细胞受体的变异对应于SOM算法权值的调整过程,亲和力最高的B细胞产生抗体相当于SOM中获胜神经元[7,8]。其具体改进方法如下:

  ① 改进的SOM网的竞争层神经元数量和邻域大小的调整

  设网络的输入模式Xk=(Xk1,Xk2,…,XkN), k=1,2,…q ,q 为样本数:竞争层神经元为A={a1,a2,…,aM) ,M 为神经元数量。竞争层神经元 j与输入层神经元权值矩阵为Wj=(w1j,w2j,…,wij,…wNj) ,i=1,2,…,N, j=1,2…,M, 其激活函数为二值型函数。

  亲和力为φ(aj) :φ(aj)=1‖Xl-Wj‖=1(i(xli-wij)2)12

  邻域函数为:Nj=f(M*,φ(aj)) ,取Nj=Int(M* φ(aj)Mi=1φ(ai)), j=1,2,…,M

  其中,φ(aj) 为第L个输入样本相对第 j个获胜神经元aj 的亲和力值;Nj 为 aj邻域内的神经元数量;‖‖ 为欧氏空间距离;M* 是克隆规模,且M*>M ,M*=MjNj; Int(*) 为取整符号。

  由Nj 的表达式可知,φ(aj) 越大,其克隆的规模也就越大,获胜神经元邻域的神经元数量越多,即可修改的神经元范围扩大了,也就是说,邻域函数的范围大小是与亲和力的值成比例的,克服了传统邻域函数随样本输入线性减小的问题,避免后续样本对修改权值的影响程度。

  ② 改进的SOM网络的权值学习规则与获胜神经元的选择

  竞争层神经元邻域克隆调整后,竞争层神经元变为:A′=(A, A′1, A′2, …,A′M) 。

  其中,A′l={ ai1,ai2,…,aiNi-1}, aij=ai, j=1,2,…,Ni-1。

  把获胜神经元根据φ(aj) 值的大小的进行克隆繁殖,这就在获胜神经元附近,产生一个变异解的群体,从而扩大了搜索范围,通过获胜神经元的扩张与压缩,将局部搜索与全局搜索结合起来实现问题的求解,这有助于防止早熟和搜索陷入局部最小值,从而克服了SOM算法在寻优搜索容易陷入局部极小的缺点[9,10]。在对权值调整过程中,权值调整不作用到A∈A′ ,对作用到神经元ai 的权值Wi 进行如下调整:

  wji(t+1)=wji(t)+η(t)( xlj-wji(t)) ,η(t)=Nt(0,σ2) ,

  σ=1φ(aj(t))

  其中,Nt(0,σ2) 为满足均值为0,标准差为σ 的正态分布随机变量,用于更新权值,从σ 的表达式可以看出, σ与φ(aj) 的大小成反比,而标准差决定了正态分布随机变量分布范围的大小,因而亲和力越大,则相应产生的正态分布随机变量的分布范围也就越大,这样通过增大权值的调整率以扩大搜索范围,促使其较快地跳出局部极小的区域而转移到另外-个较好的区域进行搜索,避免陷入局部极优。

  获胜神经元邻域的神经元权值调整后,重新计算神经元权值与输入向量的亲和力,i=1,2…,M ,若存在权值调整后的神经元

  b={ aij(t+1)|max{φ(aij)}}, j=1,2,…,(Ni-1),i=1,2,…M

  使得φ(ai)<φ(b),ai∈A ,则用b 取代原获胜神经元ai ,从而更新获胜神经元群,使获胜神经元权值更逼近输入向量。

  2.2 改进的SOM算法实现的具体步骤

  Step1 初始化:初始化权值向量Wj(0), j=1,2,…,M ;M 为竞争层获胜神经元数量。

  Step2 采样:获取输入样本Xl 提供给网络的输入层,并进行归一化处理得X⌒l 。

  Step3 对权值向量Wj=(w1j,w2j,…,wNj) 进行归一化处理得W⌒j ,计算W⌒j 与X⌒l 之间的亲和力:{φ(A(0))}={φ(a1(0)), φ(a2(0)),…,φ(aM(0))} 。

  Step4 更新邻域范围:克隆获胜神经元:

  A′(k)=Θ(A(t))=[Θ(a1(t)),Θ(a2(t)),…,Θ(aM(t))] ,

  其中,Θ(ai)=Ii ai, i=1,2,…,M, Ii 为Ni 维值为1的行向量,Ni 为第i 个获胜神经元的克隆规模。

  Step5 根据wji(t+1)=wji(t)+η(t) (xlj-wji(t)) 对克隆的神经元A′(t) 进行权值调整操作:A′(t)→A″(t) 。

  Step6 计算亲和力:A″(t): { φ(A″(t))} ,根据η(t)=Nt(0,σ2) 重新选择获胜神经元。

  Step7 计算亲和力A(t+1) :

  {φ(A(t+1))}={φ(a1(t+1)), φ(a2(t+1)),…,φ(aM(t+1))} 。

  Step8 根据Nj=Int (M* φ(aj)Mi=1φ(ai)), j=1,2,…,M 和η(t)=Nt(0,σ2) 更新学习率Nj(t) 和η(t) 。

  Step9 令t=t+1 返Step2,直到t+1 等于预定的值。 3 实例分析

  疟疾是全世界重要的虫媒传染病之一。近年研究发现,疟疾发病率上升、流行季节延长、流行疟区扩大的趋势与全球气候异常变暖存在密切关系。下面就以某省3个国家气象站观测站所在县1996年1月~1997年12月当月平均气象数据与后1个月疟疾发病率等级的历史数据,利用本研究提出的改进的SOM网络方法,并根据1997年12月的气象数据预测该地区1998年1月疟疾发病率等级。从所给历史数据可知,1996年2月~1997年12月疟疾的发病等级为4类,共有23个月,目的是预测第24个月的发病等级。各个月份的发病等级按月序号分为4类,如表1。表1 各月发病等级分类结果

  对应表中数据,确定改进的SOM网络输入模式为:

  Xk=(Xki,Xk2,…,XkN), k=1,2,…23, N=9

  即一共23组样本,每个样本中包括9个元素。输入样本经过归一化处理,采用Matlab7.1编程实现。令网络初始权值为[0,1]的随机数,输出获胜神经元克隆规模为320,最大进化代数为1000,按照改进的SOM算法步骤进行分类,训练结束后,经过改进的SOM网络训练后23组样本被分为4类。T1 结果如表2。

  从数据表2中能看出,以上聚类结果刚好对应于发病等级分类的1、2、3、4类。将1998年12月的数据代入建立好的SOM网络中得到对1999年1月的预测结果。

  X1=[869.2 19.7 30.6 10.7 131.4 16.6 67.1 219.4 203.1]′;

  T2=(3,1) 。其中括号里的3代表软件分类序号,1代表月份。显然属于第一类发病等级,即1999年1月份的发病等级为1,与实际情况完全相符。表2 改进的SOM方法分类结果

  4 结论

  本研究根据传染病发病的多种因素提出了用自组织神经网络来对其流行规律进行预测的思想,并把免疫克隆选择和变异的机制引入到SOM网络神经元邻域范围调整和权值的学习中,以克服SOM网络算法自身存在分类结果与样本输入次序有关和易陷入局部最优的不足,提出了改进的SOM网络方法,并建立了相应的学习算法。最后根据某地区疟疾发病受气象因素的影响,把该方法应用于该地区疟疾发病的预测中,预测结果与实际发病情况完全吻合,验证了该方法预测的准确性和客观性,为疟疾这一虫媒传染病的预防和控制提供了有利的理论依据。同时对其他相关领域也有一定的参考价值,笔者希望能起到抛砖引玉的作用。

【参考文献】
   1 The world health report 1995 Bridging the gaps.Geneva:World health organization,1995.

  2 World Health Organization.World malaria situation in 1993.Switzerland:Weekly Epidemiological Record,1996.

  3 W.D.Kermack and A.G.Mckendrick.Contributions to the mathematical theory of epidemics.Proceedings of the Royal Society.1927,700~721.

  4 E.Beretta and Y.Takeuchi.Global stability of an SIR epidemic model with time delays.Journal of mathematical biology,1995,33:250~260.

  5 胡连鑫,等. 应用灰色模型预测肠道传染病发病趋势. 疾病监测,2009,24(2):135~136.

  6 付长贺,邓甦. 马尔科夫链在传染病预测中的应用. 沈阳师范大学学报(自然科学版) , 2009, 27 (1) : 28 ~30.

  7 左兴权,李士勇,黄金杰. 一种新的免疫进化算法及其性能分析. 系统仿真学报,2003,15(11):1607~1610.

  8 杨孔雨,王秀峰. 免疫进化模型及其在优化计算中的应用. 系统仿真学报,2005,17(4):801~804.

  9 刘若辰,杜海峰,焦李成. 一种免疫单克隆策略算法. 电子学报,2004,32(11):1880~1884.

  10 Casdtro L N, Von Zuben F J. Learning and optimization using the clonal selection principle.IEEE Transactions on Evolutionary C
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机访问本页请
扫描左边二维码
         本网站声明
本网站所有内容为网友上传,若存在版权问题或是相关责任请联系站长!
站长联系QQ:7123767   myubbs.com
         站长微信:7123767
请扫描右边二维码
www.myubbs.com

QQ|Archiver|手机版|小黑屋|魅优论文范文网 ( 琼ICP备10200388号-7 )

GMT+8, 2024-5-4 05:59 , Processed in 0.357270 second(s), 20 queries .

Powered by 高考信息网 X3.3

© 2001-2013 大学排名

快速回复 返回顶部 返回列表