下载此文档

检测控制动态性状的QTL随机回归模型.docx


文档分类:高等教育 | 页数:约9页 举报非法文档有奖
1/9
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/9 下载此文档
文档列表 文档介绍
检测控制动态性状的QTL随机回归模型
 
 
周晓晶 何倩毓 张巧生
摘 要:表型值随着时间(生命时期、年龄、胎次等)或其他可以量化的因素(生理状态、生产水平、代谢率和环境条件等)变化的性状称为动态性状,如产蛋、泌乳和生长等
非参数的Legendre多项式广泛应用于定位动态性状基因位点。高阶的Legendre多项式能够很好的拟合方差和均值的变化,但是,这样的多项式经常在极值点高估观测值,导致龙格现象,也就是说,由于曲线上极值点处的振荡,曲线的拟合度随着阶数的升高而显著降低。并且关于动态性状的基因定位分析方法几乎都是建立在试验研究基础上的。相反,B样条函数(B-spline)能够更广泛的应用于非参数的数据分析去推断变量的经验分布。1974年,Gordon和Riesenfeld用B样条基函数代替了Bernstein基函数,构造了B样条曲线。B样条曲线分段组成。每一段的参数t的区间为[0,1]。这样就克服了Bezier曲线的缺点:改变Berier曲线任意一个控制点,曲线上的所有点都变换。BSpline曲线的优点:修改某一控制点只引起与该控制点相邻的曲线形状发生变化,远处的曲线形状不受影响。spline曲线段由几段低阶多项式构
成,他们在选择点相连接,这些选择点就是所谓的节点。同使用多项式分析比较,B-spline可以提供更加准确的遗传特征函数的估计值,而且不易出现端点异常的现象,这是由于在每个区段内使用了低阶多项式的原因。一个好的随机回归模型应该包含一组固定曲线,这些曲线可以描述不同群体变量之间的表型相关和加性遗传效应与永久环境效应的随机回归部分;还可能存在其他的随机回归因素,例如群体效应和母体遗传效应。
Meyer采用牛奶产量测定日记录模型分析澳大利亚安格斯牛的生长性状,在该文中,作者比较了随机回归模型的11个不同组合,他们分别是二次和三次的B样条曲线,结点个数达到了6个。通过计算,拟合生长性状的最优随机回归模型为带有3个结点的三次B样条曲线。
本研究基于随机回归模型提出了贝叶斯检测方法,在这里,B样条函数作为子模型来表征群体均值的动态性、QTL效应和指定个体的随时间独立的环境效应。计算机模拟说明方法的有效性,实际数据集来源于当地牧场的奶牛数据,包括420个个体的胸围记录,试图得出具有生物学意义的结论。
1 研究方法
2 模拟
进行模拟实验验证基于贝叶斯B样条(B-spline)的检测动态性状的定位分析方法的有效性和适应性。在贝叶斯分析的框架内,视B样条函数为回归模型的子模型,能够同时描述群体均值、多个QTL的遗传效应,以及其他环境因子随时间的变化。我们知道,在功能定位中采用的Logisitic曲线由于其不可加性,不能实现同时检测多个QTL。
以含有150个独立个体的回交群体为例。每一基因位点包含两种基因型。在长度为600cM的染色体片段上等距离设置61个共显性分子标记。放置10个控制动态性状轨迹的QTL。假定性状表型值随时间的变化及加性效应随时间的变化服从带有4个节点及2阶多项式的B-spline。每个个体的初始时间点指定为10,20,30,40,50,60,70,80,90,100。4个节点选取为10,40,70,100。节点的选择是至关重要的,节点过多导致过高拟合,节点太少导致拟合效果差。
对于模拟数据集,用阶数

检测控制动态性状的QTL随机回归模型 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数9
  • 收藏数0 收藏
  • 顶次数0
  • 上传人科技星球
  • 文件大小31 KB
  • 时间2022-08-04