下载此文档

处理右删失数据的多重插补法参考.doc


文档分类:通信/电子 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
处理右删失数据的多重插补法
   摘要:生存分析是对寿命数据进行统计推断的方法,在此研究过程中,经常会遇到删失数据,文章介绍删失数据的类型。为了解决删失数据中存在的治愈指标部分缺失的生存问题,文章主要研究基于渐近正态数据扩充的多重处理右删失数据的多重插补法
   摘要:生存分析是对寿命数据进行统计推断的方法,在此研究过程中,经常会遇到删失数据,文章介绍删失数据的类型。为了解决删失数据中存在的治愈指标部分缺失的生存问题,文章主要研究基于渐近正态数据扩充的多重插补法,主要介绍多重插补法的基本原理和方法步骤。最后总结全文,给出今后研究的方向及展望。
   关键词:生存分析;右删失数据;多重插补法
   一、引言
   生存分析是对一个或多个非负随机变量进行统计分析,即对寿命数据进行分析的一种方法,在医学领域,主要是人和生物寿命的研究、手术后人的寿命的预测以及药物疗效的分析。在进行生存分析研究中,经常会遇到删失数据,现在研究人员已经研究出许多方法去处理带有删失数据的问题,本文主要研究的多重插补法是一个处理缺失数据的流行并且实用的方法,最早由Rubin在1978年提出,随后很多学者对此方法做出改进和延伸。本文意在通过了解删失数据类型,探究多重插补法对右删失数据中缺失的治愈指标进行插补及分析的原理和实现过程。
   二、删失数据
   在生存分析实验研究中,常常要在给定的时间内完成研究,所以得到的数据存在两种状态,一种是完整观测到的数据,另一种是删失数据,本文针对删失数据进行介绍,分别介绍右删失数据、左删失数据和区间删失数据。
   (一)右删失数据
   在生存分析调查中,会有一个固定的时间,在给定时间开始给定时间结束。在此过程中,会出现患者在研究结束时没有死亡或者研究人员与患者失去联系等情况,此时,患者的生存情况未知,但已知患者的生存时间大于一个确定的数值,这种数据就被称为右删失数据。
   具体来说,本文设患者的生存时间为X,删失时间为C。若X≤C,则说明这个是可观测到的数据;若X>C,则说明此患者在C处删失。令最终观测时间为U,则U=XΛC,即观测时间U为患者生存时间X和删失时间C中较小的数值。本文设删失指标为δ,δ=I{X≤C}。若δ=1,则表示患者的生存时间是可被观测的,此时U=X;若δ=0,则说明患者的生存时间是右删失的,此时U=C。在试验跟踪期间,本文主要针对患者的生存时间来研究,患者分为已治愈和未治愈两种状态,研究未治愈患者的生存时间是本文研究的重点。右删失数据中患者的治愈状况在研究中缺失,故便于后续研究,引入治愈指标Y,若Y=1,则患者未治愈,若Y=0,则患者治愈。研究过程中,同时要分析生存概率,则引入协变量Z=(Z1,Z2,…ZP,P=1,2,3,…),最终的观测数据集为(U,Z,δ)。
   例如在一项为期一年的研究期间内共有六位急性白血病患者进入临床研究,我们还假设某种治疗对这些患者起作用而且实现了病情缓解,缓解时间在圖1中给出。患者A、C和E分别在2月初、4月初和9月初出现缓解后又分别4个月、6个月和3个月后病情复发。患者B在3月初出现缓解但在四个月后失踪(退出研究不被跟踪观察),从而缓解时间至少是4个月。患者D和F分别在5月初和10月初实现了缓解,到研究时间结束时仍旧处于缓解状

处理右删失数据的多重插补法参考 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数5
  • 收藏数0 收藏
  • 顶次数0
  • 上传人学习的一点
  • 文件大小14 KB
  • 时间2022-01-26