洞察市场格局
解锁药品研发情报

免费客服电话

18983288589
试用企业版

EMEA关于临床研究中缺失值的考虑要点

发布日期

2009-04-15

发文字号

/

信息分类

其他

有效地区

/

时效性

现行有效

实施日期

/

颁发部门

CDE电子刊物

正文内容

      临床研究中缺失值的出现将会影响整个受试人群或者某个特定亚组人群从而产生偏倚。产生缺失值的原因有很多但也并非都与治疗研究有关,如患者拒绝继续参与研究、治疗失败或治疗成功、不良事件以及患者搬迁等。数据缺失程度也不尽相同,例如一些观测指标可能只有基线值,也可能缺失一次或几次的访视评价。
      缺失值违背了严格的ITT原则,不论方案的依从性和执行情况,也不论患者实际接受的是何种治疗,ITT要求应观察所有患者的结局。而全分析集(Full Analysis Set)通常要求将未记录的数据进行结转(imputation)。事实上,即使每个方案分析可以要求使用一些结转值,这个过程也会因为缺失值的数量和类型对临床试验的最终结果产生重要影响。
      缺失值对样本量的估计和治疗效应的判定的影响程度受到众多因素的影响。如脱落者、治疗分配、结局三者之间的关系以及用以证实治疗效应的指标类型(绝对指标vs.相对指标)。
      影响解释的偏倚种类将取决于研究目的是为了显示差异还是为了证实等效或非劣效。
一、缺失值对数据分析和数据解释的影响
      如果对缺失值采用简单剔除的处理方式,那么会对试验结果的解释产生以下问题:
1. 检验效能(power)和变异性(variability)
      样本量和结局的变异性可影响临床试验的检验效能。检验效能越大就意味着需要更大的样本量和更小的变异性。由于数据不完整导致分析中可用的有效病例数量减少从而降低了统计效能,缺失值越多就意味着统计效能越低。另外并不完整的病例更可能是一些极端值,如治疗无效导致病例脱落或由于治愈而未再访视。因此,失去的这部分不完整病例会导致变异性被低估,因此人为地使得治疗效应的置信区间狭窄。
2. 偏倚
      其中最担心缺失值的偏倚和可能的影响是:对治疗效应的估计;治疗组之间的可比性;关于目标人群研究样本的代表性。
      当统计效能的降低主要是与缺失值数量有关时,评估治疗效应的偏倚风险就取决于脱落者、治疗和结局三者之间的相互关系:①原则上,如果缺失值仅与治疗有关(观察发现某个治疗组较另一组更有可能出现缺失)而不是与未观察指标的真实值有关(不好的结局较好的结局更易出现缺失),那么认为缺失值是不会导致偏倚的。②相反,如果未记录的观察是与结局的真实值相关(如未观察指标有较高比例的治疗无效),即使缺失值不与治疗相关(如缺失值这种情况均等地出现在各治疗组中)也会出现偏倚。③如果缺失值与治疗和未进行观察的结局变量都有关(如果因为治疗无效则更有可能使得缺失值出现在某个治疗组),那么缺失值会产生偏倚。
      在多数情况下,几乎很难或不可能阐明缺失值和未观察的结局变量之间是否完全不存在相互联系。因此,鉴于缺失值可导致潜在偏倚,采用保守的分析方法是恰当的。
二、缺失值的处理
      在临床试验的设计和执行过程中,应尽量采取最小化措施避免缺失值的出现。但是,即使有了这些努力,通常还是会预计到仍有一些缺失值出现,而缺失值处理方法会影响到试验结论。
1. 完成病例的分析
      忽视非完整数据,然后仅采用完整数据去进行统计分析是一个可能的处理方法。由于这些难以完成研究的病例分析通常不会作为可被接受的数据分析主要方法,因此它只能适用于特定情况下:①在探索性研究中,尤其是在药物研发的初期;②在确证性试验中,作为次要的支持性分析来说明结论的稳健性。
      对违反ITT原则的完成病例分析,由于会出现偏倚,因此不推荐将其作为确证性试验的主要分析。
2. 缺失值结转
2.1数据结转范畴
      由于缺失值可以影响不同类型的变量,结转过程可能不仅要考虑主要变量,而且还需考虑次要变量、安全性变量、基线变量和协变量。在一些案例中,后者可能更为重要,因为缺失值剔除分析可以造成偏倚和检验效能的降低,特别是在出现易混淆变量的情况下。
2.2缺失值结转方法
      临床试验的统计分析通常要求对缺失值进行结转。许多技术已经用于缺失值结转,但是尚无哪种方法被认为是适用于所有情况的金标准。
      为处理某个时点后未被收集的治疗应答情况,普遍采用末次观察值(Last Observation Carried Forward, LOCF)进行结转,即将最后一次观察到的应答情况作为其终点值且不必附上一个特别的研究时点。
      如果认为观察值在整个研究期间内是相对恒定的,那么这种方法可能会被认可。但是若认为观察值在整个研究期间并不是相对恒定,如像Alzheimer’s病者一般是每况愈下,那么这个方法就不能被接受。在一些案例中,LOCF可以基于每个治疗组的脱落率和脱落时间提供一个可接受的保守方法。比如抑郁症,一般认为患者在整个疾病期间可以自我改善,如果试验组的患者因为安全性原因趋于更早地退出和更频繁地中止治疗,那么这个方法可能被认为保守。
      影响LOCF方法可接受性的因素包括治疗组间脱落比例和终止时间的差异,以及整个研究期间任何自发改变的趋势和脱落原因。
      脱落结局最坏的可能是因为治疗失败,而脱落结局最好的可能是因为治愈,如果想用于保守的估计那么也可采用上述最好或最坏的结转值。这些技术有益于评估一个更低的有效性界值以论证其稳健性。
      结转缺失值的另一个简单方法是用其他来源的数据进行替代。可能的数据来源包括相同受试者的信息、具有类似基线特征的其他受试者信息、源于一个经验研发模型的预计值以及历史数据等。
      大多数方法通过评估一个重要值并忽视它的不确定性则需面临低估标准误的偏倚风险。这个风险可以通过基于最大化可能性方法(maximum-likelihood methods)的一些技术和采用多样性结转方法予以规避。最大化可能性方法为结转缺失值就需要有多样性结转方法。基于分析策略的最大化可能性是通过一个反复的过程(例如期望值最大化运算法则)去适合统计模型。多样性结转方法通过随机生成值代替缺失值以产生不同的原始数据集拷贝,并以此作为完整的数据集进行分析。
      一些统计方法对出现的缺失值缺乏敏感性。混合效应模型是为适用于不同的情况,例如像结局指标需在研究期间不断地反复观察,那么这个观察时间就被认为是一个随机变量;这些模型可以通过估算斜率来总结每个患者的应答情况。当结局指标是时间事件时,那么就需要考虑采用生存期模型去检查观测值。但是,这些方法需假设治疗和缺失结局之间没有任何关联,一般来说是不会这样去假设。
三、一般性建议
      目前尚未就缺失值处理方法达成广泛一致,尽管如此,在处理缺失值时仍有一些原则需加以考虑。
1避免缺失值
      作为出现缺失值的后果,几个主要困难会随之发生,而且随着缺失值数量的增加这种情况愈加严重。因此,尽可能避免缺失值的出现就显得极为重要,通过有效的设计最小化这种可能性,无论患者对方案的依从性如何也要强化对数据的收集,而且鼓励在患者脱落之后重新挽回数据。
      预计试验中可能会观察到的缺失值数量是有用的。目前没有任何关于能被接受的缺失值最大数量的规定。它可以受到多个因素的影响:①结局变量的性质。当结局变量是死亡率(如心血管试验)时,估计缺失值的发生率比更难评价的结局以及要求患者积极参与和(或)需要复杂诊断方法时更低。②临床试验的周期。需长期随访的试验出现缺失值可能性更大。③在某些情况下缺失值更常见,如精神错乱患者的方案依从性通常不好。④治疗模式,如外科治疗比内科药物治疗。
2研究设计和预定义的恰当性
      目前还没有可普遍适用的缺失值处理方法,不同的方法将会导致不同的结果。在研究方案的统计部分预先说明所选择方法的必要性。这部分必须包括对所选方法的详细说明并论证为什么所选方法是最佳的。此外,评估这个可预见并可接受的缺失值数量是值得推荐的:首先是因为缺失值数量可以反映计算的样本量;其次是因为结转程序的可靠性随着缺失值数量的增加变得更不确定。最终报告必须包括任何偏离预期缺失值数量的文件和有关预先确定的分析是否仍是恰当的讨论。
      确保所选择的方法是一个保守的方法且并不支持研究的工作假设(有意或无意)被认为特别重要。例如,在非劣效性试验中处理缺失值应避免低估治疗之间的差异;同样,在优效性试验中处理缺失值应避免高估治疗之间的差异。
      因为一些问题的不确定性,允许在研究方案中或在试验结束后盲法审评数据期间有可能更新统计分析计划中的缺失值处理方法是可被接受的。恰当的偏离和修正先期计划应清楚地证明其合理性。另外,这些偏离和修正的时间点应被确定下来,数据盲态的执行情况必须被清楚地证实。
3缺失值分析
      注意是否有任何迹象表明不同治疗组间的缺失值比例和出现缺失值的时间存在差异是有用的。在全部相关因素中调查缺失值的不平衡以及有和没有缺失值的患者是否存在不同的基线特征等情况需进一步分析。
4敏感性分析
      敏感性分析是通过一系列分析来显示处理缺失值的不同方法对试验结果的影响,这将有助于证实所选特定方法的正确性。敏感性分析可以作为主要分析的附加支持。以下一些简单的方法可用于敏感性分析:①为比较两种分析结果,其中一种分析是将两组所有的缺失值用可能的最好结局进行结转,而另一种方法则是将两组所有的缺失值用最差的结局进行结转。②为比较两种分析结果,其中一种是将对照组的缺失值用可能最好的结局进行结转,而试验组正好相反,用最差的结局进行结转。③为比较整个数据集分析和完整病例分析的结果。
      每个敏感性分析应被设计用于评估采用了特定假设进行数据结转后对结果的影响。这个敏感性分析应在临床方案和统计分析计划中予以设计和说明,任何调整必须在研究报告中加以说明并证明其合理性。
      如果敏感性分析的结果是恒定的并导致对治疗效应相当近似的评价,那么这就保证了所损失的信息对整个研究结论几乎没有或根本没有任何影响。在这种情况下毫无疑问证实了结论的稳健性,缺失值通常也就不会认为是一个严重的担心。相反,如果敏感性分析出现结果不一致,那么对试验结果的影响就必须进行讨论。
5最终报告
      统计方法部分应详细说明用于处理缺失值的预先计划方法和关于这个计划的任何修正。
      在有效性和安全性评估中,关于缺失值的数量、时间、方式和可能的结转讨论应体现在临床报告中。结转值必须列出并予以证实。如前所述,敏感性分析可以给出研究结论是否稳健的结论。

参考文献:
[1]EMEA. Points To Consider On Missing Data[EB/oL].

<END>

最新政策法规资讯

对摩熵医药数据库感兴趣,可以免费体验产品