18983288589(微信同号)
18983288589(微信同号)
18908392210(微信同号)
18980413049
2009-04-15
/
其他
/
现行有效
/
CDE电子刊物
事实上,目前所有的临床试验都会涉及到多重性推论。如果不加以恰当的处理,通常会因担心多重性问题而无法真正地说明药物的有效性,这也会使得犯假阳性错误的机率大大增加。例如,如果对5个亚组进行统计学检验,相互独立而且每个差异水平控制在0.025(单侧定向假设),那么发现至少出现一个假阳性具有统计学意义的检验的机率会增加12%。这个例子说明多重性对于得出假阳性结论的概率有着实实在在的影响,而这个假阳性结论也会直接影响新药的批准和说明书相关内容,因为无论何时都有机会从两个或更多的分析中挑选最佳的结果。为控制研究方法所犯下的假阳性错误概率需要建立一个可接受的α水平,这是一个重要原则,这对于评估确证性临床试验结果很有价值。
一、 多重性调整-何时必要?何时不必要?
勿需调整Ⅰ类错误的临床研究是指由两个治疗组构成、仅用一个主要变量、预先规定的统计分析策略确定为只有一个关于主要变量的无效假设而且没有中期分析。
控制总体Ⅰ类错误(type Ⅰ error family-wise)通常(但并非总是)意味着一个可接受且预先规定Ⅰ类错误的α总和必须被进一步分割,即不同的无效假设必须经检验作为这个α值的一部分。这就是通常所说的“调整Ⅰ类错误水平”。如何定义这方面的α消耗(α spending)运算法则相当复杂。通常,采用越复杂的程序会使得对结果的临床解释越困难。例如,为了评价和评估这个评价的准确性,置信区间非常重要,但是为控制Ⅰ类错误,与检验一致的解释方法对于更为复杂的多水平α检验(multiple-level-α-tests)或更普通的封闭式检验(closed tests)并没有用。当选择方法时,建议考虑是否已有有效的统计程序允许得到一个满意的临床解释。
由于可导致不同结论且能正确处理多重性的其他方法通常有用,因此预先规定所实施的多水平α检验是有必要的。为避免解释上的问题,统计方法上的细节应体现在方案或统计分析计划书中。
如果一个多重检验发生无法预知的情况,那么采用一个保守的方法是有必要的,如Bonferroni法或其他方法,相应这会损失检验效能。因此,如果某个多重检验情形可以预知,那么预先确定用于处理这种情况的统计学方法值得推荐。
1多个主要变量-何时不需要正式调整
ICH E9“临床试验中的生物统计学指南”建议“一般而言临床试验宜纳入一个主要变量”。如果治疗干预措施导致这个变量的改变足以证明其相关临床治疗效应,那么采用单个主要变量的设计即足够。但是如果单个变量不足以发现相关临床治疗获益的范围,那么就有必要设计不止一个的主要变量。有时同一个试验会有多个相关的研究目的,而每个研究目的会有自己相应的主要变量。在另外的案例中,为了就其中某些研究目的或所有研究目的提供出令人信服的获益证据则需要对许多主要变量展开研究。为给出充分的研究证据以表明达到研究目的,其他假设和单个主要变量效能的限制必须被定义且相互制约平衡,在这种情形下计划样本量就更为复杂。
1.1需要两个或更多的主要变量来描述临床相关的治疗获益
为了提供充分的临床获益证据,每个主要变量的无效假设必须拒绝相同的差异水平(如0.05),这样对结论的解释就相当明确,这类情况可参见“医药产品专利委员会”(Committee for Proprietary Medicinal Products, CPMP)关于治疗Alzheimer’s病和慢性阻塞性肺气肿的药物研发指南。在此类情况下可以无意或有机会选择最有利的结果,因此单个Ⅰ类错误水平应等于总体Ⅰ类错误水平α,即没必要进行α衰减。这种方法扩大了有关Ⅱ类错误(即真的会错误地接受至少有一个无效假设),最糟的情况下这个Ⅱ类错误是所有单个假设Ⅱ类错误的总和。因此,必须用一个估计恰当的样本量来考虑这种扩大了的错误。
1.2根据临床相关性对两个及其以上的主要变量进行编秩
有时同一个试验会有一系列相关研究目的,这其中只有一个研究目的是最重要的,其他方面的有效结果可以作为治疗效应的补充。例如①随访抑郁症中的急性效应(acute effect)主要是观察有无阻止病情进一步恶化;②随访急性心肌梗死死亡率的降低则是观察有无防止其他严重事件的出现。在这种情况下可以根据一个分级策略进行假设检验(可以提供置信区间)。这个等级次序可以是一个自然的(如按时间或根据所考虑变量的严重性进行假设排序),也可以根据研究者特别关注的方面进行设计。此外,没有必要进行α衰减。但是这个检验无效假设的等级次序必须在研究方案中预先说明。像这个程序的影响在于没有确证性的声明可能是基于变量较第一个不能被拒绝的无效假设的变量的秩更低或相等,并会得到与等级检验程序一致的置信区间。很显然,具有更低秩的相应变量的假设会被夸大了Ⅱ类错误。
2分析集
多重分析可用于同一变量但要用不同的亚组受试人群数据。正如ICH E9指南所说用于主要分析的受试人群数据集应在研究方案中的统计部分予以明确,通常采用全分析集(FAS)作为主要分析集。
一般而言,关于用不同亚集受试者或根据研究目的选择不同观察指标的多重分析,其主要分析结论的敏感性不应属于调整Ⅰ类错误。分析的主要目的在于增加这个主要分析结论的可信性。
3其它统计方法-多样性担心
不同的统计模型和统计技术(例如参数检验相对于非参数检验,Wilcoxon检验相对于Log rank检验)有时被试图用于处理同一数据集。为选择一个特别的统计方法去比较基于最初统计检验结果的主要治疗,有时会采用一个两步程序。如果这样的程序基于患者治疗分配信息会明显偏向于选择一个有利的分析策略,那么应担心由此产生的多样性问题。这类情况应就基于一个正式的盲法审评去选择一个最终的统计模型以避免此类担心。通常选择那样程序的机会很小,当这些程序用于比较治疗信息时,那么很难评估对整个Ⅰ类错误的影响。最后,基于事后情况需要改变一个研究的重要关键因素可能会质疑该研究的可信性和结果的稳健性,那么可能的结果是进一步研究很有必要。
4安全性变量的多样性
当安全性变量是确证性研究的一部分时,那么就应在说明书和批准件中予以体现。除了观察到的治疗效应完全相反且增加了安全性担忧外,没必要采用不同于主要有效性变量的治疗。在不良反应的p值非常有限的情况下,用p值来表示差异的充分性(用相对风险“relative risk”或风险差异“risk difference”来表示)可能会增加担心,这主要取决于不良反应后果的严重性(seriousness)、程度(severity)或结局(outcome),而无关p值的大小。
在这些案例中大量的统计检验程序被用来作为提示受试药潜在风险的标记方法(flagging device),通常应说明多重性调整达不到安全性担忧的预期目标。单一假设勿需控制总体Ⅰ类错误,结果的重要性和合理性将取决于前期药理研究信息,这一点是勿庸置疑的。
5研究中两个以上治疗组别的多重性担忧
至于不止一个主要变量的研究,对其有两个以上治疗组别的恰当评价和解释相当复杂,本文将不予讨论。下列讨论仅限于相对普通和简单的设计。作为一般的原则,确证性试验中控制总体Ⅰ类错误(family-wise type Ⅰ error)是最起码的先决条件。
5.1三组金标准设计
就一个疾病而言,当存在一般公认的对照治疗时则推荐采用三组治疗(阳性对照药vs.安慰剂vs.受试药)来证明新药的有效性和安全性,这也符合伦理学要求。通常这种研究的主要目的有以下3个方面:①证明受试药优于安慰剂(有效性证据);②证明阳性对照药优于安慰剂(检测试验的敏感性);③证明受试药保留有阳性对照药相对于安慰剂的大部分疗效(非劣效性证据)。如果上述这些方面都能显示出统计学差异,那么就没必要进行形式调整。如果未能显示出受试药优于安慰剂,那么只能解释为受试药无效(当阳性药优于安慰剂时)或试验缺乏检测的敏感性(受试药和阳性药均未优于安慰剂)。
5.2固定复方的有效性证据
CPMP有关固定复方制剂的指南(CPMP/EWP/240/95)要求必须证实每个成份在复方中是有益的。对于一个含有两种成份的复方,通常要求分别用两个单一成份治疗和复方治疗的三组研究去解释。如果试验显示复方优于两个单一成份,则可以认为该研究是成功的。由于复方与这两个单一成份分别进行两两比较显示出有统计学意义的优效,因此没必要进行总体差异水平的形式调整(formal adjustment)。
多剂量因素被设计用于评估这个固定复方的目的在于:①提供确切的证据证明复方比任何一个单一成份治疗更有效(参见ICH E4有关支持药物量效关系的注册研究指南),②在拟用人群中证实固定复方的临床安全、有效推荐剂量。而且第①种情况通常采用综合检验策略(Global Test Strategy)来实现,第②种情况则采用正确的封闭式检验程序(Closed Test Procedure)。
5.3量效研究
量效研究的目的在于证实受试药用于特定人群是推荐一个剂量还是多个剂量,但必须控制总体Ⅰ类错误(Family-Wise Type Ⅰ Error)。由于大量不同的设计因素,研究中的假设和目标(例如假设有或不会随着剂量增加出现单纯的量效关系;发现最低有效剂量在所用设计的强制剂量以下;发现剂量等于或不劣于所推荐的参比制剂剂量)等相关内容不在本文讨论之列。目前有关适合特殊目的且须控制Ⅰ类错误的多剂量研究的封闭式检验程序已有各种各样的方法见诸于相关文献报道。
有时一个研究不足以证实和推荐一个安全有效的剂量(或一个剂量范围),但仅可以成功地证实随着剂量增加临床效应会出现正相关的趋势。那么在将来研究的计划中以探索的方式通过不同剂量组的两两比较进行评估和确定置信区间,这种情况下就没必要调整Ⅰ类错误。
二、 如何解释多个相关次要变量的重要性以及何时可以基于其中的一个次要变量进行说明?
传统上,临床方案会有多个次要疗效指标,但直到现在也没有就这些临床试验中的次要终点指标的角色和权重达成共识。
1支持性变量
次要终点可以为治疗效应提供附加的临床特征信息,但是它们不足以作为上市申请的主要证据或标签说明中的补充内容。因此,纳入的次要变量应能为相关的主要研究目的提供支持性证据且不需要确证性结论。置信区间和统计检验只是探索性,并未计划有相关说明。
2作为附加声明的次要变量
更重要的是,一旦主要目的达到后,次要变量可以作为相应次要目的的补充说明。处理这类次要变量的有效程序应按等级进行。一旦主要研究目的的无效假设被拒绝即达到主要研究目的后,当不止一个次要变量时,次要变量的进一步确证性统计检验就应按其等级秩序进行。在这种情况下,主要变量和次要变量在试验中的等级假设是不同的,当然这反映了试验中它们的相对重要性。值得注意的是当次要变量的变化被认为是因主要变量的变化引起的直接结果时则不能作为标签内容的一部分。例如,精神分裂症患者中的抑郁症状消失是因为精神分裂症的改善而致,那么关于这个治疗中的抗抑郁作用在标签内容中是不会出现的。
3支持临床获益的变量
由于先前估算的试验计划样本量太小以至于检验效能太低无法检测出临床获益,原先可能潜在提示主要临床获益或在不同情况中均提示有一个重要的安全性问题(如死亡率)的变量可以转为次要变量。但是如果所观察到的临床获益高于预期情况而又达不到主要研究目的,像这种典型情况就需要进一步研究以支持所观察到的临床获益。
但是如果提示主要临床获益的相同变量存在相反的治疗作用时,就需提高对受试药的安全性担忧,无论这个变量纳不纳入确证性研究中,都有充分理由拒绝其上市。
三、 源于亚组分析的可靠结论以及亚组上市许可的限制
临床试验中存在很多原因去检测亚组人群的治疗效应。在许多研究中,当达到主要研究目的后,亚组分析则扮演一个支持性和探索性的角色,也就是为证实新药全面且重要的临床获益。受益的特定亚组人群的具体说明要求预先规定相应的无效假设和恰当的确证性分析策略。当整个研究人群缺乏显著疗效时,是不会基于亚组分析去接受这个试验结果。研究方案应包括所指定检验效能的相关考虑,随机方法通常采用分层随机。
评估不同亚组人群间治疗效应的一致性是管理当局通常关心的问题。一些因素被认为可引起治疗效应的异质性,如性别、年龄、地区、病情程度、人种(民族)、肾脏损害、吸收或代谢的差异等。如果与之相关,那么分析这些重要亚组人群就应成为评估整个临床试验的一部分,但是这样的分析通常被认为是探索性的,除非推断怀疑有一个或多个因素可能影响治疗效应大小。但是,当发现明显的相互作用提示某个亚组人群会出现不良事件时,如果对这一现象不能给予信服的解释或者有其他信息证实了这个相互作用的可能性,那么应将相关的亚组人群排除在上市许可之外直至补充有其他有用的临床数据。
如果方案中没有恰当的用于处理大量不同亚组人群的计划,某些亚组人群也可能会在上市应用中受到限制。从管理当局的观点来看,如果有理由认为在不同的亚组人群中存在有不同的治疗效应时,那么整个研究人群的总体阳性结果(符合统计学意义和临床意义)并不意味着对所有亚组人群有效。如果缺乏对整个研究人群有针对性的定义,那些具有充分代表性且观察到有统计学意义和临床意义结果的亚组人群会被限制应用。
四、 结合原始变量(Raw Variable)如何解释应答者(Responder)分析
在大量申请中,诸如Alzheimer’s病和癫痫是很难去解释一些细微的变化,除了主要变量均值水平具有统计学意义的显著改善外。基于这个原因,术语“应答”和“不应答”被用于表示对单个患者的临床治疗获益。可以有很多方法来定义“应答”或“不应答”。这个定义应在方案中预先说明并具有临床说服力。在有关临床研究指南中,应答者分析被表述为用于建立所观察疗效的临床相关性,以此来帮助评估新药的安全性和有效性。值得注意的是联系到最初变量的信息被分解成“应答”和“不应答”会出现信息损耗并由此降低检验效能。
在某些情形下,应答者标准可以是主要终点指标(如CPMP关于“治疗帕金森氏病的药物临床研究指南”)。在这种情况下应答者标准应被用于提供无效假设的主要检验。但是这里主要提及的情形是当应答者分析被用来判断临床相关性时,一旦主要变量具有统计学意义的均值水平被建立(如CPMP关于“减肥药物或治疗Alzheimer’s病的临床研究指南”)。在这个情况下,应答者分析结果勿需具有统计学意义但应答率的差异应支持该研究治疗所带来的相关临床效应。
值得注意的是应答者分析不能挽救主要变量的其他方面的失败结果。
五、 如何结合法规要求对复合变量进行统计学处理
这里有两类复合变量,一类称为“等级量表(Rating Scale)”,它是由多个临床指标合并而成。这类复合变量必须有用于特定适应症的长期使用经验,如精神病或神经官能症。本文将不讨论这类复合变量。
另一类复合变量源自于生存期分析。几个事件被合并用于定义一个复合结局。如果受试者出现既定列表中所规定的如死亡、心肌梗死或中风后遗症等一个或多个事件那么就可以认为该患者具有这个临床结局。结局时间的观察应从患者随机化开始直到首次出现列表中任何一个事件为止。通常这些列表事件代表相对罕见的事件,单独研究列表中的每个事件将会导致很大的样本量以至于无法实施。因此,复合变量仅仅是提出一种方法用来增加出现有临床结局的患者百分比从而保证了研究效能。
1. 作为主要终点指标的复合变量
当复合变量被用来表示有效性时通常会作为一个主要终点指标。因此,它必须达到一个唯一主要终点指标的要求,即它能为上市许可提供关键的有效性证据。另外,推荐分析复合变量的单个成份及其相应人群的临床相关性以提供支持性证据。但是,没必要采用多重性调整来说明所达到主要终点的显著性。如果上市申请是基于复合变量构成元素的亚组数据,那么就需要提前规定并将其纳入一个有效的确证性分析策略。
2.预计治疗干预以相似方式影响所有变量要素
当定义一个复合变量时,建议仅纳入假设治疗同样有效的相关变量构成元素。对复合变量的所有构成元素有着相似治疗作用的假设应基于既往同类研究的经验。添加一个估计对治疗效应并不敏感的变量构成元素将会增加变异性,即使它不会影响到公正地评估疗效差异。其直接结果就是降低了论证不同治疗组间优效性的灵敏度,在非劣效或等效性研究中同样也不接受这种变异性的增加。如果观察到某些变量组成成份出现负面影响,那么非劣效研究很难予以解释。对于优效性研究,最保守的分析是将更普通的变量构成元素作为主要终点;而非劣效或等效性研究基于同样的原因需将更特殊的变量构成元素作为主要终点,如疾病相关死亡率。
3.临床上相对重要的变量成份至少不应受到负面影响
如果住院时间是一个临床研究终点,那么删除入院前已死亡的患者是不恰当的。研究一个复合终点最好是将有所有相对重要的临床事件作为该终点指标的组成成份,如像该例中的死亡事件。但是从管理当局的角度来看,对复合结局指标的一个担忧是如果研究中的某些治疗对其中一个或多个变量组成成份有副作用,那么这个副作用就有可能会被整个复合结局所掩盖,例如除了这些表现有副作用的变量成份之外,余下的一些变量成份又提示有很大获益效应。如果这些变量成份与疾病严重程度或临床重要性相关,那么应关注这些特别的相关性。例如,如果所有的死亡原因均作为变量成份,那么应提供对所有死亡原因的单独分析以确保对这个终点指标没有相反影响。由于没有就多少达成广泛一致,那么出现有统计学意义的非治疗作用将会怀疑有副作用,一旦观察到这个数据,用于建立置信水平以支持没有副作用的方法将在计划阶段提出这个问题。例如,即使计划好的样本量和研究报告包括有各自的比较评估和置信区间,研究计划应提出那些有相当可能性被排除(在无效假设条件下认为没有治疗差异)的更重要变量成份的副作用风险大小。
4.反映在适应症中的相关变量成份的任何治疗效应应有充分数据的支持
一个要考虑的重要问题是基于对一个复合终点指标的成功主要分析进行合理声明。如果声明不能完全反映所用复合终点指标的实情则会增加评价难度,例如,如果一个声明明确地将罕见事件作为一个变量成份。又如如果复合结局是“死亡或肝移植”且仅有少数病例死亡,那么宣称“降低死亡率和减少不必要的肝移植”则不具有说服力,因为在这个上下文中关于死亡率结果的基础太过薄弱。但这并不意味着研究者应将“死亡”这个变量成份从复合结局指标中剔除,因为如果没有同时考虑到至少与“肝移植”一样严重的所有疾病相关结局,那么仅仅采用“肝移植”结局也并不完善。但是这意味着应采用不同的措辞来表述这个适应症以免暗示死亡率结果。
六、 结论
临床研究中通常必须回答不止一个有关治疗特定疾病的有效性或安全性问题,因为一个成功的药物研发取决于对这些问题的肯定回答。众所周知,如果不采取相应措施防止多重检验的假阳性,那么随着提问数量的增加会导致犯假阳性的机率增加。如文中所说,主要担心集中在申请人有机会选择源于多重性分析的有利结论。因此统计程序计划如何处理或避免此类情况是有必要的,应在研究方案或统计分析计划中充分详细地说明多重性以评估其是否匹配和正确。
各种不同的方法被研究用于控制出现假阳性结论的机率。但是并不是所有的方法都能同样成功地提供临床上能说明的结果,程序这方面应一直予以考虑。由于评估治疗效应通常是一个重要问题,结合特定程序的置信区间的有效性应有一个选择标准。
如果相关问题预先规定并作为恰当计划的统计分析策略的一部分,那么在达到主要研究目的后,基于既有统计学意义又有临床意义的次要变量或亚组的相关结论作为补充是可能的。
参考文献:
[1]EMEA.Points To Consider On Multiplicity Issue In Clinical Trials[EB/oL].
Pharma CMC2024-10-15
摩熵医药(原药融云)2024-08-21
数屿医械2024-06-24
数屿医械2024-06-13
数屿医械2024-05-30
摩熵医药(原药融云)2024-05-27
药事纵横2024-02-28
药通社2023-12-26
摩熵医药(原药融云)2023-12-13
药通社2023-06-25
2024-11-20
2024-11-19
2024-11-19
2024-11-19
2024-11-19
2024-11-19
2024-11-18
2024-11-18
2024-11-18
2024-11-11
2024-11-11
2024-11-05
2024-11-04
2024-11-04
2024-10-30
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-09-01
2023-09-01
2023-09-01
2023-09-01