新疗法评价中的安慰剂对照试验和活性对照试验（译文）

审评四部

近年来，有些作者提出，在已知对所研究的疾病存在有效疗法的情况下，不管是什么病，也不管延迟治疗的后果如何，进行安慰剂对照试验都是不合伦理的。有些作者还对这种情况下进行安慰剂对照试验的价值提出了争议，主张将新的疗法与老的疗法进行比较，足以明确疗效，应当是我们要关注的全部。本文讨论了对使用安慰剂对照的伦理学顾虑，叙述了用活性对照等效性（也被称为非劣效性）试验明确新疗法在很多医学情况下的疗效的有限能力。作者的结论是，在已知存在有效治疗的情况下，安慰剂对照试验并不都是不合伦理的；更确切地说，它们的可接受性取决于延迟治疗是否会对患者造成危害。如果对患者没有危害，在伦理学上则可进行这样的试验。而且，虽然在很多情况下，活性对照试验很有价值，信息量很大，并且是恰当的，但是对新疗法的有效性，却常常不能提供可靠的证据。

安慰剂对照试验被广泛用于新药开发。在患者可用现有疗法进行治疗的情况下，有时安慰剂对照试验会被质疑，认为是不合伦理[1-7]。因此什么情况下用安慰剂对照在伦理学上是可以接受的，以及什么情况下安慰剂对照在科学方面又是必需的，就成为重要的并且值得讨论的问题。

安慰剂对照的伦理学问题
《赫尔辛基宣言》
《赫尔辛基宣言》[8]是一份国际性文件，叙述了临床研究的伦理准则。有些人提出在已知对某种疾病存在有效治疗的情况下，采用安慰剂对照都是不合伦理的，他们通常引用该宣言中下面的句子来支持其观点：“在任何医学研究中，应当确保每个患者（如果有对照组，也包括对照组患者）都接受已被证实的最好的诊断方法和治疗方法”。

我们认为把这个句子理解为“只要存在有效疗法就禁止用安慰剂对照”是站不住脚的。首先，所有患者都要接受“已被证实的最好的诊断方法和治疗方法”这个要求不仅会排除安慰剂对照试验，而且也会排除活性对照试验和历史对照试验。存在有效疗法的情况下，接受试验疗法而不是接受已被证实的疗法的患者很明显没有得到已被证实的最好的疗法。

其次，全部都同样地视为没有使用已知的有效疗法也不合理。过去，对安慰剂的使用产生顾虑通常见于有严重疾病的情况下。大家普遍认为，在现有疗法被证实可提高生存率或减少严重疾病的情况下，使用安慰剂对照或其他无治疗对照几乎都是不合伦理的。但是在治疗不会影响患者的长期健康状况的情况下，伦理学上强制使用现有疗法似乎又是不合理的。比如，由于外用米诺地尔或口服非那雄胺能够促进头发生长，就可以说对治疗秃发的新疗法进行安慰剂对照试验是不合伦理的吗？在被充分告知的患者中，使用安慰剂对用于过敏性鼻炎、失眠、焦虑、皮肤病、烧心或头痛的药物进行短期研究真的是不合伦理吗？我们认为，提出这些研究和许多其他有关减轻症状的安慰剂对照研究不合伦理的说法，以及提出了解情况的患者都不能参加上述研究的说法，没有合理的依据。

第三，完全有理由怀疑引用该说法是想阻止进行安慰剂对照试验。所讨论的说法不是最初1964年宣言的部分内容，而是在1975年添加的内容，目的是强化这样一种观念：医患关系“必须被视为就像是在纯粹的治疗情况下，不能带有任何研究目的”[8]。在对1975年的修改的解释中，没有充分讨论安慰剂对照试验问题[9]。美国医学会[10]、世界卫生组织[11]以及国际医学科学组织理事会[12]，拒绝接受该宣言在有被证实的疗法的情况下一律禁止进行安慰剂对照试验的立场。

安慰剂对照试验中的知情同意
对于参加安慰剂对照试验的患者，必须告知现有的各种有效疗法，他们必须能够和研究者一起探讨延迟此类治疗的后果，必须能够充分提供知情同意书。对是否能够按照我们想告知的那样同意参加试验产生顾虑是有根据的，但是患者在活性对照试验中做出放弃已知的有效疗法并冒暴露于可能无效甚或有害的新药的危险这个决定时，与患者在安慰剂对照试验中做出接受症状可能会持续存在这种情况的决定时，这些顾虑都会同样出现。因此，这个问题不是安慰对照试验所特有的问题。

由于上述原因，我们得出结论，即使存在有效的疗法，但只要患者不会因参加试验而受到伤害并在他们被充分告知了备选治疗的情况下，在伦理学上就可以进行安慰剂对照试验。虽然在很多情况下可以很直接了当的运用这个标准，但是在某些情况下却不能这样做，并且有可能会对延迟治疗的后果产生争论[13]。

用活性对照试验评价有效性
临床试验如果因在研究设计或实施中有不足之处，那么它就不可能提供在科学上有说服力、在临床上有意义的结果，来解决其自身的伦理顾虑[12, 14]。本文余下部分将讨论为什么通常提出的安慰剂对照试验的备选试验不能用来评价新疗法在很多医学情况下的有效性。

活性对照等效性试验（非劣效性试验）
在某种特定的情况下，就伦理而言可以开展安慰剂对照试验不一定就是说，如果存在有效疗法，就应当进行安慰剂对照试验。患者和医生也许仍更想开展能让每个参加者都接受活性药治疗的试验。有待探讨的问题是，为什么常常需要开展安慰剂对照试验（或更普遍地说，目的是证实一种疗法优于另一种疗法的试验）来说明新疗法的有效性，而常常不能用说明新药与已知的有效药物相比具有等效性或非劣效性的活性对照试验来代替安慰剂对照试验。目的是说明新药有效性的活性对照等效性试验（ACET）的局限性长期以来已很明确，对此也已有详细描述[15-33]，但是或许没有像应该的那样获得广泛认可。最近提出的一项关于对照组选择的国际性指南详细讨论了这个问题[33]。

根本问题：检验灵敏度的必要性
有2种不同的方法可以用来说明新疗法有效。一种方法可说明新疗法优于对照疗法，另一种方法可说明新疗法与已知的有效疗法等效，或在一定的量上不亚于已知的有效疗法。每种方法都有效度，但各种方法都需要完全不同的推理方法。说明一种疗法优于对照疗法（安慰剂治疗或活性药治疗）的妥善设计的研究可为新疗法的有效性提供有力的证据，它仅仅会受到结果统计误差的限制。无需外部资料来支持有效性结论。相反，成功说明“等效”（也就是说，新药和已知的活性药之间差异很小）的研究，靠其自己还不能说明新疗法有效。虽然“等效”可以表示2种疗法在该研究中都有效，但也可以表示2种疗法在该研究中都无效。要想根据新疗法与活性对照相似而从ACET得出新疗法有效这个结论，我们就必须设定关键（并且在该研究中不能进行检验的）假设：活性对照在该项研究中有效。换句话说，如果包括有安慰剂组，那么安慰剂就必须次于活性对照[15-33]。对这个假设条件提供的支持必须来自该试验以外。虽然在任何恰当设计的试验中估计已知的活性药优于安慰剂也许看起来都是合理的，但是经验表明，对很多种药物而言，情况并非如此。

一项研究区别有活性疗法和无活性疗法的能力被称为检验灵敏度（assay sensitivity）。如果不能假定检验灵敏度，那么即使新疗法和标准疗法看起来实际上相同，并且其比较的可信区间是非常窄的情况下，研究也不能说明新药的有效性。（注意在实践中，ACET的设计目的不仅仅是为了说明治疗之间没有统计学显著差异。更多的情况是，此类试验的设计目的是说明非劣效性——就规定的边界而言，新疗法不亚于对照。对这种方法的描述见附录）。

支持在一项具体研究中活性药的效果优于安慰剂的最佳证据是在一系列设计类似的试验中，该活性药都确实胜过安慰剂。因此，该ACET就需要用该试验以外的资料（过去关于活性对照药的安慰剂对照研究的资料）来解释结果。就此而言，ACET类似于历史对照试验。在某些情况下，比如缓解率很高的癌症、大多数的感染性疾病以及某些心血管疾病，可获得这样的外部资料，ACET能够为评价新疗法提供有说服力的、可靠的依据。但是在很多情况下，不能根据历史做出检验灵敏度的假设；对很多种有效药物而言，样本量和设计显然已非常充分的研究也经常不能将药物和安慰剂区别开来[16-18, 25, 34]。20多年以前，Lasagna[19]就对这个难题做了特别详细的描述（说明疼痛科医生发现这个问题已有很长时间）：

新药和标准药物之间的比较. . .只有在新疗法优于标准疗法时才有说服力。如果次于标准疗法，甚或不能与标准疗法区别开来，那么结果就不能顺利地说明什么问题。在没有安慰剂对照的情况下，我们根本不知道“较次的”新药是否有什么疗效，而“等效”也许只不过反映了一个不能将2个有相当大差异的活性疗法区别开来的患者人群，或者不能将活性药和安慰剂区别开来的患者人群。某些临床情况，比如严重抑郁状态，众所周知是难以进行评价的，原因是药效滞后，并且自发好转率高，在对照试验中，即使是已知的疗法，也不是很容易就能与安慰剂区别开来。

在关于抗抑郁药的研究中，这个问题已非常明确[18, 32]。在实践中，很多此类研究都包括3个组（新药组、活性对照组和安慰剂组），来提供明确的有效性证据（新药组与安慰剂组相比）和内部标准（活性对照组与安慰剂组相比）。这种设计可明确区别出（对药物生产商而言特别有价值）是药物无效（标准药优于安慰剂，但新药却不优于安慰剂），还是研究无效（标准药和新药都不优于安慰剂）。

Leber举例说明了检验灵敏度问题[18]，Leber探讨了所有比较诺米芬辛（一种有效但也有毒的抗抑郁药）、丙咪嗪（一种标准的三环类抗抑郁药，在很多临床试验中证实其优于安慰剂）和安慰剂的有3个组的研究。研究结果见表所示。就Hamilton抑郁量表（抑郁的一种标准测量方法）而言，没有研究发现诺米芬辛组和丙咪嗪组之间存在差异，但是在与基线相比所发生的变化方面，2个药物组都有相当大的、看起来临床上有意义的变化。但是对安慰剂组结果的分析显示，也有类似的变化。6项研究中只有1项（样本量最小的那项研究）发现，2个药物组都与安慰剂组有些显著差异。其他5项研究甚至都未显示支持2个药物（随便哪个）的趋势。这5项研究似乎都缺乏检验灵敏度；它们不能将有活性治疗和无活性治疗区别开来。在这些研究中，虽然有些样本量小，但是3项每个组有30例或更多例患者的研究却是常常用来说明丙咪嗪或其他抗抑郁药有效性的典型研究。

表. 6项比较诺米芬辛、丙咪嗪和安慰剂*的试验的结果

*所示结果是Leber撰写的综述中所报告的那些结果[18]。
†诺米芬辛组与丙咪嗪组相比的双侧P值。
‡诺米芬辛组与安慰剂组相比，丙咪嗪组与安慰剂组相比，均为P<0.001。

虽然我们不能肯定产生这些结果的原因，但是最有可能的原因是研究的样本量、研究设计或研究实施这些方面的差异影响了这些抗抑郁药的疗效，进而影响了研究识别有效治疗的能力。但是这看上去并不单单是研究规模的问题；很多每组有10-30例患者的研究（包括上述6项研究中的1项）检测出了抗抑郁药的效应，但是很多更大规模的设计基本上相同的研究却甚至连支持趋势都未显示出来。对很多最近开发的抗抑郁药（比如氟西汀）也观察到了类似的规律，尽管不尽相同[34]。总体看来，美国食品药品监督管理局的近期经验是，现代抗抑郁药试验中大约有1/3-1/2不能将已知的有效药物和安慰剂区别开来（Laughren T.未发表的观察结果）。

也许有人会推测，抗抑郁药试验结果的变异只不过是效应不大并且由于样本量太小而不能克服所研究疾病的固有变异的结果。但是在研究之间差异很大并且无法预测效应大小的情况下，结果却一致。根据现有知识，我们还不能明确说明一般可识别活性药物的具体研究人群、治疗方案或样本量。

抗抑郁药只是有检验灵敏度问题的很多类药物中的一类。镇痛药[35]、抗焦虑药、抗高血压药、安眠药、抗心绞痛药、用于心力衰竭的血管紧张素转化酶抑制剂、梗死后用的β-阻滞剂[36]、抗组胺药、非类固醇类哮喘预防药物、用于胃食管反流病的改善动力药、以及许多其他有效药物，在妥善设计并妥善实施的研究中，都常常不能与安慰剂区别开来。

最近发表的Tramer与合作者对昂丹司琼（一种应用广泛并且非常有效的止吐药）研究的综述[37]，为这个现象提供了另外一个例子。虽然数据总体明确支持这个药物的疗效，但是有很多对安慰剂-昂丹司琼的比较却显示该药无效。值得注意的是，恶心和呕吐的发生率在试验之间差异非常大，有时该发生率又太低，使得不能得出任何疗效证据。在止吐药的安慰剂对照试验中，如果恶心和呕吐的发生率低，就会导致阴性结果——看起来该药并不优于安慰剂，试验也不能提供有效性的证据。相反，对于ACET（新药与昂丹司琼相比），如果2个组恶心和呕吐的发生率都低，那么就不能对该试验做出明确的解释。如果我们假设活性对照组的发生率低是反映了昂丹司琼降低恶心和呕吐发生率（如果没有治疗则较高）的能力，那么我们就可以得出结论：该新药也有效。但是Tramer与合作者所写的文章却说明，这样的假设在很多情况下是不能获得支持的。无疑，如果昂丹司琼的很多安慰剂对照研究显示无效，那么说明某个新药与昂丹司琼“等效”的试验就不可能被视为说明该新药有效的可靠证据，除非我们能够确定一般能将昂丹司琼与安慰剂区别开来的治疗情况（比如由使用化疗所限定的情况）。

在所述的情况下，无疑有时（甚或常常）会不能证明药物的有效性优于安慰剂；即使在妥善设计并妥善实施的研究中，也只有50%能够说明药物在统计学上显著优于安慰剂，这个比例仍比在药物无效的情况下可预期的较小的偶然发生率大得多。问题也许是疗效一般情况下较小并且在人群中也有差异、不能充分坚持治疗或使用合并用药、研究患者自发好转（没有给药物诱导的好转留有余地）或对药物无反应，或其他一些尚未识别的原因。所有这些影响的共同之处在于缩小或消除了药物-安慰剂之间的差异，这样足以检测出较大效应的研究设计和研究规模也就不能检测出那个被缩小的效应。但是在各种情况下，都不可能通过分析研究，事先确定是什么问题；而只有到发现试验不能区别药物治疗和安慰剂治疗时，才能识别问题。

在ACET中最大程度减少错误的动力下降
活性对照等效性试验提出了另外一个问题，就是在各项具体的研究中难以定量或评价。临床试验中的大多数缺点——患者不坚持治疗、合并使用可能会影响研究结果的治疗、入选不恰当的患者（比如那些没有疾病的患者或那些出现自发好转的患者）或使用错误治疗，都趋于缩小各治疗组之间可观察到的差异，促进得出2种治疗不能区别开来的结论。为了设法说明治疗之间的差异，研究的组织者会有强大的动力来最大程度地减少这些缺点，找出能够说明效应的人群。如果目的是说明没有差异，那么就会缺乏这个动力[17, 32]。这不是说在进行ACET时与在进行安慰剂对照试验时相比，试验的组织者会故意不尽力，如果设盲的研究者有任何超过惯例的治疗举措，都提示研究者是不可信的。但重要的是，要能识别预期结果对临床试验实施的可能影响。

在各项具体的ACET中，都难以确定其说明潜在治疗差异的能力由于研究设计和实施方面的不足而下降的幅度。但是就抑郁的治疗这些方面而言，即使是安慰剂对照试验（在这些试验中，开展能够说明治疗之间差异的出色研究的动力最大），常常也不能将活性药的效应和安慰剂的效应区别开来。就其检测治疗差异的能力而言，会期望ACET的结果与安慰剂对照试验结果的差异尽可能小。在考虑怎样开展ACET时，需要意识到这个问题。另外，通常被认为是保守的研究解释方法，比如意向治疗分析，在试验目的是说明治疗之间没有差异的情况下，也不再是保守方法[17, 24, 32]。

活性对照的应用
活性对照等效性试验可提供大量信息，已成功、恰当地用于很多治疗领域，在这些领域，检验灵敏度毋庸置疑。这些试验通常是可信的，已广泛用于下列疾病的治疗领域：癌症、感染性疾病和一些心血管疾病（例如用溶栓疗法治疗的急性心肌梗死）等。一般情况下，效应越大，研究与研究之间的结果变异就越小，在有良好对照的研究中不明原因地出现不能说明对照药优于安慰剂的情况就越少，使用这种设计也就越有说服力。因此打算开展ACET的研究者就要复习以前有关对照药的安慰剂对照试验，来明确是否能够令人信服地说明有这种信息。在患者选择、剂量、终点、评价程序、合用的治疗以及其他相关的研究设计特征方面，ACET应当尽可能地与以前的安慰剂对照试验相仿[17, 20]。

鉴于没有内部标准的试验的检验灵敏度不可避免地会有残余误差，所以ACET也许要比目的是说明差异的试验有更多的可复制性证据，才能获得信任。但是应当意识到，即使可以假设检验灵敏度，通常情况下，能够推测的活性对照在研究条件下所具有的效应仍相对较小。在这种情况下，需要有大的样本量，来获得所需的较窄的可信区间，以确保新药不亚于对照，差异不会超过该数量范围。在附录中进一步讨论了这个问题。

对相对有效性的研究
有些情况下，研究的目的也许是评价2种已知有活性的治疗的相对有效性。在这些情况下，有检验灵敏度对试验的解释而言，也必不可少。如果我们不能确信试验能够将活性药和安慰剂区别开来，那我们也就不能确信试验能够将疗效较好的药物和疗效较差的药物区别开来。最好进行有3个组（新药组、安慰剂组和活性对照组）的研究，因为它能够1)评价检验灵敏度，如果证实了检验灵敏度，2)就可测定新药的效应和3)比较2种有活性治疗的效应。

备选方法
并非所有的安慰剂对照研究都不让患者接受治疗。在开展优效性研究时提供标准治疗也常常是有可能的——也就是说，研究的目的是证实一种治疗方案优于对照方案。有时能够通过采用“添加治疗”研究设计对新药加以评价，在这种设计中，所有患者都接受标准治疗，并还被随机指定接受新药或安慰剂。关于癌症、心力衰竭和癫痫治疗的试验常常采用这种设计，就这些疾病而言，一般不能停用标准治疗。这样的研究不会直接提供有关药物作为单药治疗的信息，但是它们的确能够提供可说明的在确定情况下的有效性的证据，在新药的临床应用在很大程度上是用作添加治疗的情况下，这样的研究就特别适用。而且，如果取得成功，它们还会证实有能力比单独的标准治疗产生更大的受益，而不是（通常是）证实临床意义较小的结论：新疗法不亚于标准治疗。但是如果新药和标准治疗在药理学上相仿，那么就不能采用这种设计。

虽然我们提出被告知的患者可能要选择接受痛苦或不适，或短期推迟所必需的长期治疗，来参加安慰剂对照试验，但我们并不是说可以不管患者的不适。有些研究设计在不损害研究严密性的情况下，限定了安慰剂暴露的期限。这些包括“提前退出”设计和随机撤药研究[31, 38]。在“提前退出”研究中，患者被随机指定接受新药或安慰剂，但是会使用明确定义的治疗无效终点（比如在规定的时间症状持续或血压持续高）作为根据，对未能从最初指定的治疗获得受益的患者更换治疗。在随机撤药研究中，明显有效的患者先用试验疗法治疗一段时间，然后被随机指定接受安慰剂或继续用有活性的治疗。对随机指定的组，可比较确定的一段时间，也可采用“提前退出”方案。这种设计最初是由Amery提出的[39]，作为避免延长心绞痛患者使用安慰剂治疗时间的一种方法。随机撤药研究的一个特有价值是能够说明在安慰剂对照试验中难以进行研究的持续性效应持续的时间。

研究设计的管理情况
批评安慰剂对照试验的人常常会归结于食品药品监督管理局用它们来支持可能的最小规模的试验，设法评价绝对疗效，而忽略了新药与标准治疗相比结果如何这个他们认为是更重要的临床问题[1-6]。虽然有很多种试验设计可用来说明新药的有效性[15]，但是从1985年以来，描述妥当并有良好对照的研究的法规指出了对ACET解释方面的顾虑，反映了1950年以来众多临床研究者和统计研究者所表达的观点[15-33]。因此，如果不能确定ACET的检验灵敏度，那么就需要进行能够显示治疗之间差异的试验（安慰剂对照试验只是其中的一种）来说明有效性。这项要求的依据既不是要首选小规模的试验（尽管疗效不是一个微不足道的问题），也不是不关心比较（虽然根据法律，药物不必非得优于其他治疗或非得与其他治疗一样好才能获得批准），而是要在说明新药有效性的同时，又能提供解释ACET检验灵敏度证据的这个根本的需要。

结论
对于延迟或停止现有治疗会增加所研究人群死亡率或不可逆疾病的这种情况，安慰剂对照显然是不适用的。但是对于停止治疗不会产生严重危险的情况，患者参加安慰剂对照试验看起来是恰当的，也是合乎伦理的，只要能够充分告知患者。提出反对意见的根据不是明确的伦理准则，而是根据对《赫尔辛基宣言》中一段话的字面解读：只要存在有效治疗，也不能进行活性对照试验，甚至还要排除历史对照试验。看起来很难想象制定1975年修订的作者是为了得出这样的结果，他们在对修订建议的解释中没有做任何说明[8]。因此我们认为这种解释是站不住脚的。

如果ACET始终足以替代安慰剂对照试验，也许就不会出现伦理学问题。遗憾的是，ACET常常不能提供大量的信息。它们既不能说明新药的有效性，又不能提供有说服力的与对照治疗的比较结果，除非可以确定检验灵敏度，而在不同时包括安慰剂组的情况下，这又常常是不能做到的。

附录
Blackwelder[40]和其他人[20, 22, 24, 31]已经指出，在大多数情况下，将等效性检验描述为单侧假设检验更好，假设根据规定的量（“等效性边界”，也被称为非劣效性边界），试验药不亚于对照药。那么无效假设和备选假设则为：
H0=ES-ET≥∆
Ha=ES-ET≤∆
式中ES和ET分别是标准药物和试验药物的效应，∆是所关注的等效性边界或非劣效性边界。如果被检验的治疗和对照治疗之间差异的可信区间上限小于规定的边界，则会拒绝无效假设。在这种情况下，认为新药有效。如果可信区间包括了比边界更大的差异，则不能拒绝无效假设，也就不支持非劣效性。

边界的选择至关紧要，既取决于对照药物效应方面的知识，又取决于临床判断。所选的边界不得大于在对照试验中一般能够说明的对照药物和安慰剂之间的最小差异。因此除外大于该边界的差异也就意味着至少试验药具有一定程度的对照药所具有的效应，因此也就意味着试验药至少有些效应。如果在医学上认为必须确保有特定比例的对照药效应，那么规定的边界就得小于最大的可能的非劣效性边界。如果在规模和设计都妥当的试验中，一般都不能说明对照药优于安慰剂，那么非劣效性边界就必须设定为0：也就是说，只有优于对照药，才能被视为是新药有效性的证据。如果能够选择表示可“保证”对照药肯定有效的边界，也就等于说试验有“检验灵敏度”，即将有活性治疗和无活性治疗区别开来的能力。

等效性边界的应用见附图所示。图中给出了5项不同的活性对照研究的假定结果。每项研究的结果见y轴所示，为治疗之间的差异（ES-ET，标准药物对照和试验药物之间的差异，如果差异是正值，则支持标准药物）和这些差异的可信区间。给出了3个可能的非劣效性边界。M1是与安慰剂治疗相比，在该研究中推测标准药物可具有的最小效应。M2是M1的一部分，选择原因是认为其对确保新药具有相当大一部分标准药物效应而言必不可少。M0是在标准药物一般都不优于安慰剂的情况下必须使用的边界：也就是说，只有新药具有优效性才是可接受的有效性证据。

附图. 对活性对照试验中等效性边界的解释

给出了5项研究的假定结果。每项研究的结果见y轴所示，为治疗之间的差异（ES-ET），式中ES代表对照药，ET代表试验药。如果差异是正值，则支持标准药物。误差棒给出了对这些差异假定的95%CI。给出了3个可能的非劣效性边界（M0、M1、M2）。更详细的说明见附录。

对研究1-5结果（附图）的总结见以下各段。

研究1：可确定有效性边界M1，说明了有效性，因为支持标准药物的差异可信区间不包括大于M1的非劣效性。而且，研究还说明具有50%以上的标准药物效应。但是，如果不能假设检验灵敏度（也就是说，不能确信标准药物是否在研究中有什么效应，所以非劣效性边界即为M0），那么研究就不能说明新药的有效性。

研究2：根据M1边界时新药具有非劣效性可说明有效性，但是如果采用更严格的M2边界，则不能说明有效性。

研究3：没有说明有效性，因为根据有效性边界M1不能说明与标准药物相比具有非劣效性；试验药也许根本就没有效应。

研究4：不管选择哪个边界，都能通过证明试验药优于标准药物，说明试验药的有效性。

研究5：不能说明有效性，尽管对试验药效应的点估计有利，因为可信区间太宽，不能排除与标准药物相比，大于M1边界的非劣效性。
译文来自 Ann Intern Med. 2000;133:455-463.
作者：Robert Temple, MD, and Susan S. Ellenberg, PhD

免责声明（略）。

参考文献（略）。

新疗法评价中的安慰剂对照试验和活性对照试验（译文）

最新政策法规资讯

最新其他政策

同部门最新其他政策