18983288589(微信同号)
18983288589(微信同号)
18908392210(微信同号)
18980413049
2005-06-22
/
其他
/
现行有效
/
CDE电子刊物
审评三部 杨进波 赵明 赵德恒
摘要:生物等效性试验中,统计学考虑应当体现于从最初的试验设计到最终的等效性检验整个过程中,本文就生物等效性试验中几个容易忽视和概念模糊的统计学问题进行讨论。
关键词:生物等效性;统计学
生物等效性(bioequivalence,BE)研究是评价药品质量的重要手段。它通过对两个药物或同一药物不同剂型的药代动力学指标(如血药浓度-时间曲线下面积AUC,峰浓度Cmax和达峰时间Tmax等)进行等效性分析,来考察含同一药物活性成分的不同产品质量是否一致,是判断后研发产品是否可作为替代药品上市的依据。
应当说,从最初的研究设计到最后的结论的得出,统计学是等效性试验不可或缺的重要工具,但统计学结论也并一定是最终的专业结论。在此,对几个容易忽视和概念模糊的关键点进行讨论,供申报单位参考。
1、试验设计
在大多数等效性检验中,一般采用交叉设计的方法,即每个研究对象轮流接受每一种处理方法,他们在两个时刻接受不同的处理。这是基于这样的理论:多数药物的清除率在个体间均存在很大变异,个体间的变异系数远远大于个体内变异系数。所以交叉试验通常比平行组设计达到较高的精密度,在所作的观察次数相等时,在检测产品的差异时交叉设计比平行设计更有效些。
尽管在BE研究中不常用平行设计,但是仍有平行设计优于交叉设计的情况。例如:(1)个体间的变异性比个体内的变异性小;(2)药物有较长的消除半衰期使得交叉设计中的长的清洗阶段延长了研究时间,增加了个体失访的机会;(3)增加个体数量的花费比增加一个另外的治疗阶段要小;(4)个体频繁的血液采样不易实施。
2、样本量的估算
不同国家颁布的生物等效性研究指南中对受试者例数的要求有所差别,其中美国要求24-36例,欧盟>12例,日本为20-30例,我国为18-24例,目前尚缺乏国际的一致性标准。
生物等效性研究一般要求在5%显著性水平下检测出两个所比较的产物间20%或更大的差别的功效为80%。对于此标准,大多数药物的生物等效性试验样本量为18-24例可能足够,但样本含量除了与上述的规定有关外,还与比较的变异性(误差)有关。对于某些药物——如高变异性药物(一般认为个体变异大于30%的药物为高变异性药物),我们认为此时受试者例数不应仅满足法规的一般要求,还应满足统计学要求,或采取一些试验设计上的变通(如多剂量研究、重复测量设计或成组序贯研究等)。
3、数据对数变换的重要性
一般建议,AUC等药代动力学参数的生物等效性评价应在对数尺度下进行。因为:(1)通常情况下,AUC和Cmax呈正偏分布且方差不齐,对其作对数变换可以改善其分布的偏性,缩小方差间的差异;(2)药代动力学参数在原来测定的标度系统中分析,实验对象的效应不是加和性的,而对数转换后的数据可以用加法模型进行处理,这一点在统计检验中具有重要的意义。
所以,进行对数变换后,使得运用方差分析和双单侧t检验分析药代参数的可靠性和效能更好。不过必须认识到,在生物等效性研究中,样本容量是有限的,即使采用对数变换,也不能从根本上对一组数据是否符合正态分布作出可靠结论。
4、方差分析和双单侧t检验
审评实践中,发现很多申报单位对方差分析和双单侧t检验的意义和相互关系仍然模糊不清,盲目运用统计学软件导致最终得出错误结论的情况仍然很多,在此进行讨论。
方差分析和双单侧t检验是相互独立又相互关联的检验:
(1)之所以说二者相互独立,是因为二者为两种不同的检验,其检验假设和得出的结论均不一样。方差检验是差异性检验,设定的无效假设是两药无差异,检验方式为是与否,在P<0.05时认为两者差异有统计意义,但不一定不等效;P>0.05时认为两药差异无统计意义,但并不能认为两者等效。
双单侧t检验是等效性检验,设定的无效假设是两药不等效,受试药在参比药一定范围之外,在P<0.05时说明受试药没有超过规定的参比药的高限和低限,可认为两药等效。
(2)二者又相互关联。对交叉设计而言,要准确地解释分析等效性的结果,非常重要的假设是不存在周期间残留效应。简单地采用一个t检验的方法是不适当的,认为这忽略了可能存在的残留效应(在生物利用度的研究中,残留效应通常是由于洗消期长度不合适所造成的)。如果存在残留效应,而在统计检验中又没有考虑进去,统计分析将是不敏感的。因此,方差分析判断两周期是否存在残留效应是进行双单侧t检验的前提条件。
其次,在生物等效性实验中,方差分析可提示误差来源,交叉试验的等效性检验之标准误均是以交叉试验的方差分析中误差均方为基础的。这也是方差分析对双单侧t检验的贡献。
需要指出,对方差分析得到的显著性周期效应等应有一个清醒的认识。常规的双处理、双周期交叉设计的主要问题是下面的一些效应可能会纠缠不清:(1)真实的周期效应;(2)不等性残留效应;(3)处理和周期的交互作用。纯粹的周期效应是不会使生物等效性的决定发生偏差的;但不等性残留效应会使等效性的估计值发生偏差;处理与周期的交互作用会使两组间药代动力学参数之间差值的解释产生困难。如果对周期效应进行的方差分析得到显著性,其真正的原因仅从数据本身中是不能找到的。并且即使不存在上述的各种效应,如果检验是在10%的显著性水平下进行的,在100个双处理的交叉设计研究中也大约有10个可能表现出显著性的周期效应。
根据这些考虑,FDA指导文件指出,在以下所述的条件下,一个体内的双处理、双周期交叉生物等效性研究表现出显著的周期效应也是可以接受的:(1)它是单次给药的;(2)其中只包含了健康的正常受试者;(3)药物不是内源性物质;(4)足够的清洗期,在第二阶段中,对所有的受试者,上一个阶段中给药后产生的生物样品中没有可以测出水平的药物;(5)研究符合所有科学和统计学的标准。
5、Tmax的检验及相关问题分析
一般认为,Tmax的分布性质是未知的,有时其数据太偏离正态分布,以致即使在处理平均值时也不能接受正态假设。因此一般采用非参数方法(亦称为无分布统计)对Tmax进行检验,它可以对显著性水平做一个快速的近似估计。
Tmax检验常见错误的分析:(1)采用t检验(或F检验)的方法分析Tmax是否存在差异。这不符合Tmax参数的分布特性而可能导致统计结论错误;(2)非参数方法检验出两处理间Tmax存在显著差异而得出两药不等效的结论。这时可从以下两个方面考虑:(a)非参数方法的效能较t检验或F检验可能稍低;(b)一般的等效性检验主要还是针对AUC和Cmax的检验,对于Tmax,仅仅在药物释放快慢与临床疗效和安全性密切相关时才需要着重关注,故应当运用医学专业知识判断其在等效性检验中的权重。
6、统计学判断与专业判断
统计学差异是指该差别不大可能单纯由偶然因素导致,专业差异则指从专业角度讲该差别有意义。二者概念上的区别在于,前者与随机性(概率)有关,后者则主要与药物的具体特性相关。若专业上与统计学上均显著或均不显著,作出的结论就很明确,没有理解上的歧义。然而,专业上与统计学上结论不一致的情形也不少见,因素的变异度较大及样本含量不足,可能是使结果不一致的原因。
在此认为,统计学为专业审评提供的是一个重要工具,它只是给予专业判断一个显著/不显著(或等效/不等效)的意见;而药品审评是对药品安全、有效的综合考虑。一般情况下应当接受统计学结论,但有时二者存在显著歧义时,应当结合药品具体特性综合考虑,作出科学评价。
本文仅代表个人观点,欢迎交流指正。
Pharma CMC2024-10-15
摩熵医药(原药融云)2024-08-21
数屿医械2024-06-24
数屿医械2024-06-13
数屿医械2024-05-30
摩熵医药(原药融云)2024-05-27
药事纵横2024-02-28
药通社2023-12-26
摩熵医药(原药融云)2023-12-13
药通社2023-06-25
2024-11-20
2024-11-19
2024-11-19
2024-11-19
2024-11-19
2024-11-19
2024-11-18
2024-11-18
2024-11-18
2024-11-11
2024-11-11
2024-11-05
2024-11-04
2024-11-04
2024-10-30
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-10-01
2023-09-01
2023-09-01
2023-09-01
2023-09-01