统计分析在药学领域的应用(3)2018年02月02日CONTENTS统计分析在药品稳定性研究中的应用1统计分析的其他应用3统计分析在持续工艺确认中的应用2目录1统计分析在药品稳定性研究中的应用稳定性研究监测点的选择与法规符合性•稳定性研究数据的回归评价•影响因素:光照、温度、湿度等,导致有效成分变化。目的:找到影响因素与结果之间的相关性,从而能够给出适合的储存条件下可以相对稳定贮存的期限,考察变化趋势。做预测就是做回归。稳定性研究一定是以市售包装包装进行,研究应尽可能降维处理,仅为与时间的相关性,连续3批之间无其他条件差异性,特别是用于注册申报考察的样品。试验样品:影响因素试验通常只需1个批次的样品;如试验结果不明确,则应加试2个批次样品。加速试验和长期试验通常采用至少连续3个批次的样品进行。稳定性研究监测点的选择与法规符合性•稳定性研究稳定性研究监测点的选择与法规符合性•制剂质量的“显著变化”定义为:•1.含量与初始值相差5%(初始值是100%),任意两点间移动极差不超过5%。•2.任何降解产物超出有效期标准规定的限度。•3.外观、物理性质、功能性试验(如:颜色、相分离、再分散性、沉淀或聚集、硬度、每揿剂量)不符合。一些物理性质(如:栓剂变软、霜剂熔化)的变化可能会在加速试验条件下出现;“显著变化”还包括:•1.pH值不符合规定;•2.12个剂量单位的溶出度不符合规定。显著性变化稳定性研究监测点的选择与法规符合性•稳定性研究统计分析:应对可能会随时间变化的定量指标(通常为活性成分的含量、降解产物的水平及其他相关的质量属性等)进行统计分析,具体方法是:1.将平均曲线的95%单侧置信限与认可标准的相交点所对应的时间点作为有效期(复检期)。2.对每批样品的回归曲线的斜率和截距进行统计检验,P值>0.25,批次间的变异较小,即(无显著性差异);P值≤0.25,批次间的变异较大,不能合并分析,有效期(复检期)应依据其中最短批次的时间确定。回归曲线:时间和初始值矩阵(非规律性、直接引用四分位法切比雪夫定理)经常用到的比对性的差异评估,选择方差分析和卡方检验方差分析(ANOVA):用于两个及两个以上样本均数差别的显著性检验,比较振幅差异比较。卡方检验:百分数如:合格品率,一次到货率。包括取样是否有代表性,偏差整改后是否有效。方差分析和卡方检验稳定性研究数据的回归评价稳定性研究数据的回归评价稳定性研究数据的回归评价稳定性研究数据的回归评价回归方程批次稳定期1结果=0.32660-0.03358月6.21972结果=0.41642-0.04434月6.69743结果=0.42019-0.04425月6.2197模型汇总SR-sqR-sq(调整)R-sq(预测)0.010253699.23%98.80%95.13%P=0.000因素“月份”、“批次”、“月份和批次的交互作用”三个P值(P=0.000)均小于0.25,“月份”、“批次”及“月和批次的交互作用”均非常显著,表明产品A每个批次的回归方程具有不同的截距和斜率。2统计分析在持续工艺确认中的应用第一百零一条应当按照操作规程对纯化水、注射用水管道进行清洗消毒,并有相关记录。发现制药用水微生物污染达到警戒限度、纠偏限度时应当按照操作规程处理。•无菌附录(第十条-八)应当按照质量风险管理的原則对C级洁净区和D级洁净区(必要时)进行动态监测。监控要求以及警戒限度和纠偏限度可根据操作的性质确定,但自净时间应当达到规定要求。GMP条文持续工艺确认的设计与实施持续工艺确认的设计与实施都依据数据统计分布•数据采集应当基于验证(首次验证、重大变更验证)数据分类•数据分析结果警戒限、行动限设定(与变更)基于切比雪夫定理(箱线图、散点图、连线图)•数据统计基础的年度验证计划(主计划)的起草则是根据单值移动极差图来确定持续工艺确认与统计警戒限和纠偏限警戒限度(UCL)、纠偏限度(LCL):①首选公差四分位法(基于切比雪夫定理);②备选以正态分布为前提的2倍标准差(警戒限)、3倍标准差(行动限);③部分情况采用阈值法,将数据由大到小排列,分布选取对应个数的1%或5%作行动限和警戒限。持续工艺确认的设计与实施1.估计频数分布一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。2.为许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。正态分布持续工艺确认的设计与实施置信区间1.“可靠程度”,是用概率来度量的。每100次有多少次是可信的。2.置信水平记作1-α,这里α是一个很小的正数,称为显著水平。控制图--均值-移动极差I-MRI-MR可以忽略正态性,适用范围非常广,可用于水系统、杂质、年度质量回顾等。备注:统计过程控制主要解决:过程运行状态是否稳定(I-MR),过程能力是否充分(CPK)。正态图、箱体图、均值中位数比较图制作第一四分位数0.96100中位数0.96500第三四分位数0.97400最大值0.980000.955740.975400.957270.975600.006850.02340A平方0.20P值0.813均值0.96557标准差0.01063方差0.00011偏度-0.555341峰度0.756973N7最小值0.94700Anderson-Darling正态性检验95%均值置信区间95%中位数置信区间95%标准差置信区间98.00%97.00%96.00%95.00%中位数均值97.50%97.00%96.50%96.00%95.50%95%置信区间C1的汇总报告常见正态图高原型双峰型离岛型21191715131197531252015105观测值单独值_X=15.78UCL=24.10LCL=7.452119171513119753110.07.55.02.50.0观测值移动极差__MR=3.13UCL=10.23LCL=0沉香浸出物的I-MR控制图I-MR控制图制作方法持续工艺确认-案例1要对某片剂产品的制片工序进行工艺验证,要求该产品片重为100mg.质量标准为93.5-106.5mg之间,否则为不合格。随机抽取25样本,见表。判断该产品制片工序是否符合工艺验证的验收标准。100.2199.36101.01100.1098.3299.03100.11100.2599.23100.8699.3698.3298.33100.0899.68100.5498.66100.08100.2099.0499.2199.98100.78100.46100.21数据:样本均数=99.74mg,样本标准-0.81mg,样本量n=25,置信度95%,覆盖率95%。判断结果:容忍区间97.61mg-101.87mg在控制限93.5-106.5mg之间。说明该工序具有95%置信度和95%测试值都在质量标准内。持续工艺确认-案例2某药品成品收率持续工艺确认-案例3—成品收率正态分布:P0.05,期望0.4平直型:计算值,数据分布不够宽,灵敏度不够箱线图:查报警均值和中位数95%置信区间是否重叠区域50%,应该在75%以上持续工艺确认-案例4--含量含量均在内控限62.5%-65.5%之间,含量控制比较稳定?离岛型持续工艺确认-案例5--水分水分在1.0%以下,均符合内控限,内控比较稳定?锯齿型持续工艺确认-案例5—杂质单一杂质总杂质持续工艺确认-案例6—中药提取浸出物值:不得少于10%持续工艺确认-案例6—中药提取持续工艺确认-案例6—中药提取3统计分析的其他应用•1、统计学是一门综合科学,不仅仅是数学。•2、统计学应用需要思维活跃,格局事件来选择适当的计算方法。•3、对事件的判断需多部门、多岗位共同参与。统计分析的其他应用过程能力:制程能力是指制造过程中生产产品的品质能力,包括品质水平及品质的稳定性。统计分析的其他应用—过程能力控制统计分析的其他应用—过程能力控制统计分析的其他应用—过程能力控制统计分析的其他应用—过程能力控制统计分析的其他应用—过程能力控制统计分析的其他应用—过程能力控制FDA的OOS调查指南表明“首次检验时若没有实验室错误或统计错误发生,就没有科学基础使原来的OOS结果无效,使复验结果通过。所有的检验结果,通过的和刻意的,都应报告,在批放行中考虑”例:某个药品含量标准是95.0-105.0%,并获得94.7%的OOS结果。调查未能发现根本原因。质量部授权复验。复验获得结果分别是98.0%,97.0%,96.1%,96.5%,97.4%和96.2%。考虑检验报告的平均值的计算是否应该包括或隔离OOS值。评估:质量部使用置信区间的计算方法。如果7个检验的平均值在于上下含量限之间的95%置信区间,排除OOS值是有统计依据的。因OOS值(94.7%);故此,我们建议按照复测六次中最小值直接开具报告书。而不是将六次数据平均。假如OOS值是105.7%,则以六次中最大值直接开具报告书。统计分析的其他应用—案例第一四分位数0.96100中位数0.96500第三四分位数0.97400最大值0.980000.955740.975400.957270.975600.006850.02340A平方0.20P值0.813均值0.96557标准差0.01063方差0.00011偏度-0.555341峰度0.756973N7最小值0.94700Anderson-Darling正态性检验95%均值置信区间95%中位数置信区间95%标准差置信区间0.980.970.960.95中位数均值0.9750.9700.9650.9600.95595%置信区间C1的汇总报告统计分析的其他应用—案例总结1、产品合格率与否是个概率事件,只能基于一定的概率认为下一批是合格产品—计算容忍区间,质量提升是不断降低不合格事件出现概率的过程;2、质量预测采用回归分析;3、拿到数据,先做方差或方差齐性,比较平均值、t检验;先计算瞬间抽样样本小组平均值、离散度;再计算批次内组与组间的平均值和离散;4、除了日常在线检测数据,大部分数据属于泊松分布;正态分布P≥0.05,P值越大越好,当数据由正态变成非正态,说明数据产生漂移;5、I-MR可以忽略正态性,适用范围非常广,可用于水系统、杂质、年度质量回顾等;6、警戒限和行动限:①首选公差四分位法(基于切比雪夫定理);②备选以正态分布为前提的2倍标准差(警戒限)、3倍标准差(行动限);③部分情况采用阈值法,将数据由大到小排列,分布选取对应个数的1%或5%作行动限和警戒限。