《中国新药杂志》 2016年18期

药物临床试验中疗效评价指标及常见评价方法

刘炳林

【摘要】：本文参考国内外新药临床试验的相关指导性文件和指南,根据新药审评经验,说明了新药临床试验中疗效评价指标和疗效评价方法的重要性。在对新药临床试验中疗效评价指标和疗效评价方法的认真梳理的基础上,对新药临床试验中的疗效评价指标和常见的疗效评价方法进行了系统的归纳和总结,针对长期以来研究者仅重视临床疗效观测指标而忽视临床疗效评价指标和评价方法的现状,提醒研究者在新药临床试验设计时不但要重视疗效观测指标的制定,更应该重视疗效评价指标和评价方法的制定工作。

【作者单位】：国家食品药品监督管理总局药品审评中心;
【关键词】：新药 临床试验 疗效评价 疗效评价指标 疗效评价类型

有效性是药品上市和存在的基础，药品上市前必须首先确定其有效性;因此，药物的临床试验首先需要证明其有效性，而药物临床试验中最重要的工作之一就是疗效评价。

一项药物有效性评价的临床试验，除了随机、对照、盲法等临床试验的基本设计要求外，其疗效评价的关键因素就是疗效指标的选择。疗效指标是反映试验药物作用于受试者所表现出的有效性的主要观测与评价工具，主要包括疗效观测指标和以疗效观测指标为基础确定药物疗效的评价指标。疗效观测指标是指在临床试验中用于药物有效性评价的观察和测量的指标(统计学多称为变量)，疗效观测指标可以是疾病临床终点(如死亡、残疾、功能丧失)、影响疾病进程的重要临床事件(如心肌梗死、骨折、脑卒中的发生)，也可以是反映患者社会参与能力(残障)、生存能力(残疾)、临床症状和/或体征、心理状态等内容的相关量表或其他形式的定量、半定量或定性的指标，也可以是通过某些医疗仪器和设备测量手段获得的数据或检查结果，主要包括影像学、病理、生化等指标如病理检查结果、细菌培养、血脂、血压等。

药物的临床疗效一般通过疗效观测指标来记录，而疗效评价可以是某一疗效观测指标的直接测量结果，更多的是在直接测量结果基础上转化而来的、特定的评价指标来评价。同一疗效观测指标，可以转化出多种疗效评价指标，不同的疗效评价指标在药物有效性确证中的作用不同和地位不同，有的可以作为主要疗效指标，有的则作为次要疗效指标。如某一适应证的评价量表，以治疗前后的减分值为主要疗效指标，而以 50% 的减分率的患者比例为次要疗效指标。而另一适应证的评价量表，以积分变化到某一积分值以下患者的比例为主要疗效指标，而治疗前后的减分值比较为次要疗效指标。因此，在一项临床试验设计中，无论是主要疗效指标还是次要疗效指标的确定，除了需要确定疗效观测指标外，更重要的是根据临床试验目的，以疗效观测指标为基础确定疗效评价指标。一个完整的疗效指标的确定既包括疗效观测指标，也包括以疗效观测指标为基础疗效评价指标。由此可见，在临床试验设计中，在明确药物的观测指标后，还需要根据药物临床试验目的和相关指标的重要性确定药物疗效评价指标。

梳理现有的药物临床试验指导原则和临床试验疗效指标的设计的现状，药物疗效评价指标类型一般有以下几种。

1 直接使用治疗结束时的观测指标显示的结果组间比较作为有效性评价的方法

如在临床试验设计方案中已经明确了患者达到的痊愈或显效等的疗效标准，由医生或患者直接对药物治疗后的有效性做出的评价。如，单纯性尿路感染抗菌药物临床研究中，主要疗效指标可以直接比较组间达到持续治愈患者的比例;如在精神疾病临床试验中经常使用临床总体评价量表 CGI 量表以及用于老年性痴呆总体评价的 ADCS-CGIC，CIBIC-plus 等;其特点是使用一组有等级分类资料来表述其治疗后疗效情况，如分为非常显著改善、显著改善、轻微改善、无变化、轻微加重、显著加重、非常明显加重 7 级来评价用药后不同患者的疗效，不需要结合基线值情况，可以直接比较其组间疗效差异。需要说明的是还有一种情况，由于各种原因未能取得基线值，如用于脑卒中的超早期溶栓和急性早期神经保护治疗，主要疗效观测指标为发病后 3个月时修订的Ｒankin 量表 ( mＲS)、Bathel-Index(BI)情况，但由于治疗前病情等原因，一般无治疗前基线的 mＲS，BI 值，主要通过随机分组、纳入试验时的 NIHSS 积分要求等手段保证组间的一致性，疗效评价时不需要再考虑基线值的情况。

2 使用治疗期间某临床终点结局或重要临床事件发生率的组间比较作为有效性评价的方法

如疾病死亡率、心肌梗死、骨折、脑卒中发生率等。因为这类指标多具有重要的临床意义，因此，该类临床结局指标中的多数为临床试验的主要疗效指标。但如果该类指标发生率较低，临床试验需要的时间足够长，样本量需要足够大，研究难度较大，甚至以此为临床试验的主要疗效指标是不切实际时，可以使用其他疗效评价指标作为终点疗效指标评估临床受益。例如，对于心力衰竭按纽约心脏协会心功能分类系统Ⅲ ～ Ⅳ级的患者，因为死亡率很高，使用生存试验是可行的;但如果心力衰竭病情较轻，由于其死亡率较低，这样的试验将是困难的或不可能取得结果的，这时临床试验可以使用全因死亡率加住院率等多项指标组成的复合指标为主要疗效指标。如肾功能不全的全因死亡率、终末期肾病(需要透析或肾移植)加肌酐翻倍发生率为主要疗效指标。

需要注意的是虽然该类重要的临床事件一般都具有明确的医学诊断标准，但作为主要疗效指标判断时，仍然可能存在判断上的不同认识，因此，较为规范的大型试验多设有独立终点评审委员会以加强医学事件判断的准确性，如疾病死亡率统计中死亡与疾病的相关性判断等。

3 使用出现某一医学事件或达到预先规定的相应标准(疾病好转或加重)的时间分布情况作为有效性评价的方法

如抗癌药物临床试验中常常使用的如总生存期(OS)、无疾病生存期 ( DFS)、至肿瘤进展时间(TTP)、无进展生存期(PFS)等，另外，对于某些自限性疾病，可以以疾病达到痊愈的时间(症状体征等消失)的比较;如治疗流行性感冒的主要疗效指标可以使用组间达到痊愈时间进行比较;该类疗效评价一般属于生存分析。但由于该类临床试验评价中涉及各种原因脱落患者和观察期结束时未达到设计的标准者截尾数据问题，并且观察时间、相关临床事件或预先拟定的相应标准均需要有详细的规定和要求，如 FDA 的抗肿瘤药物上市申请的临床试验终点指导原则中，在附录 2 对 PFS 分析中需考虑的问题，如进展日期的定义、撤出日期的定义等均具有详细的说明和规定。对于流行性感冒痊愈(症状体征等消失)的标准(症状减轻到的程度和时间的计算等)也应有详细标准规定。因此，在临床试验设计时，需要在临床试验方案和统计分析计划书中预先明确相关规定，必要时，也应该设有独立终点判定委员会以判断其终点指标的准确性。该类疗效指标一般以组间中位生存时间为主要疗效比较方法。

4 使用治疗结束时各组相对于基线的变化组间比较作为有效性评价的方法

这种变化可以是相对基线的绝对值，即治疗后和基线之间的差值(均数 ± 标准差)比较;也可以是相对变化，如相对于基线变化的百分比(变化率)的比较;很多的生理生化指标、评价量表积分使用该评价方法;该类比较应该注意其组间差异不但需要有统计学显著意义，还需要有临床意义。如与基线比较血压的变化均值、糖化血红蛋白的变化率、低密度脂蛋白胆固醇降低值和降低百分率等，如蒙哥马利-艾斯伯格抑郁量表(MADＲS)、老年性痴呆使用的ADAS-Cog 量表、更年期综合征使用的改良的Kupperman Index、良性前列腺增生症用 IPSS 评价量表等多使用与基线比较的变化值或变化率为组间疗效比较的主要方法。但需要注意的是，有时该类量表仅凭量表积分减分值或减分率无法确定其是否具有临床意义，有时，尚需要结合其他评价指标以确定其减少(分)值(率)是否有足够的临床意义。

5 对于发作性疾病，有效性评价一般可以使用规定时间段内发作次数、发作频率变化值(治疗结束前与基线值)组间比较作为有效性评价的方法

如每月癫痫发作次数、每月偏头痛发作次数、每周心绞痛发作次数，但该类疗效评价由于是治疗前规定的时间内(基线取值)发作次数、发作频率与治疗结束前规定时间内发作次数、发作频率变化值组间比较，因此，治疗前基线取值显得十分重要，应该有足够长时间的药物洗脱期和导入期以观察到不同组在相同条件和干预因素下(一般应该与临床试验期间除了试验和对照药物外的条件和干预一致)疾病发作次数、发作频率基线值。同时，一般临床试验疗程应该是临床试验设计的疾病发作观察周期的数倍，如偏头痛一般以每个月的发作次数进行观测和疗效比较，而其临床试验疗程一般应该不少于 3 个月;冠心病稳定性心绞痛一般以每周心绞痛发作次数进行观测和疗效比较，则针对稳定性心绞痛的临床试验观察疗效应该不少于 4 周；当然，如果其他指标为主要疗效指标，则可能需要根据其主要疗效指标的要求设计相应的临床试验疗程。另外，该类疗效治疗的比较也应该注意其组间差异不但需要有统计学差异的显著意义，还需要有临床意义。

6 使用达到某一共识性的有效者标准的患者比例评价药物的有效性

在药物临床试验中，经常遇到直接使用疗效观测指标值或其变化(如变化值或变化率等)难于反映药物有效性的临床意义和上市价值情况，这时，为了较为准确判断药物有效性的临床价值，往往需要根据相关适应证及其临床试验目的、相关研究结果和/或专家共识，对其观测指标的有效性设定一个有效值和/或有效界值，根据确定的这一界值，把计量资料转化成二分类，如“有效”、“无效”两类。使用治疗结束时或治疗结束后随访到某一时间点达到这一有效界值或某一变化条件的患者比例组间比较作为有效性评价的方法。也可以将一个连续计量疗效观测指标以最低改善百分率等于或超过某一阈值(如“痊愈”或“临床控制”)患者的比例组间比较作为疗效评价指标。如治疗结束时，类风湿关节炎症状体征 ACＲ积分改善要求达到 20% 及以上为有效，要求比较组间 ACＲ积分改善达到 20% 及以上的患者比例;银屑病主要疗效指标是以治疗后各组银屑病面积及严重指数(PASI)得分较基线至少改善 75% 的比例;比较脑卒中有效性疗效评价，一般要求以发病 3 ～ 6 个月时 mＲS 评分达到0 ～1 分的患者和/或 BI 积分达到 95 ～ 100 患者为有效，要求比较组间达到有效者的比例［15］。需要特别注意的是，这种界值不是随意设定的，而是需要有相关适应证领域的共识和相关研究结果的支持。并且，在一个临床试验中，这种疗效评价指标应在临床试验设计方案中事先做出明确规定，而不能在临床试验开始后或临床试验结束后再确定。一般不主张将定量指标简单的转化为多分类等级指标。这种转化缺乏科学性的基础，更不能事后随意划分截断点(计算痊愈率、愈显效率、有效性率、总有效率等)进行组间比较，以免导致 I 类错误率无法控制。

7 使用病情与时间的曲线下面积的比较评价药物有效性

有时反映病情的轻重的疗效观测指标容易出现随着时间波动，而临床试验又需要关注不同的观察时点的疗效指标(病情轻重)的整体变化情况，这时，可以使用相关指标组成的曲线下面积组间比较作为有效性评价的方法。如止痛药物对慢性长期疼痛的控制，可以使用观察时间为横坐标，以疼痛程度为纵坐标，每位患者每个观测时点疼痛程度连线，以曲线下面积(AUC)大小来比较药物组间有效性的差异。再如治疗流感的药物疗效评价，可以使用不同时间点内主要症状积分的比较，使用重复测量的曲线下面积比单独使用积分的均值或中位数表述更为恰当;针对系统性红斑狼疮(SLE)以降低疾病活动性为主要目标的临床试验中，一般要求以疾病活动指数(DAI)变化为主要观测指标，但考虑到 SLE的慢性特征及其病情时轻时重的特点，其中的评价方法之一可以是对试验过程中的固定间期多次重复测量的 DAI 积分构成的 AUC 来进行组间药物有效性差异比较的方法，可能比在单一时间点检测的疾病活动性更加全面。对于疾病病情波动较大而疗程较长的慢性疾病，如果在临床试验期间多个时间点(或周期)采集了观测指标数据，则该项临床试验能够展示治疗效果的时间进程和间发的疾病活动性，因此，能够更好地反映疗效的实际情况。然而，在解释 AUC 差异时应持谨慎态度。如果这种差异的临床意义不好确定，则该类疗效指标比较可不作为主要疗效指标。

在疾病病情波动较大而疗程较长的慢性疾病的疗效观测和评价中，如果在临床试验期间多个时间点(或周期)采集了观测指标数据，还可以通过诸如比较开始和结束时机体的功能状态，比较整个试验期内所有观察结果计算得的斜率，比较超过或低于指定界值的患者的比例等方法来进行疗效评价。

在新药临床试验方案的设计和制定中，无论是临床专家还是统计专家，重视疗效观测指标选择而忽视疗效评价指标和评价方法的制定的情况较为普遍，本文强调了在新药临床试验设计中，不仅需要关注疗效观测指标的制定，更应该注意以疗效观测指标为基础的疗效评价指标和评价方法的制定，同时，对新药临床试验中常见的疗效评价指标和评价方法进行了总结。

《中国新药杂志》 2016年10期

药物临床试验中有效性指标的分类

刘炳林

【摘要】：本文参考相关法规、指导性文件和指南,经过认真梳理,针对新药临床试验中疗效指标的多种分类及其与之密切相关的疾病临床结局分类,详细说明了各种分类中不同疗效指标和疾病临床结局的定义、概念、特点和在药物临床试验有效性设计、观测和评价等应用中应该注意的问题,特别是重点阐述了与新药临床试验密切相关的临床结局指标、临床终点、替代终点、主要疗效指标、次要疗效指标等概念和特点,以及不同指标的选择对新药临床试验设计、实施和评价的影响。

【作者单位】：国家食品药品监督管理总局药品审评中心;
【关键词】：新药 临床试验 临床结局 临床终点 替代终点 中间终点 主要指标 次要指标 生物标记物 临床结局评估 患者报告的结局 医生报告的结局 观察者报告的结局 表现结局

药品是指用于预防、治疗、诊断人的疾病，有目的地调节人的生理机能并规定有适应症或者功能主治、用法和用量的物质。药品上市的批准是基于其安全性和有效性；有效性是批准药品上市基本要求的必要内容之一，是指因药品治疗带来患者在感觉、功能或生存状况上的受益。药物的有效性一般是通过药物的临床试验来发现和确定的；药物临床试验中评价药物的有效性主要是通过有效性指标的观测和评价来实现的。有效性指标又称为疗效指标，统计学又称为有效性变量，是反映受试药物用于患者所表现出临床获益的主要观测和评价工具疗效指标的选择、测量和比较是药物有效性评价中的关键因素。疗效指标主要包括疗效观测指标和以疗效观测指标为基础确定药物效应大小比较与评价的方法和标准，即疗效评价指标。

反映疾病变化的疗效指标可以是疾病临床终点（如死亡、残疾、功能丧失）、影响疾病进程的重要临床事件（如心肌梗死、骨折的发生），也可以是评价社会参与能力（残障）、生活能力（残疾）、临床症状和/或体征、心理状态等内容的相关量表或其他形式的定量、半定量或定性的指标，也可以是通过某些仪器和实验室检查等手段获得的某些客观数据或检查结果，主要包括病理生化等指标如病理检查结果、细菌培养、血脂、血压等。

疗效指标有多种分类方法，不同的疗效指标反映疾病临床结局变化的层面和重要性不同、其观察和测量的方法不同、表现形式不同、统计分析方法不同、在药物有效性评价中的地位也不同，因此，需要对临床有效性指标进行分类。有效性指标的分类方法众多，一般需要关注以下与药物临床试验密切相关的几种主要分类方法。

1 根据疾病对人体及其健康的影响水平或药物干预对人体疾病的影响进行分类

根据1980年，世界卫生组织（WHO）制订并公布了第1版对疾病所造成的健康结局进行分类的分类体系,即《国际残损、残疾和残障分类》。以及此后据此修改并于2001年世界卫生大会上通过的将《国际损伤、残疾和障碍分类》第2版改名为《国际功能、残疾和健康分类》的决议。对疾病等所造成的健康结果分为以下几个层面。

1.1结构水平异常

属于解剖和病理结构水平，是因为疾病、外伤或发育障碍等引起的身体解剖结构方面的异常变化，是和疾病有因果关系的生物学参数，如病理报告、X片、CT、MRI、B超、血管造影等显示的人体解剖病理组织结构的变化以及可以看的见的肢体缺失、变形、积液、肿胀、畸形等指标。

1.2功能水平异常

即传统所说的残损水平，即因为疾病、外伤或发育障碍等引起的身体各种功能的异常变化，包括记忆、感觉、运动、语言、视力、听力以及消化、呼吸、心血管、神经、精神、泌尿生殖等身体的各个系统生理功能（包括心理功能）出现的异常变化，一般是指疾病等引起的各种与人体基本功能相关的临床症状、体征等指标及其相关量表，如偏瘫、失语、失眠、健忘，或者反映脑卒中的神经功能缺陷的量表如NIHSS等。

1.3活动水平异常

即传统所说的残疾水平；属于个体进行活动时遇到的困难程度，是指因疾病'外伤或发育障碍等引起的患者执行一项任务或行动时表现出的差于正常人的水平，由于人的最基本活动为日常生活能力，因此，活动水平一般是指患者日常生活活动能力的指标（如，如厕等），或反映患者生活能力的量表，如反映脑卒中患者生理能力的巴氏指数等。

1.4 参与水平的异常

即传统所说的残障水平，属于个体投入到生活环境中时遇到的困难程度，是指因疾病、外伤或发育障碍等引起的患者参与一项社会功能时表现出差于正常人的水平，一般是指疾病等对患者社会参与功能、生活质量的影响水平的指标。

反映以上水平方面的异常都可以作为药物疗效评价的指标，不同的疾病，其有效性指标的要求不同，其要求疗效观测指标所反映的水平也不同，其在药物有效性评价中的重要性也不同。随着医学模式发展和现代医学认识的进步，在药物有效性评价中，越来越重视人的活动水平（残疾水平）和社会参与功能（残障水平）以及患者主观感受在药物有效性评价中的作用和地位，如反映患者日常生活能力的相关量表的评价、反映患者社会参与能力的相关量表评价、患者自我报告结局相关量表的评价以及与疾病相关的生活质量量表的评价等。但需要注意的是，QOL的评价容易受较多社会环境和心理等因素的影响，其反映疾病实际状况的客观性有时可能会受到影响，因此，多数QOL不作为主要疗效评价指标。

2根据反映药物干预后的疾病进程、转轨和变化状况的重要性进行分类

2.1临床结局

指各种干预治疗措施对患者产生的受益或伤害的临床结果，一般是指能够反映患者感觉、功能或生存特性或变化的指标。其中，感觉是指患者的身体感觉（例如症状）或感知的心理状态，患者可能感觉到的疼痛、发热或感到严重的情绪低落（如同抑郁一样）等；功能是指患者成功的执行一项任务方式和在必需的日常生活中发挥的作用，患者完成日常生活中的一项任务专门活动所表现出的特定的能力（如，如厕、穿衣等）。生存是指患者疾病最终结局如生存期、残疾、功能丧失和某些重要的临床事件（如，心梗、骨折）等生存状况水平和特点，指那些对患者影响最大、最直接、患者最关心、最想避免的临床事件。

2.2 临床终点

临床终点是在一个特定时间段内已经发现症状或功能水平，或反映患者感觉、功能或生存状态的临床特点或变化的观测与评价指标，例如：死亡率报告、视力的丧失等。终点是一种用于评价一个临床试验中不同治疗组间治疗效果统计学比较结果的一种评价方法，终点往往被解释为通过测量的评估；但实际完整的终点指标应该包括资料收集的全面描述，以及支持特定研究目的的分析比较方法。可见，临床结局与临床终点反映的内容比较相近，但临床结局主要是反映对疾病干预治疗产生的结果，而临床终点更强调在特定时限内的临床试验中，对临床结局的观测与评价。因此，药物临床试验一般都使用临床终点概念。而临床终点指标是指能够反映患者感觉、功能或生存的特性或变化的指标。临床终点指标能直接评价受试药物真实的效应，因此，传统的药物疗效评价一直是以临床终点指标进行评价的，如存活率、严重疾病发生率或者症状缓解率等。但由于有的临床终点指标评价往往需要的时间长、样本量大、研究成本高，有时还存在医学伦理风险，导致临床终点指标观测存在困难或不合理。因此，需要寻找能够替代临床终点指标的、易于观察和测量的疗效指标作为替代性指标，评价药物的有效性。

2.3 替代终点

替代终点是指能够替代临床终点指标，反映和预测临床终点变化的指标。替代终点指标应该是根据流行病学、治疗学、病理生理学或其他科学的证据，能够合理预测临床受益或者对临床终点指标（死亡或者不可逆的恶性病变除外）存在疗效的。如血压、低密度脂蛋白作为替代指标可以预测心血管事件的发生率。需要特别注意的是，虽然替代终点指标可以降低药物研发成本和试验难度，但不是真正的临床终点指标，且能够广泛使用的替代指标并不多。替代终点指标可能因为选择不当而导致药物临床试验失败，因此，选择替代终点指标需要特别谨慎。有的替代终点指标即使已经被同类药物治疗某一疾病的临床试验验证过，但用于另一个同类适应症的临床试验仍然可能存在风险。

2.4中间终点

中间终点本身不是一个与疾病最终结局相关的功能或症状测量的临床终点；一个中间终点的改善一般不会导致发病率和死亡率降低的价值。一个中间终点多是在比传统接受临床终点出现前时间点观测出结果。有时，中间终点显示的治疗效果也可以预测最终的临床结局，这时，中间终点起到了替代终点的作用。例如，在治疗心力衰竭临床试验中，运动耐量有时用作中间的终点。

3 根据在药物临床试验疗效评价中的重要性进行分类

在一项临床试验设计中，根据研究目的和不同的疗效指标在临床试验中的重要性，把疗效指标应分为主要疗效指标、次要疗效指标等。

3.1主要疗效指标

一般又称为主要终点，是指与药物试验目的有本质联系，能够反映主要临床试验目的、与临床终点结局最有关、对药物有效性最可信证据，能确切反映药物有效性的指标。在确证性临床试验中，反映药物有效性的主要疗效指标一般应该是该目标适应症同一研究目的下的临床终点或公认的替代终点。主要指标应根据试验目的选择易于量化、客观性强、重复性高，并在相关研究领域已有公认标准的指标。

在药物有效性临床试验中，根据药物适应症和临床试验目的选择和确定合理主要疗效指标是临床试验设计的重要内容。主要疗效指标应该有明确的定义、测量方法（若存在多种测量方法时，应该选择临床相关性强、重要性高、客观并切实可行的测量方法）、统计分析模型等，同时，主要疗效指标应该是能够反应具有显著临床意义的变化或临床受益的指标，应该能够直接反映患者在感觉、功能或生存状况方面具有显著临床意义的变化，或能够合理预测以上变化的替代指标。

主要疗效指标，包括其详细定义等都必须在临床试验设计阶段充分考虑，并在试验方案中明确规定。对方案中主要指标任何方面的修改，均应该谨慎行事、充分论证，并在揭盲前完成，不允许揭盲后对主要疗效指标进行任何修改。

在一项临床试验中，主要疗效指标不宜太多，通常只有1个。但有些适应症应选择多个不同维度、相关性较低的多个主要疗效指标，使用多个主要疗效指标评价药物的有效性时，需要统计学方面考虑对I类错误进行控制。

3.2次要疗效指标

又称为次要终点，是与主要临床试验目的相关的重要支持性疗效指标，或与次要目的相关的疗效指标。

次要疗效指标，包括其详细定义、对这些指标在解释临床试验结果中的作用以及相对重要性等也应该在临床试验设计阶段确定，并在试验方案中明确规定。次要指标可以为主要结论提供支持，但不能作为疗效确证性依据。

在一项临床试验中，除了需要设定好主要疗效指标外，也应该根据临床试验的主要目的和次要目的预先设定好次要疗效指标，次要疗效指标可以是多个，可以不对I类错误进行控制，但次要指标也不宜过多，足以达到试验目的即可。探索性试验可以以与主要终点指标高度相关的次要疗效指标为主探索药物的有效性和量效关系。有时，需要根据重要性把次要疗效指标分为重要的次要疗效指标和一般的次要疗效指标。

需要特别说明的是，无论是主要疗效指标，还是次要疗效指标，都是一种用于评价一个临床试验中不同治疗组间治疗效果统计学比较结果的一种评价方法，实际完整的表述应该包括相关指标的观察、测量（包括资料收集的全面描述）和评价（支持特定研究目的的分析比较方法）等。

4根据疗效指标的取得途径和来源方法进行分类

4.1生物标记物

生物标记是一种可以客观地测量和评价正常的生物学过程、致病的过程，或对治疗干预的药理学反应的指标。生物标记物可以是一种生理、病理、解剖特征，或者是与正常或异常的生物学功能或过程相关的某一方面的测量。典型的生物标记物通过试验（如血脂中的低密度脂蛋白等）或者仪器（如血压计）来测量取得的。多数生物标记物一般不作为药物临床试验的主要疗效指标；但生物标志物可以用于治疗前临床试验纳入患者的选择指标，治疗后生物标志物的变化有时可预测或确定试验药物相关的安全问题，或揭示药理作用特点，生物标记物可以帮助减少在药物开发中不确定性，提供预测药物性能的可量化的评价，有时还可以对药物剂量选择提供指导；但有时生物标记物可以预测疾病的转归和药物的最终获益，此时生物标记物可以作为药物临床试验中的替代指标来评价药物的有效性。

4.2 临床结局评估

COA是一种可能受到人的选择、判断或动机影响，并可支持治疗受益的直接或间接证据的评估方法。其不像生物标记物完全依靠自动的程序或计算法则；临床结局评估是对患者感觉、功能状况的一种主观评估，有时是对治疗受益有和无的一个简单判断；一个COA依靠患者、医生或观察者来执行、解释和报告；COA包括患者报告的结局测量、医生报告的结局测量、观察者报告的结局测量和表现结局测量4种类型。

4.2.1 PRO PRO是指基于未经医生和其他人进行修正和解释的直接来源于患者本人对健康状态报告的评价；PRO评估仅限于患者本人报告或会见人提供的仅限于患者对治疗直接反映记录的评价，包括症状和其他仅有患者知道的不能观察到的不适（例如疼痛强度或恶心）；PRO测量也能评估患者对其他人也能看到的患者的功能和活动的看法。PRO在药物评价中的作用越来越受到重视，根据不同的疾病特点和临床治疗目标，有的PRO可以直接作为主要疗效指标，有的可以作为次要疗效指标。

4.2.2 ClinRO ClinRO是基于有医疗专业训练的医生对患者健康状况观察后的评估报告；ClinRO测量包括了医生观察到的患者的症状、体征和与疾病或健康状况相关的其他身体表现后的临床判断和解释；ClinRO测量不能是已知的患者的唯一症状的直接评估（如疼痛强度），由于医生的专业性判断往往更能代表疾病的实际状况，因此，ClinRO指标在临床试验中常常作为疗效评价指标，有时甚至作为主要疗效指标。

4.2.3 ObsRO ObsRO是指基于患者本人和医疗专业人员外其他人员观测结果的评估其可以是父母、配偶或其他非临床的看护者提供的对患者健康状况的特殊方面有规律观测结果和报告。ObsRO评价不包括医学判断和解释。总之，ObsRO评价是由父母、看护者或其他人员观察到的与健康状况相关的患者日常生活方面的报告，对于患者本人不能做出应答的（如婴儿或认知损害者），鼓励观察者提供仅能够观察到的与医疗相关的患者行为和事件报告，例如，观察者不能恰当地报告婴儿的疼痛强度（一个症状），但可以报告因为疼痛引起行为异常（如哭泣）。例如，在评价儿童在教室中的行为时，教师是最合适的观察者（如注意缺陷多动障碍者表现的观测）。ObsRO目前多数为次要的疗效指标，一般不作为主要疗效指标。

4.2.4 PrefO PrefO是基于患者根据医疗专业人员给予的指令完成一项任务的表现结果的评估，需要患者合作和配合。这类结局测量包括步行速度测定（如心功能不全患者的6min步行试验）、记忆重现试验或其他的认知试验（如符号代码记忆试验）等。根据具体情况，由于该类指标多数为专业设计，因此，在临床疗效评价中具有重要的地位，有时可以作为主要疗效指标。

5根据疗效指标的结构特点或测量特点进行分类

5.1单一疗效指标

单一疗效指标是临床试验中最常见的疗效性指标之一，主要是指单一计量或分类计数的疗效指标，包括单一症状的发作轻重表述，如头痛每月发作频率、某个重要临床事件的发生率等。

5.2复合疗效指标

如果与主要试验目的有关的多种测定不能选择一个单一指标作为主要疗效指标，可按预先确定的计算方法，将多个指标组合构成一个复合指标。很多情况下，主要疗效指标是以多种临床疗效指标相结合的复合疗效指标的形式出现的，如在关节病、精神障碍及其他疾病中的评分量表等。将多种疗效指标测定相结合制定为一个复合指标的方法在临床试验方案中应该预先确定好，并且应该对其与临床受益大小相关的计分情况进行解释和说明、复合疗效指标的设计不是随意的，特别是拟作为主要疗效指标的复合终点指标，应该是相关适应症领域国内外较为公认的疗效指标，其临床意义经过了相关领域的讨论形成了国内外共识。当复合性量表评分用作主要疗效指标时，对其信度和效度、反应度等应该有严格的要求。

5.3 全局评价疗效指标

全局评价疗效指标通常是指把客观指标和研究者对患者治疗后的临床结局状态或其改善程度总体印象结合起来制定的一种疗效评价指标，其通常是有序等级资料。在一些适应症研究领域已经建立了一些总体有效性的全局评价方法，如神经科和精神科临床总体印象标量CGI。全局评价指标一般都有一个主观成分，因此，表现为综合疗效的全局性疗效指标一般不作为或不单独作为药物临床试验中的主要疗效指标。如果使用全局评价指标作为主要疗效指标进行疗效评价，则需要增加医生主观判断外的其他较为客观指标作为共同的主要疗效指标，或至少是重要的次要疗效指标。

5.4定量指标

又称为定量资料、数值数据，如果疗效指标能够以数值来表示变化特征，则该指标就是定量指标。数值的范围如果是由分离的数值组成，该指标则为离散变量。如果该指标可以在区间内取任意值，则该指标为连续变量，如身高、体重、生存时间、血压等均为连续指标。定量指标一般是观测指标，一般需要根据临床试验目的确定合理的评价方法才能作为疗效指标，有时定量指标需要根据临床试验目的转化为分类的定性指标进行有效性评价。如根据患者治疗后的定量指标变化值，确定一个有效和无效的界值，以此确定评价和比较不同组间的有效性情况，但有效性界值的确定需要有科学依据和相关适应症领域的专家共识，而不能随意设定。

5.5定性指标

又称为定性资料、分类数据、分类指标，即指标只能分类而无法测量，对于分类数据，受试者的情况被分配到特定的分类或分组中，并且每一组中研究对象的数量是可以计数的。需要注意的是组内数据是否有次序，如果有，则该数据称为等级数据或有序分类变量，例如，有关疼痛严重程度的数据可以是等级数据。等级数据不一定存在相等组距或组间差异。与定量指标一样，有时定量指标也仅仅是一种观测指标，其有效性的评价方法仍然需要根据临床试验目的确定合理的评价方法才能作为疗效指标。

综上，药物干预是影响疾病临床结局的主要因素之一，药物临床试验有效性评价就是观测药物干预对疾病临床结局的影响结果。疗效指标的设计、观测和评价是药物临床试验的重要内容。同一疗效指标在其反映疾病对患者不同水平影响、在疾病发展转轨中的重要性、在临床试验中的重要性、来源特点、主要结构特点等方面各有不同，并明显影响着其在临床试验选择、实施和评价中的具体要求，需要我们在新药临床试验中清楚地认识和界定。

【分享】药物临床试验中疗效评价指标及常见评价方法

《中国新药杂志》 2016年18期

药物临床试验中疗效评价指标及常见评价方法

相关话题

相关话题