药物临床试验不良反应/不良事件关联性判定方法研究探讨

这是本文档旧的修订版！

李博，高蕊，李睿，陆芳，訾明杰，李庆娜，唐旭东

(中国中医科学院西苑医院药物临床试验机构，北京100091)

中国新药杂志2014年第23卷第12期

　　药物不良反应(adverse drug reaction，ADR) 因果关系判定评价是临床试验中药物ADR监测最关键和最困难的问题之一，多年来一直为药物临床试验机构、学术界、制药界及药政部门所关注，国际和国内协调会议等相关会议举行了多次，却至今仍存在争议。鉴于ADR关系判定在临床试验的方案制定及实施过程直接关系到药物的安全性评价和整体疗效评价的平衡，本文梳理了ADR判定关联性的判断标准源流，探讨了当前ADR判断关联性的发展趋势，并对临床试验的安全性评价效果进行探讨，确定当前最佳的判定标准。

　　最初的ADR因果判定为总体判断法，后来发展为标准判断法，即综合分析推理法，也称为树型分析法。目前世界上使用的ADR因果关系评价方法有20多种，其中Karch和Lasagna评定方法被各种评价方法引为基本准则。

　　总体判断（global introspection）是一种用于评价可疑性ADR中药物因素可能性大小的方法。20世纪60至70年代，总体判断法是ADR判断的唯一方法，当时正处于ADR监测的初期阶段。该种方法主要是一种凭临床经验作判断的方法，主观性强。其过程可大致概括为：评估者试图考虑到所有引起ADR的因素，在脑中把这些因素排列起来，根据相对重要性大小进行权衡，最后得出有关药物引起ADR可能性大小的结论。¹⁾

　　标准化评价（standardized assessment）是利用影响药物与ADR之间的因素，设置相应的问题，根据不同答案计以不同分值，再根据所得总分向概率范畴的定量进行估计转换，评出ADR与药物的相关程度，分为“肯定”、“很可能”、“可能”、“可疑”及“无关”5个等级。70 年代中期和80年代后期，该法成为ADR因果评价方法的主流方法，目前仍在继续使用。在此过程中，Karch和Lasagna提出了第1个标准方法，其他的方法还包括：Kramer的Yale评分法，共包含56个问题；Naranjo的APS评分法，共包含10个问题；Venule评分法，共包含23个问题以及Begaud评分法（法国评分法）等多种方法，并有研究对这多种方法进行了比较。

　　该方法将因果关系的关联程度分为“肯定”、“很可能”、“可能”、“条件”、“可疑”5级。我国原卫生部药品ADR监测中心拟定的方法，以及澳大利亚、瑞典、新西兰等国的评定方法，都是在此方法基础上发展而来。具体评价条目请参见表1。

　　表1 Karch和Lasagna评价方法

序号	判定	描述
1	肯定	用药以来的时间顺序是合理的；该反应与已知的药物ADR相符合（有类似文献报道）；停药后反应停止；重新用药，反应再现（又称为激发试验）
2	很可能	时间顺序合理；该反应与已知的药物ADR相符合；停药后反应停止；反应无法用患者疾病来合理的解释，出现的反应不是原发疾病加重、演变的结果
3	可能	时间顺序合理；与已知药物ADR符合；但原患疾病或其他治疗也可造成这样的结果
4	条件	时间顺序合理；与已知药物ADR仅有一定的相符性；又不能合理地以原患疾病来解释
5	可疑	不符合上述各项标准

　　由加拿大流行病学者Sackett等推荐，本法在病例分析时，对时间顺序，是否已有类似反应资料等基本问题都予以打分，最后按所记总分评定因果关系等级。本法按以下问题回答记分，分值总分≥9分：肯定有关；总分5~8分：很可能有关；总分1~4分：可能有关；总分≤0分：可疑的。见表2。

　　表2 APS评分法²⁾

序号	评分项目	是	否	不知道
1	该反应以前是否已有报告	+1	0	0
2	本ADR是否在使用所疑药物后出现	+2	-1	0
3	当所疑药物停用后使用特异的对抗剂之后ADR是否改改善	+1	0	0
4	再次服用所疑药物，ADR是否再出现	+2	-1	0
5	是否有其他原因（药物之外）引起这种反应	-1	+2	0
6	当给安慰剂这种反应是否能再出现	-1	+1	0
7	是否测定过血（或其他体液）的药物浓度是已知的中毒浓度	+1	0	0
8	当增大药物剂量，反应是否加重；当减少药物剂量，反应是否减轻	+1	0	0
9	患者以前用过相同或类似的药物是否也有相似的反应	+1	0	0
10	该ADR是否有客观检查，予以确认	+1	0	0
11	总分

　　本法用于评定发生ADR或AE时由可疑药物引起的概率与由其他因素引起的概率的比较，间接判断事件与可疑药品之间的关联度。Bayes方法的问世引人瞩目，但由于其计算复杂，至今难在常规工作中被接受。

　　WHO国际药物合作中心（WHO Collaboration Center for International Drug Monitoring），简称乌普萨拉监测中心（Uppsala Monitoring Center），成立于己于1968年，1978年搬迁到瑞典的Uppsala市。这是一全球性的药物安全性组织。工作人员20名（2000年4月），主要为医生，药师和计算机程序员。到1999年4月有54个正式成员国和9个副成员国（associate member countries），覆盖世界范围约85%的人口。该中心建议使用的方法是根据“药品”和“AE”的关系程度，运用综合分析方法，将药品和ADR分为“肯定”、“很可能”、“可能”、“不可能”、“未评价”、“无法评价”6个等级。目前我国使用的因果关系评价方法即属于此类，原文描述见表3。

　　表3 WHO 乌普萨拉国际药品ADR监测合作中心的指南³⁾(局令第7号)，该办法同时制订了2005年版的《药品不良反应报告和监测工作手册》⁴⁾。2011年5月4日又颁布了新的《药品不良反应报告和监测管理办法》。2012年国家药品不良反应监测中心再次发布了修订的《药品不良反应报告和监测工作手册》， 2005年9月版及2012年11月版，是目前最重要的参考依据。
===== 3、我国《药品不良反应报告和监测工作手册》中的ADR因果判定方法及讨论 ===== 　　2005年版的《药品ADR报告和监测工作手册》，关联性评价共分为6个级别，见表4。关联性评价是在参考文献和分析报表相关资料的前提下，依据上述内容做出的综合性评价。ADR的表述过于简单、怀疑引起ADR药品及其他信息资料欠缺者，都将直接影响关联性评价的结果。　　表4 2005 年版《药品不良反应报告和监测管理办法》中的因果判定关联性评价序 ^序号^判定^描述^ |1|肯定|用药及反应发生时间顺序合理；停药以后反应停止，或迅速减轻或好转（根据机体免疫状态某些ADR反应可出现在停药数天以后）；再次使用，反应再现，并可能明显加重（即激发试验阳性）；同时有文献资料佐证；并已排除原患疾病等其他混杂因素影响。| |2|很可能|无重复用药史，余同“肯定”，或虽然有合并用药，但基本可排除合并用药导致反应发生的可能性。| |3|可能|用药与反应发生时间关系密切，同时有文献资料佐证；但引发ADR的药品不止一种，或原患疾病病情进展因素不能除外。| |4|可能无关|ADR与用药时间相关性不密切，反应表现与已知该药ADR不相吻合，原患疾病发展同样可能有类似的临床表现。| |5|待评价|报表内容填写不齐全，等待补充后再评价，或因果关系难以定论，缺乏文献资料佐证。| |6|无法评价|报表缺项太多，因果关系难以定论，资料又无法补充。| 　　具体操作需要依据ADR/AE分析的5条原则《方法》中的《药品不良反应/事件报告表》中，可操对可疑事件进行分析。这5条原则在2005年版的操作性较强，见表5。　　表5 国家不良反应监测中心2005版《药品ADR/事件报告表》中ADR/事件原则分析项 ^序号^分析项目^结果判定^ |1|用药与ADR/事件的出现有无合理的时间关系？|有 □ 无 □| |2|反应是否符合该药已知的ADR类型？|是 □ 否 □ 不明 □| |3|停药或减量后，反应/事件是否消失或减轻？|是 □ 否 □ 不明 □ 未停药或未减量 □| |4|再次使用可疑药品后是否再次出现同样反应/事件？|是 □ 否 □ 不明 □ 未再使用 □| |5|反应/事件是否可用并用药的作用、患者病情的进展、其他治疗的影响来解释？|是 □ 否 □ 不明 □| 　　依据不良反应/事件分析的5条原则将关联性“待评价”、“无法评价”6级，见表6。评价分为“肯定”、“很可能”、“可能”、“可能无关”、 “待评价”、“无法评价”。　　表6 国家不良反应监测中心2005 版因果关系判定关联性评价表格 ^ 因果关系 ^ 原则分析项编号 ^^^^^ ^ ::: ^ 1 ^ 2 ^ 3 ^ 4 ^ 5 ^ | 肯定 | + | + | + | + | - | | 很可能 | + | + | + | ？ | - | | 可能 | + | ± | ±？ | ？ | ±？ | | 可能无关 | - | - | ±？ | ？ | ±？ | | 待评价 | 需要补充材料才能评价 ||||| | 无法评价 | 评价的必须资料无法获得 |||||
　　2012年新修订的《方法》对关联性评价的方法进行了修改。对关联性评价的描述，做出了更详尽的说明和要求。可对比参看两版的《方法》相关内容。在2012版的《药品不良反应/事件报告表》中，取消了不良反应/事件分析，而是将原来的5条，减少到了2条，见表7。而判定的操作表格同2005年版的《方法》和表6一致。　　表7 2012 年版《药品不良反应/事件报告表》直接用于判定ADR关联性的条目 ^序号^条目^情况^ |1|停药或减量后，反应/事件是否消失或减轻？|是 □ 否 □ 不明 □ 未停药或未减量 □| |2|再次使用可疑药品后是否再次出现同样反应/事件？|是 □ 否 □ 不明 □ 未再使用 □|
====== 4、结语 ====== 　　本文通过分析了国外的ADR/AE因果判定标准的相关文献⁵⁾⁶⁾⁷⁾⁸⁾⁹⁾¹⁰⁾¹¹⁾¹²⁾¹³⁾¹⁴⁾¹⁵⁾¹⁶⁾¹⁷⁾¹⁸⁾¹⁹⁾，并结合笔者的临床试验管理的经验和体会，对于相关内容总结并建议如下： - ADR因果判定最早的方法是总体判断法，其凭经验，主观性强，已经被淘汰；其中最早使用的标准判断法是Karch和Lasagna评价方法，对今后的条目判断产生了深远影响，C.A.Naranjo的APS评分法属于积分判断法，可操作性较强，是标准判断法的另1个分支。 - 当前最权威的ADR因果判断国际标准是WHO乌普萨拉监测中心的6级标准，我国使用当前最佳的ADR因果判定是2012年版的《药品不良反应报告和监测管理办法》，2012年版的《方法》比2005年在评定标准描述方面多了实例说明，而对于ADR/AE分析项目，进行了调整。 - 目前还没有针对I期健康志愿者的ADR关联性判断标准。从多年的临床试验来看，目前临床试验多使用5级和6级判定，这里面的关键是在上市前要求ADR必须有一个结论，而不能是“无法判定”。在实际临床试验中，本着保护受试者的原则，许多判断的条目是无法执行的，很多ADR的判断需要一个长期的过程以及综合的推敲。基于真实性是临床试验的本源核心，我们理应允许“无法判定”局面的出现。上市后的ADR判定相对比较成熟，应该在探讨之后，尽快形成整个临床试验ADR判定的标准。　　在临床试验中，每一个AE的因果判定都是总体评估的重要依据，需要客观准确的判断。一种客观、操作性强的工具，是准确判断的依据。从多个临床试验管理工作经验来看，笔者提出几点展望： - 根据当前最新的评价标准，进行深入研究总结和交流讨论。希望国内相关研究部门能够组织这样的专门讨论，将ADR关联性的判断进行标准发布，不仅在上市后进行检测，在上市前也进行判断标准的颁布。可以确定总的原则，同时稍有不同。这样不仅以利于ADR关联性判断的更规范化，也有利于临床试验及药物警戒的发展。 - 对于2012年版《药品ADR/事件报告表》减少ADR事件分析项，笔者认为并不合理，从实际操作来看，这5条分析原则是非常重要的依据，减少分析项可能不利于因果关系的判断，建议给予补充。 - 条目的判定可能不及积分判定更准确客观，期望能在今后的因果关系判定研究中，结合法国的APS评分法进行更规范化，开发研究可操作性更强的ADR因果判定综合方法。可以在颁布之前确定ADR判断的方法，或者进行判定方法的研究，用不同的判定方法及计算敏感性及一致性，确定基本标准的判断方法。 - 根据I~IV期的临床试验特征，特别是对I期的AE反应的判断有异于其他各期，应该在今后的研究中给予关注和考虑。在确定总的原则的基础上，对各期进行具体化的说明。 - ADR判定不是一个一蹴而就的事情，有的甚至需要观察多年，从实际临床试验的角度出发，可以更严谨的制定判定标准，可以把上市前和上市后有机的结合起来，形成安全性评价的药物警戒监测体系，准确评价药物的安全性。

¹⁾ , ²⁾

SACKETT DL. Clinical Epidemilogy [M]. 2nd. Boston: Little, Brown and Company, 1991:297-299.

³⁾

The Uppsala Monitoring Centre (the UMC). Safety monitoring of medicinal products: guidelines for setting up and running a pharmacovigilance center [EB/OL]. [2013-11-15]. http: apps.who.int/medicinedocs/en/d/Jh2934e/15.html.)) ^序号^评定^说明^ |1|Certain|a clinical event, including laboratory test abnormality, occurring in a plausible time relationship to drug administration, and which cannot be explained by concurrent disease or other drugs or chemicals. The response to withdrawal of the drug (dechallenge) should be clinically plausible. The event must be definitive pharmacologically or phenomenologically, using a satisfactory rechallenge procedure if necessary.| |2|Probable/Likely|a clinical event, including laboratory test abnormality, with a reasonable time sequence to administration of the drug, unlikely to be attributed to concurrent disease or other drugs or chemicals, and which follows a clinically reasonable response on withdrawal (dechallenge). Rechallenge information is not required to fulfil this definition.| |3|Possible|a clinical event, including laboratory test abnormality, with a reasonable time sequence to administrations of the drug, but which could also be explained by concurrent disease or other drugs or chemicals. Information on drug withdrawal may be lacking or unclear.| |4|Unlikely|a clinical event, including laboratory test abnormality, with a temporal relationship to drug administration which makes a causal relationship improbable, and in which other drugs, chemicals or underlying disease provide plausible explanations.| |5|Conditional/Unclassified|a clinical event, including laboratory test abnormality, reported as an adverse reaction, about which more data is essential for a proper assessment, or the additional data is under examination.| |6|Unassessable/Unclassifiable|a report suggesting an adverse reaction which cannot be judged because information is insufficient or contradictory, and which cannot be supplemented or verified.|
===== 2、我国的ADR因果判定历史沿革 ===== 　　2004年前，国内的临床试验均要求研究者评价任何不良事件(adverse event，AE)与试验药物的因果关系。常用4个概念描述AE与治疗的关系，即“肯定有关”，“很可能有关”，“可能有关”和“不可能有关”。我国曾采用5级评定标准。即在“可能有关”与“不可能有关”之间再加一层“可疑有关”。我国原卫生部ADR中心推荐的评分法中心推荐的评分法(1994年版)为5级评价标准，进行判定。　　1994年以后，参考WHO乌普萨拉监测中心的6级标准，我国逐渐采用6级评定方法，并于2004年发布《药品不良反应报告和监测管理办法》((7

⁴⁾
8

⁵⁾
9

⁶⁾
10

⁷⁾
11

⁸⁾
12

⁹⁾
13

¹⁰⁾
14

¹¹⁾
15

¹²⁾
16

¹³⁾
17

¹⁴⁾
18

¹⁵⁾
19

¹⁶⁾
20

¹⁷⁾
21

¹⁸⁾
22

¹⁹⁾
23

药物临床试验不良反应/不良事件关联性判定方法研究探讨

1、ADR因果判定关联性的源流及判定标准类型

1.1 总体判断法及标准判断法

1.2 Karch和Lasagna评价方法

1.3 计分推算法（即法国Naranjo的APS评分法归因系统）

1.4 贝叶斯ADR诊断法（Bayesian adverse reaction diagnostic instrument，简称Bayes）

1.5 WHO国际药品ADR监测合作中心建议使用的方法