现在已有三种三代EGFR-TKI药物在海内获批用于EGFR敏感突变晚期非小细胞肺癌(non-small cell lung cancer,,,NSCLC)患者的一线治疗,,,划分为奥希替尼、阿美替尼和伏美替尼,,,其对应的注册研究划分为FLAURA(奥希替尼)、AENEAS(阿美替尼)和FURLONG(伏美替尼)。。。
三项研究均为多中心、随机、双盲、III期临床研究[1-3],,,主要入组标准均为ECOG PS评分0/1、EGFR Ex19del/L858R突变的局部晚期或转移性NSCLC患者,,,同时均允许无症状的脑转移患者入组。。。作为国际多中心研究,,,FLAURA将EGFR突变状态(19del/L858R)和种族(亚裔/非亚裔)作为分层因素,,,针对中国人群的AENEAS和FURLONG则选择了EGFR突变状态(19del/L858R)和基线脑转移(有/无)作为分层因素。。。研究终点方面,,,FLAURA和AENEAS选择了研究者评估的无希望生涯期(progression-free survival,,,PFS)作为主要研究终点,,,FURLONG则选择了自力评审委员会(independent review committee,,,IRC)评估的PFS作为主要研究终点。。。
现在三项研究效果全文均已揭晓,,,FLAURA率先宣布脑转移疗效[4],,,AENEAS和FURLONG也在2022年美国临床肿瘤学会(ASCO)年会上宣布了脑转移患者的自力疗效剖析效果[5-6]。。;;;;厥兹钛芯可杓,,,连系已宣布的研究数据,,,仍有几个问题值得各人思索:1.已宣布的效果能否作为脑转移亚组的定论??????2.研究者评估与IRC评估孰优孰劣??????3.针对主要研究终点(PFS)的期中剖析是否须要??????4.为什么要允许crossover,,,对效果有何影响??????5.关于在希望之前接受新的抗肿瘤治疗(new anti-cancer therapy,,,NACT)的患者,,,删失规则该怎样界说??????本文特邀复旦大学隶属中山医院梁斐教授就这5个问题做出起源的解读,,,供列位读者参考和讨论。。。
1.已宣布的脑转移亚组效果能否作为定论??????
国家药品监视治理局药品审评中心(center for drug evaluation, CDE)将亚组剖析分为3 种类型,,,包括:确证性亚组剖析、支持性亚组剖析和探索性亚组剖析(图1)[7],,,事先界说、多重性调解、磨练效能是区别亚组剖析类型的3个要害统计学特征[8-9]。。。为知足确证性要求,,,需在研究中预设亚组分层随机并同时针对意向性治疗(intent to treat,,,ITT)原则和特定亚组盘算样本量,,,以包管该亚组具有足够的统计学磨练效能,,,且需接纳合适的战略控制总一类过失α。。;;;;厥兹钛芯可杓,,,FLAURA接纳序贯多重磨练,,,统计剖析顺序为PFS-总生涯期(Overall Survival,,,OS)-亚组PFS,,,很好地控制了总体I类过失,,,但其脑转移亚组PFS的效果是在OS剖析效果之前宣布的[1];;;;AENEAS、FURLONG 则划分举行磨练。。。但三项研究均未针对脑转移亚组盘算样本量,,,缺乏足够的磨练效能对脑转移亚组做出确证性结论,,,因此仅能作为支持性亚组剖析。。。
图1. 亚组剖析类型及较量
关于亚组剖析效果的可靠性,,,四川大学孙鑫教授团队提出了9个标准以供参考(图2)[10]。。。AENEAS和FURLONG将脑转移作为预设分层因素,,,AENEAS中脑转移患者在阿美替尼和比照组的漫衍尤为一致(26.2% vs 27.4%),,,但在亚组效果的可重复性上,,,阿美替尼和伏美替尼均尚无其他随机比照III期临床研究效果揭晓,,,尚有待进一步验证。。。FLAURA则有AURA3研究[11]可供参考,,,两者在脑转移亚组中剖析效果坚持一致,,,虽然两项研究仍保存一定差别,,,一个是一线研究,,,一个是二线研究,,,一定水平上仍有助于提高奥希替尼亚组剖析效果的可信度,,,但FLAURA并未将脑转移作为预设分层因素,,,导致FLAURA中奥希替尼和比照组的脑转移患者基线平衡不如AENEAS(19% vs 23%),,,同时基线伴脑转患者占比也低于 AENEAS和 FURLONG。。。

图2. 判断亚组剖析效果可靠性的参考标准
综上所述,,,三项研究的脑转移亚组研究效果均能起源体现各自试验组药物的颅内疗效,,,可供临床用药时参考,,,但亚组数据的太过解读并不可取,,,确证性效果仍需通过针对脑转移人群睁开的前瞻性随机比照研究来验证,,,现在,,,高剂量阿美替尼比照奥希替尼治疗EGFR突变的晚期NSCLC伴脑转移患者的头对头研究已在举行之中(注册号:NCT04870190)[12]。。。
2.研究者评估与IRC评估孰优孰劣??????
在靶向药物的随机比照注册研究中,,,使用研究者或IRC评估的PFS作为主要研究终点均是国际上常见且可被羁系部分接受的评估要领[13]。。。
IRC评估通常由自力于各研究中心及试验提倡机构的条约研究组织(contract research organization, CRO)来组织肩负,,,多接纳盲态自力中心评估(blinded independent central review,,,BICR)的形式,,,可以镌汰因研究者可能对试验组受试者爆发倾向获益的预期带来的潜在偏倚或倾向性,,,一定水平上提高影像评估的自力性和可信度。。。但IRC评估关于“自力”的严酷要求也导致了一系列的难题与缺乏,,,其流程与CRO密不可分,,,重大的数据量和繁杂的传输、阅片、核查等流程也导致评估的重大化,,,例如患者非靶病灶泛起希望时,,,由于临床资料受限、流程耗时,,,IRC往往并不可实时判断评估,,,此时纯粹依赖IRC评估效果决议患者是否继续接受治疗的设计是有待商讨的。。。
相较之下,,,研究者评估虽然可能会增添偏倚的可能性,,,但越发高效,,,研究者也会更相识患者的真真相形,,,能凭证患者的状态来评估影像学资料的可靠性,,,更有利于做出合理的、切合患者利益的评估,,,这种优势在肿瘤免疫治疗泛起假性希望时尤为突出(图3),,,此时IRC因不可周全相识患者的临床情形,,,可能难以对患者的治疗效果举行充分评估。。。

图3. 77岁男性,,,晚期玄色素瘤患者,,,接受lpilimumab治疗:(a)基线期CT提醒病灶19mm,,,(b)治疗12周后,,,CT提醒病灶达29mm,,,与基线相比增大53%,,,(c)治疗24周后,,,CT提醒病灶缩小至12mm,,,思量假性希望可能。。。
至于研究者评估和IRC评估孰优孰劣,,,有Meta剖析发明,,,研究者评估和IRC评估关于PFS效果的评估具有高度一致性,,,相关系数可达0.947(图4)[14]。。。因此可在选择一方评估效果作为主要终点的同时将另一方作为次要或者举行敏感性剖析,,,两者相互比照、配合组成研究的双包管,,,并在较量研究者评估与IRC评估效果时可关注危害比(Hazard Ratio,,,HR)和P值。。。CDE在《抗肿瘤药临床试验影像评估程序标准手艺指导原则(2021年)》中提到,,,不过度强调IRC与研究者在最终评估效果的一致性,,,但需监控两者评估效果之间差别的稳固性[15]。。。在《抗肿瘤药物临床试验统计学设计指导原则(试行)》中也指出“研究者和BICR对疾病希望评估的差别性是PFS剖析中的主要问题,,,对PFS剖析时,,,应通例对此差别性举行剖析,,,并评价其在组间是否平衡”[16]。。。

图4. 研究者评估和IRC评估关于PFS效果的一致性剖析
凭证CDE的《抗肿瘤药临床试验影像评估程序标准手艺指导原则(2021年)》,,,单臂设计的拟支持注册研究目今须接纳BICR评估,,,而在双盲随机比照的大型III期设计的临床试验中,,,BICR评估并非必需[15]。。。FLAURA和AENEAS均切合上述非必需要求,,,在双盲设计下能很好地控制偏倚,,,将研究者评估的PFS作为主要终点的同时也将IRC评估的PFS纳入次要终点,,,并对基于IRC评估的效果举行了敏感性剖析:在FLAURA和AENEAS中,,,研究者评估和IRC评估的效果具有很好的一致性,,,且研究者的中位PFS略好于IRC评估,,,FURLONG则相反。。。
表1. 三代EGFR-TKI注册研究中研究者评估和IRC评估的PFS

注:以上效果粗体体现主要终点的剖析效果
3.针对主要研究终点(PFS)的期中剖析是否须要??????
关于是否接纳针对PFS的期中剖析,,,三项研究划分接纳了差别的设计。。。AENEAS并没有设立针对PFS的期中剖析妄想;;;;FURLONG则在视察到117例PFS事务时由自力数据监察委员会(independent data monitoring committee, iDMC)举行了期中剖析;;;;而FLAURA在最初的计划中虽然设计了针对PFS的期中剖析妄想,,,但最终在FDA的建议下删除,,,由于“这种剖析并不可为支持研究注册提供临床获益的实质性证据”(图5)。。。
图5. FLAURA研究计划中对PFS期中剖析移除的说明
在GCP规范中,,,期中剖析被界说为正式完成临床试验前,,,按事先制订的剖析妄想,,,较量处置惩罚组间的有用性或清静性所作的任何剖析[17]。。。那么为什么要举行期中剖析呢??????一是为了尽早获得研究效果,,,若是清静性效果有问题,,,可实时终止、若是有用性效果抵达预设终点,,,也可提前因有用而终止,,,因此在支持注册的大型III期临床试验中,,,接纳期中剖析的试验设计不在少数,,,若是羁系机构认可这种设计,,,期中剖析的数据即可支持注册申请,,,从而赢得名贵的上市时间,,,然而FLAURA最初的期中剖析设计最终未能为FDA所认可;;;;二是可用于重估样本量,,,由于试验设计时先验信息有限,,,对试验药物的有用性或清静性预计不尽准确,,,导致样本量的预计也不敷准确,,,期中剖析时可以重新预计样本量,,,盘算条件概率或展望概率,,,确保试验有足够的掌握度,,,FURLONG在设计阶段预计192例PFS事务可磨练出组间差别,,,除妄想在视察到119例PFS事务时举行期中剖析外,,,也特殊在视察到64例PFS事务(192例的三分之一)时对样本量重新举行了评估,,,将假设HR由0.647调解为0.688,,,所需PFS事务也增添至238例。。。
虽然优异的期中剖析可以为临床试验带来种种利益,,,但期中剖析并不是越多越好,,,现实上,,,每举行一次期中剖析,,,即每举行一次假设磨练,,,会使假阳性(false positive)或I类过失率增添,,,若是每一次期中剖析均接纳α=0.05的磨练水准,,,那么最后的总体α水平也将随着磨练次数而升高,,,即总I类过失膨胀。。。如图6所示,,,假设每次磨练是自力的,,,5次剖析之后,,,总I类过失就会凌驾20%,,,这是羁系机构无法接受的。。。因此为了使总I类过失控制在磨练水准α(如0.05),,,则必需校正每一次期中剖析的磨练水准,,,常用的磨练水准确定要领有Pocock法、O' Brien-Fleming法、Peto法及Lan-Demets消耗函数法等。。。三项研究中唯一对PFS举行期中剖析的FURLONG选择了Lan-Demets法,,,值得一提的是,,,虽然FURLONG较FLAURA和AENEAS举行了更多次的PFS剖析,,,但其统计效能选择了80%,,,低于其余两个研究的90%,,,也导致FURLONG的样本量相对较小。。。
4.为什么要允许crossover,,,对效果有何影响??????
FLAURA和AENEAS均在计划中明确划定,,,允许比照组切合条件的患者在疾病希望之后交织接受开放的奥希替尼/阿美替尼治疗。。。FURLONG在计划中无crossover的相关形貌,,,但在全文中提到“数据阻止时,,,有43%的吉非替尼组患者和12%的伏美替尼组患者接受了后续的三代EGFR-TKI治疗”[3]。。。
那么为什么要有crossover的设计呢??????着实在FLAURA启动初期,,,是不允许crossover的,,,但随着AURA系列研究的一直乐成,,,奥希替尼已经成为T790M突变患者的标准二线治疗计划,,,此时再榨取crossover显然有悖于伦理,,,同时也会增添入组的难度,,,因此在2015年4月13日,,,FLAURA修改研究计划并允许比照组切合条件的患者举行crossover(图7)。。。

图7. FLAURA研究计划中对允许crossover的说明
AENEAS研究事先思量到研究举行途中阿美替尼二线治疗获批的可能性,,,在研究设计初期就允许crossover。。。但允许crossover可能会导致一线获益被二线疗效所稀释,,,从而使OS没有差别或差别未能抵达统计学意义,,,因此有须要接纳合适的统计学处置惩罚要领模拟消除crossover影响后的药物真实疗效,,,如删失法(将转组后的随访时间当做删失处置惩罚,,,偏不守旧)、秩坚持结构失效模子(RPSFT,,,对转组后生涯时间举行校正)、逆概率删失加权法(IPCW,,,对未转组概率举行加权),,,FLAURA在允许crossover的同时也在对OS的统计剖析部分举行了预设,,,若是OS最终剖析没有抵达统计学差别,,,将接纳这些举行处置惩罚校正。。。
关于AENEAS,,,凭证已宣布数据,,,吉非替尼组有41例(19.1%)患者接受了至少一次阿美替尼交织治疗,,,鉴于OS尚未成熟,,,详细的crossover剖析将在后续的揭晓中举行报道。。。
5.关于希望前接受新抗肿瘤治疗(NACT)的患者,,,删失规则该怎样界说??????
在AENEAS和FURLONG中,,,关于希望前接受NACT的患者,,,在主要剖析中均将PFS删失到最先NACT前的末次影像学检查日期(图8)。。。
图8. AENEAS对希望前接受NACT的患者删失规则的界说
FLAURA中则将PFS界说为随机化最先至肿瘤客观希望或殒命之间的时间,,,无论患者是否阻止治疗或在希望前接受NACT,,,即忽视NACT并继续使用NACT后的影像学数据(图9)
图9. FLAURA对PFS的界说
凭证ICH E9(R1)[18],,,患者希望前接受NACT属于伴发事务的一种,,,可使用疗法战略或设想战略来解决:疗法战略下伴发事务的爆发与界说治疗效应无关,,,即无论是否爆发伴发事务,,,均会使用相关变量的值,,,FLAURA继续使用NACT后的影像学数据,,,即为疗法战略;;;;设想战略则设想一种没有爆发伴发事务的情景,,,体现临床问题的变量值是在所假设的情景下接纳的变量值,,,AENEAS和FURLONG中将NACT后的影像学数据作删失处置惩罚,,,即为设想战略。。。
通常来说,,,使用NACT后的影像学数据(疗法战略)会比仅使用NACT前(设想战略)的更为守旧,,,由于此时相对优势缩小。。。关于AENEAS,,,因出于伦理缘故原由允许crossover,,,需思量未提供特殊药物情形下的治疗效应,,,此时接纳设想战略可能更为羁系决议所接受。。。虽然,,,无论接纳哪种作为主要删失规则,,,依然可将另一者作为次要删失规则网络数据举行敏感性剖析,,,探讨差别删失规则下的疗效差别。。。
总结
1.奥希替尼、阿美替尼、伏美替尼在各自的一线注册研究中均在控制NSCLC患者脑转移病灶方面均显示出较好的疗效,,,但无需太过解读支持性亚组效果,,,改变临床实践或支持药物说明书撰写仍应经由针对脑转移人群简直证性亚组剖析或前瞻性、随机、比照确证性研究来验证。。。
2.研究者评估与IRC评估各有千秋,,,可同时纳入研究终点,,,配合组成研究的双包管,,,并应重点关注两者评估效果的一致性和稳健性。。。
3.期中剖析可以为后续试验是否能继续执行提供决议依据,,,其效果可能会对后续试验爆发影响,,,因此,,,应严酷控制期中剖析的次数,,,并选择合适的调解磨练水准α的要领。。。
4.三代EGFR-TKI一线注册研究允许crossover是出于伦理的思量,,,可接纳合适的统计学处置惩罚要领模拟消除crossover影响后的药物真实疗效。。。
5.关于希望前接受NACT的患者,,,可凭证差别的删失规则要求网络数据举行敏感性剖析,,,探讨差别规则下的疗效差别。。。