臨薬研・懇話会2024年4月例会報告(NEWS No.584 p02)

臨薬研・懇話会2024年4月例会報告
シリーズ企画「臨床薬理論文を批判的に読む」
第80回 (2024.4.7) 報告
ITT (Intended To Treat)解析とPPS(Per Protocol Subset)解析

今回はRCT(ランダム化比較臨床試験)の解析に当たって用いられる「ITT解析」と「PPS解析」についての理解とディスカッションをテーマとした。

テーマ設定などに際し、薬事日報紙に連載されている青島周一氏(東京・中野病院薬局)のシリーズ寄稿「エビデンスのピットフォール」から示唆をいただいた。主な関係記事は同紙2024年2月28日号に掲載された「ITT解析では不十分なRCTとは」である。

今回取り上げたメインの文献は、N Engl J Med 2022; 387(17): 1547-56.

M.Bretthauer et al. for the NordICC Study Group 「大腸内視鏡検査の大腸がんおよび関連死亡リスクに対する効果」であり、参考文献はNephrology (Carton) 2020; 25(7): 513-517. G. TripepI et al. 「臨床研究における治療意図とプロトコルごとの解析」である。両文献ともパソコンで無料アクセスできる。

NEJM誌論文

背景として「大腸内視鏡検査は、大腸がんを発見するためのスクリーニング検査として広く用いられているが、大腸がんおよびそれに関連する死亡リスクに対する効果は不明である」ことをあげ、「糞便検査やS状結腸鏡検査よりも侵襲性が高く、患者にとって負担が大きく、より多くの臨床リソースを必要とするため、スクリーニング検査の利益、有害性、および費用対効果のバランスが重要である」と記している。

本論文では、大腸がんおよび10年後の関連死亡リスクに対する集団ベースの大腸内視鏡検査スクリーニングの効果を調査した大規模多施設ランダム化試験であるNordic-European Initiative on Colorectal Cancer(NordICC)の結果を報告する。

2009年から2014年にかけて、ポーランド、ノルウェー、スウェーデン、オランダの人口登録から抽出された55~64歳の推定的に健康な男女を対象とした実用的ランダム化試験 ( pragmatic, randomized trial)を実施した。参加者は、スクリーニング大腸内視鏡検査を1回受けるよう招待を受ける群(招待群)と、招待もスクリーニングも受けない群(通常ケア群)に1:2の割合でランダムに割り付けられた。参加者は、試験への参加を希望するか、参加を希望しないかを尋ねられる前にランダム化を受けた。スクリーニングを受けた参加者全員が、書面によるインフォームドコンセントを提供した。主要エンドポイントは大腸がんと関連死のリスク、副次的エンドポイントはあらゆる原因による死亡であった。

ポーランド、ノルウェー、スウェーデンの参加者84,585人について追跡データが得られた。人口登録から抽出された85,179人は、招待群28,395人、通常ケア群56.784人に割り付けられたが、招待群の118人が介入前に死亡し、57人が介入前に大腸がんと診断されITT解析から除外された。また通常ケア群の255人が同様に除外された。このためITT解析の対象は招待群28,220人、通常ケア群56.365人となり、中央値10年のフォローアップのあと解析された。目標検体数の算出に当たっては、招待群と通常ケア群との大腸がん関連死亡率の差は25%、参加率は 50%、スクリーニングの有効性は 50%と仮定した。大腸がん 1 例を予防するために検診を勧めるのに必要な人数は、10 年後の大腸がんリスクに関する群間リスク差の逆数として算出した。

結果は、追跡データが得られた参加者84,585人については、招待群28,220人、うちスクリーニングを受けたのは11,843人(42.0%)、通常ケア群56,365人。ポリープ切除後に大出血を起こした参加者は合計15人であった。大腸内視鏡検査後30日以内に穿孔やスクリーニングに関連した死亡はなかった。中央値10年の追跡期間中に、招待群では259例の大腸がんが診断されたのに対し、通常ケア群では622例であった。intention-to-screen解析では、10年後の大腸がんリスクは招待群で0.98%、通常ケア群で1.20%であり、18%のリスク減少であった(リスク比、0.82;95%信頼区間[CI]、0.70~0.93)。大腸がんによる死亡リスクは、招待群で0.28%、通常ケア群で0.31%であった(リスク比、0.90;95%CI、0.64~1.16)。大腸がん1例を予防するために検診を受けるよう勧めるのに必要な人数は455人(95%CI、270~1429)であった。あらゆる原因による死亡リスクは、招待群で11.03%、通常ケア群で11.04%であった(リスク比、0.99;95%CI、0.96~1.04)。

著者たちは、大腸内視鏡検査、S状結腸内視鏡検査、その他のスクリーニング検査の絶対的な有益性の比較は、有害性と負担だけでなく、個人の価値観や嗜好に基づいて最良の検査を見つけるために、共有意思決定(shared decision making)を用いて患者と話し合うべきであると考察している。

参考文献 Nephrology (Carton) 2020

臨床研究における治療意図とプロトコルごとの解析

臨床疫学では、実験的研究は通常ランダム化比較臨床試験(RCT)の形をとる。RCTのデータ解析は、2つの相補的な戦略、すなわち、intention to treat(ITT)原則とper protocol(PP)解析に従って行うことができる。ITT解析では薬剤を割り当てる効果を評価し、PP解析ではプロトコルで指定された治療を受ける効果を調べる。ITT解析もPP解析も基本的には有効であるが、文脈によって適用範囲や解釈が異なる。

ITT法を補完する方法として、PP解析がある。PP解析を用いることで、研究者は、試験のプロトコルで規定されたように、全追跡期間を通して実際に割り当てられた治療戦略を受けた効果を調査することができる。主な問題は、PPサブ集団では、ITT集団で想定されるように、試験開始時に2つの試験群の患者が既知および未知のリスク因子について依然として同等であることを確認できなく、ランダム化の利点が失われる可能性である。 ITT解析とPP解析は、ある治療法の有用性/有害性について明らかに補完的な情報を提供する。

ITT解析とPP解析の違いは、”薬剤を割り当てる”ことと ”薬剤を使用する”ことの効果を検証するだけでなく、”薬剤を割り当てる”ことと ”薬剤を使用しても大きな副作用がない” ことの効果を評価することにある。

欧州医薬品委員会(CPMP)のガイドラインでは、”非劣性試験では、ITT解析とPP解析の両方が同等の重要性を持ち、その結果は確固とした解釈のために同様の結論を導くべきである”と 正式に述べられている。従って、CONSORT (Consolidated Standards for reporting trials)ガイドラインは、臨床試験において両方の推定値の詳細を提供することを強く推奨している。この文脈において、ITT 解析はランダム化の利点を維持するため、主解析であり続けるべきであり、PP 解析は非劣性試験や同等性試験の補助的感度解析として用いることができる。全体として、ITT解析もPP解析も有効であるが、その範囲と解釈は異なる。

青島周一氏のコメントの要点

医学的介入の有効性を検証するために実施されるRCTでは、一般的にITT解析の結果を重視する。試験からの脱落やプロトコル違反等が発生しても、割り付けは当初の群として被験者を取り扱うITT解析は、ランダム化の保持および介入効果を過大に評価しないという意味において、結果の妥当性に寄与するからである。

NordICC試験において、大腸がん関連の死亡には統計学的有意な差を認めておらず、内視鏡スクリーニングの有益性が明確に示されていない。また、リスクの低下を認めた大腸がんの発生もNNT換算で455人であり、これは454人が無駄に介入を受けたことを意味する。

しかし、この研究において重要な問題は、大腸内視鏡スクリーニングを受けるよう勧められた案内群の被験者のうち、実際に受けたのは42%に過ぎなかったことである。RCTにおいて、介入治療のアドヒアランスが極めて低い場合には、ITT解析とPPS解析の結果が大きく乖離する。この場合、ITT解析の結果のみに基づく結論は早計であり、介入効果の過小評価を疑うべきである。

参加者のディスカッションから

RCTにおいて、介入治療のアドヒアランスが極めて低い場合には、ITT解析とPPS解析の結果が大きく乖離する。ITT解析の結果のみに基づく結論は早計であり、PPS解析の結果を合わせて綿密に考察すべきであるとの青島氏の指摘は妥当である。

ただITT解析では、スクリーニングを受けなかった被験者も招待群として扱うことで分析に含める母数が大きくなり、相対的にアウトカム(大腸がんや関連死亡)の発生頻度が低下し、統計学的な差を検出しにくくなり、介入効果が過小評価されているとの指摘は、逆の方向性も併せて考慮すべきでないだろうか。

青島氏が参考文献として挙げているNephrology誌2020の文献は、「PP解析を用いる場合、”薬剤の使用に成功した症例”のみに注目することになり、処方された介入による重大な副作用のためにプロトコルから逸脱することも起こりうるため、ITT解析とPP解析の違いは、”薬剤を割り当てる”ことと ”薬剤を使用する”ことの効果を検証するだけでなく、”薬剤を割り当てる”ことと ”薬剤を使用しても大きな副作用がない” ことの効果を評価することにある」と記している。

本論文で推定的に健康な男女にいきなり大腸内視鏡スクリーニングを実施しているのは倫理上乱暴であり問題との指摘がされた。

本論文での案内群の被験者のうち、大腸内視鏡スクリーニングを実際に受けたのは42%に過ぎなかった。この論文では、大腸内視鏡スクリーニングの有益性について、明確な結論を示していないものの、この事実は有益性の問題を解決していないことを示唆している。

PPS解析がもたらすバイアスについて、ランダム化を遵守するRCTとreal world dataとの対比と類似性があるとの指摘がされた。

PS解析はITT解析を補完する関係にあり、参考文献に書かれているように、臨床試験での両方の推定値の詳細な提供が望まれる。しかしそれには製薬企業によるデータの情報公開の悪さが重要な問題点でないかとの指摘がされた。

薬剤師・MPH(公衆衛生大学院修士) 寺岡章雄