Tocilizumab in systemic sclerosis: a randomised, double-blind, placebo-controlled, phase 3 trial
Dinesh Khanna, Celia J F Lin, Daniel E Furst, Jonathan Goldin, Grace Kim, Masataka Kuwana, Yannick Allanore, Marco Matucci-Cerinic, Oliver Distler, Yoshihito Shima, Jacob M van Laar, Helen Spotswood, Bridget Wagner, Jeffrey Siegel, Angelika Jahreis, Christopher P Denton, for the focuSSced investigators.
Lancet Respir Med 2020; 8: 963–974.
Introduction
背景
全身性強皮症はまれで重篤な疾患であり、診断された患者の最大60%が全身性強皮症により死亡する。肺合併症、特に間質性肺疾患は主要な死因であり、SSc-ILD患者ではFVC低下が死亡率上昇と関連する。
わかっていること
- IL-6は全身性強皮症患者で上昇しており、皮膚線維化およびSSc-ILDの発症と関連する。
- IL-6受容体阻害薬であるtocilizumabは、初期研究で全身性強皮症患者の皮膚線維化を改善する可能性が示された。
- 先行する第2相RCTであるfaSScinate trialでは主要評価項目である24週時点のmRSS変化は達成されなかった。
- 一方で、皮膚線維芽細胞の解析では、24週間の治療後に活性化線維化フェノタイプの反転が示され、抗線維化効果を支持する機序的所見があった。
- faSScinate tiralの探索的解析では、肺機能低下を来した参加者がtocilizumab群でplacebo群より少なく、profibrotic M2 macrophage-associated genesの発現低下も伴っており、tocilizumabが肺機能を保持する可能性が示唆された。
わかっていないこと
- 先行する第2相試験faSScinateではtocilizumab群で肺機能低下が少なく、肺機能を保持する可能性が示唆されていたが、探索的解析に基づく所見であり、tocilizumabが全身性強皮症において皮膚硬化を改善するか、また肺機能を保持するかについては、第3相試験で検証されていなかった。
今回の研究目的
tocilizumabとplaceboを比較し、48週時点のmRSS変化に対する有効性、肺機能への有効性、また安全性を評価すること。
Method
欧州、北米、ラテンアメリカ、日本を含む20か国多施設(75施設)、ランダム化、二重盲検、プラセボ対照、第3相試験。
研究デザイン
多施設、ランダム化、二重盲検、プラセボ対照、第3相試験。
検査値による盲検解除を防ぐためdual-assessor approachが用いられた。有効性評価者はmRSSや肺機能を評価したが、CRPを含む検査データにはアクセスできなかった。
Inclusion criteria
- 2013 ACR/EULAR criteriaにより分類されたびまん皮膚硬化型全身性強皮症(dcSSc)であること。
- 最初にRaynaud現象以外の症状を呈してから、60か月以内。
- スクリーニング時mRSS 10–35。
- 炎症所見がある(以下の少なくとも一つを満たす)
- CRP ≥6 mg/L
- ESR ≥28 mm/h
- 血小板数 ≥330×10⁹/L。
- 活動性の疾患である(以下の少なくとも一つを満たす)
- 疾患期間18か月以下
- 過去6か月以内のmRSS 3点以上増加
- 過去6か月以内の新規1部位の皮膚病変 + mRSS 2点以上増加
- 過去6か月以内の新規2部位の皮膚病変
- 少なくとも1つのtendon friction rub。
ディップ先生IL-6阻害薬が効果があると考えられる=IL-6が病態に関与していると考えられる患者相を選ぶためのInclusion criteriaになっています。
つまり、炎症所見としてCRP・ESR・血小板の値が採用されています。(血小板はIL-6で増加するため。実臨床でも感染症の後に遅れて上がってくる経験があるかと思います。)
一部第2相研究であるfaSScinate trialとInclusion criteriaは異なっています。具体的には、faSScinateでは、
・mRSS が15–40と悪い
・活動性=(以下のいずれか)過去6か月以内のmRSS増加、新規部位出現、その他の皮膚硬化悪化、tendon friction rub
・CRPのカットオフが ≥10 mg/L
Exclusion criteria
- FVC% predicted ≤55%の肺疾患 または DLCO% predicted ≤45%の肺疾患を有する患者。
- Class 2以上の肺動脈性肺高血圧症、またはその他の中等度以上の肺疾患。
- 穿孔の素因となり得る憩室炎または慢性潰瘍性下部消化管疾患の既往。
- 悪性疾患の証拠、または過去5年以内に診断された悪性腫瘍
- ただし、切除・治癒した局所基底細胞癌、扁平上皮癌、子宮頸部上皮内癌を除く。
介入
Tocilizumab 162 mgを週1回、皮下注射で48週間投与。
48週間の二重盲検期間後、48週間のopen-label tocilizumab treatment periodが設定された。
免疫調整薬は、FVC% predicted低下がある参加者では16週以降、皮膚肥厚悪化または他の重大な全身性強皮症合併症がある参加者では24週以降、試験薬に追加可能であった。
Control
Placeboを週1回、皮下注射で48週間投与。
48週間の二重盲検期間後、open-label tocilizumab treatment periodへ移行する。
主要エンドポイント
- 48週時点のmRSSのベースラインからの変化量の群間差。
副次エンドポイント
- Key secondary endpoints:
- 48週時点のFVC% predictedの、ベースラインからの変化分布の群間差。
- 48週時点のmRSSの改善した患者の割合:20%以上、40%以上、60%以上。
- 治療失敗までの時間
- HAQ-DI
- PaGA(Patient global assessment)
- PhGA(Physician global assessment)
- 以下の一つ以上を満たす場合を治療失敗とする
- 治療開始以降の死亡
- FVC% predicted >10%低下
- mRSS相対増加 >20% + 5点以上増加
- 事前定義・判定された全身性強皮症関連重篤合併症の発生
- 探索的評価項目:
- 観察FVCおよびFVC% predictedの10%以上低下した割合。
- 24週時点のFVC変化。
- 48週時点のDLCO変化。
- 48週時点のDLCO 15%以上低下した割合。
- 48週時点のHRCTにおけるQLF-LM変化。
- ACR-CRISS。
- その他のpatient-reported outcomes。
- Post-hoc解析
- QLF-WL(HRCTで評価)
- QILD-WL(HRCTで評価)
- FVC改善
- FVC% predicted以外での治療失敗
- mRSS以外での治療失敗
- SSc-ILDサブグループ解析
- ILDのある患者のみ解析
- ベースラインHRCTを胸部放射線科医が視覚的に評価し、基底部優位のすりガラス影または線維化、またはその両方がある場合にILDありと判断
- ILDのある患者のみ解析
安全性:
Treatment-emergent adverse eventsをMedDRA system organ classificationで評価し、NCI CTCAE version 4.0でgrade分類。
- QLF-WL =quantitative lung fibrosis – whole lung
- 全肺における、定量的肺線維化スコア
- QLF-LM =quantitative lung fibrosis – most affected lobe
- 最も病変が強い肺葉における定量的肺線維化スコア
- 肺葉のうちで、ベースラインで最もスコアが高い肺葉を選んでQLFを評価するもの
- QILD-WL =quantitative interstitial lung disease – whole lung
- 全肺における定量的ILDスコア
解析方法
- n数
- 各群105例により、15–20%の脱落率を想定し、48週時点のmRSS変化における群間差3.55点を検出するためのpower >75–80%を確保した。
- 両群の標準偏差 8.43、two-group t test、両側有意水準5%を使用。
- CRP盲検化はされたのか?



Primary Endpointは、ベースラインと48週でのmRSSの変化量を比較しますが、この差が3.55以上であることを検出するために充分なn数(脱落者が15−20%程度なら)を確保したということです。
3.55という値は、第2相faSScinate試験の治療効果であり、それを再度証明しようとしたことになります。
powerとは、「本当に治療効果があるときに、それを統計学的に「有意差あり」と検出できる確率」のこと。
両群のmRSSのばらつきは、標準偏差8.43程度と推定。これはどこ由来かは論文中に記載がありませんでした・・・(common SDとのみ記載)これも先行研究なんでしょうか?
- 主要評価項目
- MMRM(mixed model for repeated measures)で解析した。
- 非構造化共分散行列を用いて被験者内誤差をモデル化し、Kenward-Roger approximationでdenominator degrees of freedomを推定。固定カテゴリ効果として治療、visit、IL-6層別化基準、IL-6 level at screening-by-visit interaction、treatment-by-visit interactionを含め、連続共変量としてbaseline mRSS、baseline mRSS-by-visit interactionを含めた。欠測値の補完は行わなかった。施設での層別化は、多数の施設かつ各施設の参加者数が少ないため実施しなかった。



MMRMという概念について簡潔に説明します。
本試験の主要評価項目は48週でのmRSSの平均値の違いです。単純にこの二つの値だけを比較することはできますが、欠測値が多い場合、正確に比較できません。(例えば欠測の理由が重症だった、治療不応だったなどのバイアスがかかりうるため。)
例えば24週まで値があり、48週に欠けている場合を考えてみましょう。例えば24週と同じ値を入れるとか、予想した値を仮に代入する場合もありますが、MMRMは欠測値の補完は行いません。
本試験では複数の週のタイミングでmRSSを測定しているため、そこから48週におけるmRSSの予測が立ちます。その予測モデルを用いて、48週の値を補完する・・・のではなく、48週が欠測している場合には、予想モデルの作成にのみ使用します。
これによって欠測していてもデータが無駄になることはなく、かといって予想として何かの値で代替することもせず、統計的な解析が可能です。
Result
研究対象者
343人をscreeningされ、210人が組み入れられた。(プラセボ106人、TCZ群104人)
うち、188人が試験を完遂した。(プラセボ106人、TCZ群104人)


- ほとんどが白人(85%程度)
- 女性171人(81%)平均年齢48.2歳。
- 平均罹患期間は2年程度
- dcSScのため、抗セントロメア抗体は少ない(9%)、多くが抗トポイソメラーゼ1抗体(50%程度)
- mRSSは平均値20程度(dcSScとしては一般的な数値)
- FVC% predicted中央値:85.9 vs 80.0%
- CRP平均:7.0 vs 8.9 mg/mL、ESR平均:34.7 vs 34.8 mm/h
- CRPは本邦ではmg/dLなので、0.7〜0.8に当たります。
主要評価項目
48週時点のmRSS変化は、tocilizumab群で数値上より大きく低下したが、主要評価項目は達成されなかった。


- 48週時点のmRSS変化:
- placebo群 −4.4、95% CI −6.0 to −2.9。
- tocilizumab群 −6.1、95% CI −7.7 to −4.6。
- 調整LSM差 −1.7、95% CI −3.8 to 0.3、p=0.10
主要解析が5%水準で有意でなかったため、副次、探索的、post-hoc解析のp値はすべてnominal p値とされた。



強皮症のmRSSの常として、プラセボでも-4程度は改善します。
nominal p値とは、「名目上のp値」ということです。
本研究では主要評価項目が有意だった場合に、次の副次評価項目などの統計解析にうつる、という設計でした(階層的検定)
しかし主要評価項目が有意ではなかったために、p値は計算はできますが、統計的に有意かどうかは不明です。
副次評価項目
簡単にまとめます。以下のp値はすべてnominalである点に注意が必要です。
- mRSS改善割合(20%以上、40%以上、60%以上)いずれも、有意差なし。
- FVC% predicted
- 48週時点での変化量、10%以上低下した割合、改善した割合、絶対的変化量は、いずれもTCZでよかった。
- SSc-ILDサブグループの解析
- FVC% predicted の48週時点での変化量、10%以上低下した割合、改善した割合、絶対的変化量は、いずれもTCZでよかった。
A・C・・・すべての患者
B・D・・・ベースラインでILDのあった患者
いずれも同様の結果にある。


- IL-6層別サブグループにおけるFVC
- IL-6 <10 pg/mLでは治療差160 mL、95% CI 60–260。
- IL-6 ≥10 pg/mLでは治療差180 mL、95% CI 10–340。 と差はなかった
- 肺線維化
- QLF-LM・QLF-WL・QILD-WLの中央値・平均値変化はすべてTCZ群でよかった。
- 患者評価項目
- HAQ-DI・PaVAS・PhVAS は差はなかった
- ACR-CRISS・FACIT-Fatigue はTCZ群で低かった


安全性
いつ以上の有害事象のあった数はTCZの方が多かった。ただ感染症は差がなかった。


Discussion
結果の解釈
- 本第3相試験では、早期活動性全身性強皮症に対するtocilizumabの主要評価項目であるmRSSは達成されなかった。
- 一方で、副次評価項目であるFVC結果は、tocilizumab治療を受けた参加者で肺機能が安定化したことを示唆し、この効果は第2相faSScinate試験で観察されたものと類似する。
- HRCTの結果は、画像上明らかな肺線維化におけるtocilizumabの抗線維化効果を支持する
- なぜfaSScinate第2相と異なり、有意差がでなかったのか
- Inclusion criteriaが異なる
- 全身性強皮症という疾患の多様性と、評価項目の強いプラセボ効果(Pracebo effect)があるため。
Limitation
- 主要評価項目が達成されなかったため、FVCを含む副次評価項目の差は、エビデンスの強さにもかかわらず統計学的に有意とはみなせない。
- focuSScedおよびfaSScinateの参加者は早期疾患かつ軽度肺病変であり、他試験との比較が制限される。
- DLCOは各施設の機器で測定されたため、比較可能性と信頼性には限界がある。
臨床への影響
- 主要皮膚線維化endpointは達成されなかったが、FVC% predictedの副次評価項目所見は、tocilizumabが早期SSc-ILDおよび炎症病態を有する患者の肺機能維持に貢献する可能性がある。
- 本試験のよい点
- 早期活動性全身性強皮症において構造的および機能的肺変化を評価した初のplacebo-controlled phase 3 clinical trial。
- 臨床的有意性と統計学的有意性の両方を考慮してpower設計し、統計学的に有意だが治療効果がわずかな結果を避けるように設計された。
- 本試験の悪い点
- 主要評価項目が有意でなかったため、FVCを含む副次評価項目は統計学的に有意とはみなせず、nominal p値として扱われた。
- 全身性強皮症という疾患の多様性と強いplacebo effectにより、mRSSを主要評価項目とするには限界がある可能性がある。
本記事は一般的な医学情報の提供を目的としています。
個々の患者さんの診断・治療方針は、病状、検査結果、併存疾患、使用中の薬剤などによって異なります。
実際の診療判断は、必ず主治医または医療機関にご相談ください。











