R言語 CRAN Task View：因果推論 | トライフィールズ

CRAN Task View: Causal Inferenceについて、機械翻訳を交えて日本語化し掲載しております。

1 概要
2 ランダム化比較試験（RCT）およびその他の実験データの手法
3 平均治療効果推定値およびその他の一変量治療効果推定値
4 異質な治療効果の推定
5 方策学習とダイナミックな治療体制
6 構造方程式モデル（SEM）、ドゥ・カルチュラル因果発見
7 特定の種類のデータ
8 特定の応用分野

概要

Maintainer:	Imke Mayer, Pan Zhao, Noah Greifer, Nick Huntington-Klein, Julie Josse
Contact:	imke.mayer at inria.fr
Version:	2023-08-04
URL:	https://CRAN.R-project.org/view=CausalInference
Source:	https://github.com/cran-task-views/CausalInference/
Contributions:	このタスクビューに対する提案や改良は、GitHubのissueやpull request、またはメンテナのアドレスに電子メールで送ってください。詳しくはContributing guideをご覧ください。
Installation:	このタスクビューのパッケージは、ctvパッケージを使用して自動的にインストールすることができます。例えば、ctv::install.views(“CausalInference”, coreOnly = TRUE)は全てのコアパッケージをインストールし、ctv::update.views(“CausalInference”)はまだインストールしていない全てのパッケージと最新のものをインストールします。詳しくはCRAN Task View Initiativeを参照してください。

因果推論は、統計分析のサブフィールドと見なすことができます。これは、計量経済学、疫学、教育科学などのさまざまな分野で使用されます。因果推論を使用すると、特定のサンプルまたは母集団に対する治療、介入、政策の効果に関する疑問に対処できます。特定の識別可能性とモデルの仮定の下では、後で説明するように、単純な回帰モデルを当てはめたり、特定の方法で複数の回帰モデルを組み合わせたりすることによって、因果推論を実行できます。観察データの場合、因果関係を（ノンパラメトリックに）特定するには、追加のテスト不可能な仮定を作成する必要があります。

標準の因果推論設計を直接実装する基本的なR関数はありませんが、多かれ少なかれ複雑な多くのメソッドがCRAN上のさまざまなパッケージに実装されており、これらを主なトピックに構造化しています。

特定の因果推論手法は、計量経済学や臨床試験などの特定の分野で生まれ、依然としてその分野で最も人気があります。したがって、場合によっては、これらのメソッドをより詳しくカバーする他のタスクビューを参照します。より一般的には、このタスクビューでは、観察データを使用した因果関係の分析に焦点を当てます。

このリストに重要なパッケージが含まれていないと思われる場合は、メンテナに連絡してください。

ランダム化比較試験（RCT）およびその他の実験データの手法

実験計画の構築は、次で提供されています。
- blocksdesign：一般要因処理計画用のブロック
- BCHM：複数のサブグループ・バスケット試行用のベイズ・クラスター階層モデル設計
- Boptbd：線形混合効果モデルに基づくベイズ最適ブロック設計
- seqDesign：イベント発生までの時間のエンドポイントを備えたランダム化された 2 段階の治療効果試験の逐次デザイン
- 実験や臨床試験を設計するためのツールやパッケージは他にも多数あります。ExperimentalDesignおよびClinicalTrials CRAN タスクビューを参照してください。
ペアごとの比較に基づくテストはBuyseTestで提供されます。
因果推定値が回帰モデルの係数として定義される回帰モデルは、allestimatesに実装されています。
RCTの分析方法は、次で提供されています。
- experiment：さまざまな統計手法
- eefAnalytics：頻度主義およびベイジアンのマルチレベルモデル
- ipcwswitch：RCT の治療切り替えに適応したIPW
- idem：死亡および行方不明あり
事後分析ツールは cjoint（調査実験のためのコンジョイント分析）に実装されています。
2段階の選好試験の設計と分析はpreferenceで実装されます。
コンプライアンス違反の場合、rpsftmはg推定を使用して、加速故障時間モデルと未測定の交絡因子がないという仮定の下、不遵守が存在し測定される二群ランダム化対照試験における治療の因果効果を推定します。
波及効果の下でのRCTの時系列因果推論モデルは、SPORTSCausalに実装されています。
ThreeArmedTrialsは、実薬対照およびプラセボ対照を使用した臨床非劣性または優位性試験の設計と分析が実施されます。

平均治療効果推定値およびその他の一変量治療効果推定値

因果推定値が回帰パラメーターである回帰モデル：
- stats の lm() および glm() に実装されるだけでなく、次で利用できます。
  - fixest、estimatr、CausalGAM：一般化された加算モデルを使用
  - sampleSelection：2つのHeckman 型サンプル選択モデルのステップおよび最尤推定
  - BCEE：バイナリまたは連続治療および結果に対するベイズ因果効果推定
  - borrowr：複数の交換可能なデータソースに対するベイズPATE推定
  - causaldrf：平均因果線量応答関数
  - hdm：一様に有効な信頼区間を持つ効率的な推定器。高次元設定ではほぼ疎なモデルを想定しています
- 固定効果設計の推定は、次で利用できます。
  - fixest：線形および一般化線形固定効果モデル、操作変数と組み合わせたもの
  - plm：パネルデータ用
  - alpaca：高次元k-way固定効果用
- G計算およびその他の条件付き結果回帰ベースの手法：
  - gfoRmula：時間変動治療および交絡用
  - EffectLiteR：構造方程式モデリングに基づく
  - endoSwitch：内因性スイッチング回帰モデルの最尤推定
  - riskRegression：競合リスクの有無にかかわらず、生存結果について
  - パラメトリックモデルの場合、G計算は平均限界効果を推定することと同じであり、これはmargins、marginaleffects、modelbasedおよびstdRegを使用して達成できます。
- マッチングメソッドは、MatchItに実装されています。MatchItは、傾向スコアマッチングとサブ分類、（粗い）完全マッチング、完全マッチング、カーディナリティマッチングなどの多くの一般的なメソッドのラッパーを提供します。より特殊なマッチングメソッドは以下のパッケージの一部に実装されており、その一部は MatchIt に依存しています。
  - MatchThemは、乗算代入データを含む MatchIt のラッパーを提供します。
  - Matchingは、最近傍マッチングと遺伝的マッチングが実行され、Abadie および Imbens スタイルのマッチング代入推定器が実装されます。
  - optmatchは、ネットワークフローを使用して最適なマッチングを実行します。
  - 他のいくつかのパッケージは、同じインフラストラクチャに依存しています。
    - DiPs：方向性ペナルティを備えたほぼ最適なマッチング
    - matchMulti：クラスター化されたデータの最適なマッチング
    - rcbalanceおよびrcbsubset：洗練されたバランスのための最適なマッチング
    - approxmatch：複数カテゴリの処理に対する最適に近いマッチング
    - match2C：2つの基準を使用した最適なマッチング
  - その他のパッケージ：
    - cem：粗い正確なマッチング
    - designmatch：混合整数計画法を使用した最適化ベースのマッチング
    - stratamatch：大規模なデータセットでのマッチングと階層化
    - FLAME：学習された重み付きハミング距離によるほぼ正確なマッチング
    - PanelMatch」時系列断面データとのマッチング
    - CausalGPS：継続的治療に対する一般化傾向スコアマッチング
  - 逆傾向重み付け（IPW、治療重み付けの逆確率、IPTWとも呼ばれる）メソッドは、WeightItに実装されています。これは、バイナリ、マルチカテゴリ、連続的、縦断的治療のためのいくつかの一般的な重み付けメソッドの実装とラッパーを提供します。
    - MatchThemは、乗算代入データを含む WeightIt のラッパーを提供します。
    - PSweightは、M推定を使用した傾向スコアの重み付けと不確実性推定を提供します。
    - clusteredinterferenceとinferferenceは、干渉のコンテキストで重み付け方法を提供します。
    - いくつかのパッケージは、傾向スコアを含む場合と含まない場合がある、さまざまな治療タイプのバランスウェイトを推定する特殊な方法を提供します:
      - CBPS：バイナリ、マルチカテゴリ、連続、縦断治療に対する瞬間ベースの傾向スコア推定の一般化された方法
      - twangおよびtwangContinuous：バイナリ、マルチカテゴリー、連続、縦断処理用の勾配ブースティングマシンを使用した傾向スコア重み付け
      - sbwおよび optweight：二次計画法を使用した最適化ベースの重み付け
      - ebal：エントロピー・バランシング
      - mvGPSは、WeightIt のインフラストラクチャを使用して多変量治療の重みを推定します。
      - マッチング調整された間接比較は、ユニットレベルのデータが一部のグループでのみ利用可能な場合の傾向スコアの重み付けの相対値であり、maic、maicChecks、およびoptweight（svy() 関数を使用）で利用できます。
    - 二重に堅牢な方法は、治療モデルと結果モデルの両方が含まれます。
      - 拡張IPW（AIPW）は、AIPW、PSweight、DoubleML、grf（関数causal_forestの後に Average_causal_effectが続く）、および causalweightで実装されています。
      - ターゲット最尤推定（TMLE、ターゲット最小損失ベース推定とも呼ばれます）は、drtmle、tmle、ctmle（変数選択のあるTMLEの場合）、ltmle（縦断データの場合）、および AIPWで使用できます。
    - 差の差分法は、次で提供されています。
      - DRDID：厄介関数の推定に2つの選択肢を持つ二重のロバスト推定量
      - bacondecomp：グッドマン・ベーコン分解を使用し、治療時期のばらつきを考慮
      - did：2つ以上の期間があり、治療時期のばらつきがある場合
      - fixest：Sun & Abraham推定量
      - qte
    - 分位処理効果はqte、Counterfactual、grfを用いて推定できます。
    - Trend in Trendモデルのオッズ比推定と検出力計算は、TrendInTrendに実装されています。
    - 合成制御手法は、次で提供されています。
      - Synth：比較ケーススタディ用のグループ手法を使用
      - microsynth：ミクロおよびメソレベルのデータ用
      - gsynth：複数の処理ユニットおよび可変処理期間への拡張
      - tidysynthは、合成制御メソッドを使用するための使いやすい構文を提供します。
      - scpiは、投げ縄、リッジ、シンプレックス、および線形制約を使用して複数の合成制御推定器を実装し、予測区間を構築します。
    - 操作変数メソッドは、次で提供されています。
      - ivreg、ivmodel、bpbounds：ATE のノンパラメトリック境界
      - grf、fixest、estimatrおよび DoubleML：関数 DoubleMLIIVM
      - ivmteは、限界治療効果を使用してIVモデルに選択理論的解釈を提供し、コンパイラーから外挿して他の部分母集団の治療効果を推定します。
      - LARFは、バイナリ内因性治療および機器による治療効果のIV推定に局所平均応答関数を使用します。
      - icswは、操作変数を使用して平均治療効果を推定するための逆コンプライアンス・スコア重み付けを実装します。
      - ivdescは、コンパイラー、ネバーテイカー、およびオールウェイテイカーの部分母集団の記述統計を提供します。
      - IVメソッドのパッケージの詳細と長いリストは、計量経済学タスクビューの操作変数にあります。
    - メディエーション分析は、次で提供されています。
      - cfma：機能的メディエーション分析
      - cit：尤度ベースのテスト
      - MultisiteMediation：マルチサイト試験
      - DirectEffects：潜在的なメディエーターを特定の値に固定する場合の制御された直接効果
      - medflex：自然効果モデル
      - causalweightとtwangMediationは、メディエーション用の重み付き推定器を実装します。
      - mediationと cfdecompは、同定、推論を行います。
        
        mediationはさらに、因果媒介効果の感度分析も提供します。
      - pathsは、感度分析を行うための一連のバイアス式とともに、代入アプローチを使用してパス固有の因果効果を推定します。
      - regmedintは、治療メディエーター相互作用項を使用した回帰ベースの分析を実装します。
      - gmaは、時系列のグレンジャーメディエーション分析を実行します。
      - bmemは、欠損データの場合の媒介分析（リストごと/ペアごとの削除、多重代入、2段階最尤法）および媒介分析のための検出力分析のためのいくつかの異なる方法を提供します。
    - 干渉のもとでは、因果効果の推定は、完全な縦断的データの観測データへの射影を近似した連鎖グラフモデルによる集団的結果上の逆確率重み付け（IPW）推定量による推論を用いて達成することができる。
    - 干渉下では、逆確率重み付き（IPW）推定量によるinferferenceを用いて因果効果推定を行うことができます。
      - 完全な縦断的データの観測データへの射影を近似する連鎖グラフモデルによる集団的結果に関するnetchain。
    - 乗法的相互作用モデルの診断と可視化は、interflexに実装されています。
    - InvariantCausalPredictionは、異なる実験条件や環境条件（隠れ変数あり）で収集されたデータを用いて、因果効果の信頼区間を提供します。
      - 非線形モデルの拡張は、nonlinearICPで実装されています。
    - 回帰不連続設計（RDD）法はrdrobust（ロバストな信頼区間構築と帯域幅選択を提供）に実装されています。
      - RDD法のパッケージの詳細なリストは、EconometricsタスクビューのRegression discontinuity designにあります。

さらに、causalsens、OVtool、dstat、sensemakr、EValueは感度分析（未測定交絡、選択バイアス、測定誤差）の関数を提供し、uiは不確実性区間を導出し、欠損データと未観測交絡の感度分析を実行する機能を実装します。cobaltと tableoneは、共変量平衡化の前後でバランステーブルとプロットを生成し、confoundr (archived)は時変交絡のための共変量バランス診断を実装します。 WhatIfは、重複と外挿を評価する方法を提供します。

異質な治療効果の推定

上記のパッケージのいくつかは、異種混合治療効果（HTE）推定にも使用できます。

個々の因果効果推定のためのベイズ・アプローチは、（ベイズ加法回帰木に基づく）bartCauseで利用可能です。
異質性のオムニバス検定と、全体的な治療効果の異質性を共変量によって説明される系統的成分と特質的成分に分解するためのフィッシャー的アプローチがhettxに実装されています。
治療効果の不均一性を利用した有効な治療または集団のサブセット選択は、FindItとgrfに実装されています。
- この後者のパッケージは、Missing Incorporated in Attributes アプローチを用いた欠損共変量値をサポートします。
- さらに、subdetectは、治療効果が増強されたサブグループの存在の検定を提供します。
パーソナライズされた因果予測のための他のアプローチは、次で提供されています。
- EffectTreat：相関に基づく式を利用する
- ランダム化データに対してはevalITR：さらに予算制約を定義することができる
- SortedEffects：ソートされた因果効果と分類分析のための推定と推論手法
steppは、生存モデルまたは一般化線形モデルの治療-共変量相互作用を探索する診断プロットを提供し、臨床試験の2つ以上の治療群から生じる連続、2項、カウント・データに適用できます。

方策学習とダイナミックな治療体制

最適な動的治療レジーム（DTR）の推定は、DynTxRegime（Q-Learning、Interactive Q-Learning、加重学習、Augmented Inverse Probability Weighted EstimatorsとInverse Probability Weighted Estimatorsに基づく値探索法）に実装されています。
- 限界分位、限界平均、平均絶対差に基づく方法は、quantoptrに実装されており、分位最適治療レジームのための二重にロバストな方法も実装されています。
- lmtpはまた、修正された治療方針、動的治療レジーム（および静的介入）に対する二重にロバストな因果効果推定を提供します。
- DTRregは、G推定、動的重み付けOLS、Q-learningなどのさまざまな手法や、いくつかの分散推定アプローチを提案し、生存アウトカムや連続的な治療変数を扱うことができます。
- QTOCenは、打ち切りデータから平均および分位最適治療レジームを推定する方法を提供します。
- ITRLearnは、意味のある信頼性の高い個別化治療レジームを推奨するためのマキシミン投影学習と、群ごとのコントラスト関数を推定するためのQ学習とA学習を実装しています。
- simmlとsimslは、それぞれ実験データと観察データ用の多重リンクを持つ単一インデックスモデルを提供します。
- personalizedは、観察データと無作為化データから個別化治療規則を推定する方法を実装しており、変数選択と勾配ブースティングに基づく推定、結果モデルの拡張（連続、バイナリ、カウント、time-to-eventアウトカム）が可能です。
ITRLearnは、個別化治療レジームを推奨するためのマキシミン・プロジェクション学習と、群別対照関数を推定するためのQ学習とA学習を実装しています。
- ITRSelectは、単段階または多段階の研究において、最適な個別化（動的）治療レジームにおける重要な変数を選択するための逐次アドバンテージ選択と罰則付きA-learningを実装しています。
- OTRselectは、打切りまたは非打切り連続反応について、最適な治療戦略の推定と重要変数の同定を同時に行うことができるペナルティ付き回帰法を実装しています。
- DTRlearn2は、Q-learningとoutcome-weighted learningメソッドと、ペナルティによる変数選択を提供します。
逐次多割付け無作為化試験（SMART）の場合、smartsizerは、最適なDTRを特定するために必要なサンプルサイズを決定するための一連のツールを提供します。
- DTRlearn2は、SMARTからの一般的なK段階DTRの推定量も実装しています。

構造方程式モデル（SEM）、ドゥ・カルチュラル因果発見

識別可能性は、因果効果が識別可能かどうか（ノンパラメトリック識別可能性）を決定するアルゴリズムを提供するcausaleffectおよびdosearchと、特定の因果モデルの任意の推定値を計算するCausalQueriesによって対処されます。
- SEMIDは、線形SEMの同定可能性または非同定可能性をチェックするSEMベースのルーチンを実装しています。
- causaloptimは、シンボリック線形オプティマイザを使用して、ユーザ定義のDAG、クエリ、制約条件の厳密な境界を提供します。
因果構造学習は、pcalgの次の関数で可能です。
- PC：隠れ変数のない観測データの場合
- FCIおよびRFCI：隠れ変数のある観測データの場合
- GIES：隠れ変数のない観測データと介入データの混合の場合
- pcalgは、グラフィカル・モデル（IDAアルゴリズム、一般化バックドア基準（GBC）、一般化調整基準（GAC））を使った因果推論も可能です。背景知識を組み込むことも可能です。包括的な概要については、GraphicalModelsとPsychometrics CRAN Task Viewsを参照してください。
因果効果の推定は、CIEEではDAGから導かれる推定方程式を用いて、InvariantCausalPredictionでは環境間の因果的不変性を活用する条件付き独立性検定から導かれる調整セットを用いて可能です。
因果ネットワークの推定は、CompareCausalNetworksで実装されています。
generalCorrは、一般化相関、部分相関、もっともらしい因果経路を計算します。

さらにdagittyは、さまざまなタイプのグラフィカル・モデル（cpdags、pdagなど）を定義し、調整セットを識別するメソッドを提供します（ウェブベースのグラフィカル環境も利用可能：DAGitty）。

特定の種類のデータ

縦断データ/時系列および打ち切りデータ：時系列の因果効果推定は，CausalImpact（ベイズ・アプローチを使用）およびCausalMBSTS（多変量応答用）に実装されています。
GWASとSNP：
- CKATは、SNPsのセットについて遺伝的主効果と遺伝子-治療交互作用効果を共同で検定するカーネルベースの手法を実装しています。
因果推論の教科書に掲載されている頻出例題を実行するための例題データセットには、causaldataを通じてアクセスできます。
重み付け、2モード、縦断的なネットワーク分析がtnetに実装されています。

特定の応用分野

行動変容科学では、behaviorchangeに特化した分析と可視化ツールを使用します。
バイオマーカーの評価および治療-バイオマーカー効果の推定は、bhmのツール（バイオマーカー-治療効果用）を用いて行うことができます。
質的比較分析タイプの手法は、cnaに導入されています。
特定の遺伝子に関連する因果効果を調べるために使用されるメンデルランダム化法は、次で提供されています。
- MendelianRandomization、mr.raps：Robust Adjusted Profile Scoreを用いた要約統計による2標本メンデルランダム化
- MRPC：メンデルランダム化の原理を用いたPCアルゴリズム
tools4uplift：アップリフト・モデリングは、マーケティング・キャンペーンなどの行動が特定の個人に及ぼす因果的効果を予測することを目的としています。
コンフィギュレーション比較法による偶然性の分析は、cnaが提供します。

R言語 CRAN Task View：因果推論

概要

ランダム化比較試験（RCT）およびその他の実験データの手法

平均治療効果推定値およびその他の一変量治療効果推定値

異質な治療効果の推定

方策学習とダイナミックな治療体制

構造方程式モデル（SEM）、ドゥ・カルチュラル因果発見

特定の種類のデータ

特定の応用分野

こちらもおすすめ

R言語 CRAN Task View：実験計画法（DoE）および実験データの分析の設計

R言語 CRAN Task View：農業

R言語 CRAN Task View：関数データ解析