Traffine I/O

日本語

2022-04-19

差分の差(DID)

差分の差(DID)とは

差分の差(Difference-in-Differences、DID)は、社会科学において広く使用される経済計量学の手法であり、処置(treatment)が結果(outcome)に与える因果効果を評価するために使用されます。この手法は、特定の処置を受けた群(処置群)と受けていない群(対照群)の間の時間経過における結果の違いを活用します。その鍵となるアイデアは、処置の前後での処置群の結果の平均的な変化を対照群の同じ期間の平均的な変化と比較することです。

DID
Introduction to Difference-in-Differences Estimation

DIDは、処置と結果との因果関係を確立し、推定値にバイアスをもたらす可能性のある時間的に一定の未観測の混ざり合い要因を取り除くことを目指しています。倫理的または実践的な理由から処置のランダム化が不可能な場合に特に有用です。

DIDの基本的な概念

処置群と対照群

DIDの分析のコアとなるのは、処置群と対照群との比較です。処置群は、特定の政策や介入にさらされた実体(個人、企業、地域など)から構成されます。一方、対照群は、その介入にさらされていない類似の実体からなります。目的は、処置が処置群と対照群に対してどのように異なる効果をもたらすかを測定することです。

処置前期と処置後期

DIDでは、処置群と対照群の両方における介入前と介入後のデータが必要です。これらの期間は、処置前期と処置後期と呼ばれることがよくあります。処置前期は、両群の基準となる特性や傾向を確立するために重要です。一方、処置後期は、介入の影響を測定するために使用されます。

差分の計算

DIDの本質はその名前にあります。まず、2つの差分を計算し、それらを比較します。最初の差分は、処置前期から処置後期の処置群の結果の変化です。2つ目の差分は、同じ期間における対照群の結果の変化です。DID分析の鍵となる洞察は、これら2つの変化の差にあり、それが処置の因果的影響を推定します。

DIDの仮定

DIDの推定値の信頼性は、特定の仮定に強く依存しています。これらの仮定は、処置効果のバイアスのない推定を得るために重要です。以下では、これらの基本的な仮定について詳しく説明します。

並行トレンドの仮定

並行トレンドの仮定、または共通トレンドの仮定は、DIDの方法論の基本的な仮定です。この仮定は、処置がない場合、処置群と対照群の結果の平均的なトレンドは同じであったということを前提としています。言い換えると、処置後の両群のトレンドの違いは、処置の影響のみに帰することができます。

処置ステータスの独立性

処置ステータスの独立性の仮定は、処置群への割り当てが結果に影響を与える可能性のある未観測の要因と相関していないことを意味します。処置の割り当てと結果変数の両方に影響を与える未観測の変数が存在する場合、DID推定値にバイアスが生じる可能性があります。

共通のショックの仮定

共通のショックの仮定は、処置群と対照群が処置そのもの以外の時間の経過中に同様に影響を受けるということを前提としています。研究期間中に処置と対照群に異なる影響を与える他の出来事がある場合、DIDの推定値に影響を与える可能性があります。

仮定の検証

これらの仮定を直接的に検証することは不可能ですが、いくつかの戦略を用いて示唆的な証拠を提供することができます。一つの一般的なアプローチは、処置群と対照群の処置前のトレンドをグラフ化することです。これらのトレンドが平行である場合、並行トレンドの仮定を支持します。さらに、プラセボまたは偽薬テストを行ってDIDの仮定の妥当性を評価することもできます。これには、処置に影響を受けないはずの結果に対してDIDの手法を適用することが含まれます。

DIDによる因果効果の導出

通常の2期間2群の設定では、典型的なDIDモデルは次のように定式化されます。

Y_{it} = \alpha + \beta TREAT_i + \gamma POST_t + \delta (TREAT_i \cdot POST_t) + \epsilon_{it}

ここで、

  • Y_{it}: 個人(または他の単位)i の時間 t での結果
  • TREAT_i: ダミー変数であり、個人 i が処置群に属する場合は1、そうでなければ0
  • POST_t: ダミー変数であり、観測が処置後期からのものであれば1、処置前期からのものであれば0
  • TREAT_i \cdot POST_t: 交互作用項であり、観測が処置群でありかつ処置後期の場合は1
  • \epsilon_{it}: 誤差項

この方程式では、\deltaはDID推定値であり、処置の因果効果を捉えます。

DIDの方程式の各係数は次のような特定の意味を持ちます。

  • \alpha: 対照群の処置前期の平均的な結果
  • \beta: 処置群と対照群の処置前期の平均的な結果の差異、つまり群間の事前の違い
  • \gamma: 対照群の処置前期から処置後期への平均的な変化
  • \delta: DID推定値または処置効果。これは、処置前期から処置後期までの平均的な変化の処置群と対照群の間の差異を示します。言い換えると、これは処置の結果への因果効果を測定します。

DID分析の例

この章では、DIDを適用して因果効果を推定する方法の具体的な例を紹介します。この例では、雇用訓練プログラムの評価にDIDを適用します。

背景

低所得者の収入向上を目指した架空の雇用訓練プログラムを考えてみます。政府はこのプログラムを後援しており、その効果を把握したいと考えています。プログラムを評価するために、プログラムの実施前後のデータを使用してDID分析を適用します。

処置群は雇用訓練プログラムを受けた個人からなり、対照群はプログラムに参加していない類似の低所得者からなります。

データ収集と準備

この分析にはパネルデータを使用します。これには、プログラム実施前と実施後の両方で同じ個人の観測データが含まれます。データには個人の収入、人口統計学的特性、雇用訓練プログラムへの参加の有無などが含まれます。

DID分析

以下の基本的な手順に従ってDID分析を実施します。

  1. 各群および各期間の平均収入を計算
    処置群と対照群の収入の平均値を、プログラム実施前後で計算します。

  2. 差分を計算
    次に、2つの差分を計算します。最初の差分は、プログラム前後における処置群の収入の変化です。2つ目の差分は、同じ期間における対照群の収入の変化です。

  3. DID推定
    最後に、これら2つの差分の差を計算し、DID推定値を得ます。これにより、雇用訓練プログラムが収入に与える因果効果を推定することができます。

もしDID推定値が有意に正である場合、それは雇用訓練プログラムが低所得者の収入を効果的に改善したことを示唆しています。

参考

https://imai.fas.harvard.edu/teaching/files/DiD_fixed_effects.pdf
https://www.aptech.com/blog/introduction-to-difference-in-differences-estimation/
https://www.youtube.com/watch?v=Q5QOCMIwjbg&ab_channel=MikeJonasEconometrics

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!