[python]google colab上でカイ２乗検定を行う方法

2023-09-16 2023-12-26

カイ２乗検定では、２群の割合の差が意味のある差なのかどうか？を検定する

例えばABテストを行った場合にちゃんと効果があったかどうか？を検証していて、その差分が微差だった場合で誤差範囲ではないか？などの疑いがある場合などで活用。

例：　Aという施策を実施した時に、施策対象者と非対象者毎に翌月継続したか解約したか？の人数を抽出して、カイ２乗検定で施策効果が有意であったかどうか？を確認する場合のサンプルコード(こちらにも同じコードアップしてます）

import pandas as pd
from scipy import stats

# 施策Aの対象者の翌月継続者数と解約者数：　ここの数値を変更して利用
true_A = 97
false_A = 3

# 施策Aの非対象者の翌月継続者数と対象母数：　ここの数値を変更して利用
true_non_A = 900
false_non_A = 100

df = pd.DataFrame([[true_A, false_A], [true_non_A, false_non_A]],
                  index=['施策A対象者', '施策A非対象者'], columns=['継続者', '解約者'])
df

使い方：上記コードのtrue_A, false_A, true_non_A, false_non_Aの部分の数値を任意で入れ替えて実行

# カイ２乗検定の実施
chi2, p, dof, exp = stats.chi2_contingency(df, correction=False)

# 各指標を表示
print("期待度数", "\n", exp)
print("自由度", "\n", dof)
print("カイ二乗値", "\n", chi2)
print("p値", "\n", p)
print("-----------------")

# p値を基に結果を判定
if p < 0.05:
    result = f"P値が0.05以下のため、施策Aは効果があったと言えそうです"
else:
    result = f"P値が0.05以下ではない為、施策Aは効果がなかったと言えそうです"

result