カイ二乗統計量とは

カイ二乗統計量は観測データの分布と期待（仮説）分布との相違の測度です。たとえば、次のような場合に使用します。

カテゴリ変数間の独立性の検定、または関連性の特定です。たとえば、選挙結果を投票者の性別ごとに示した二元表で、カイ二乗統計量を使用して、投票が投票者の性別から独立しているか、または投票と性別の間に何らかの関連性があるかを判断することができます。カイ二乗統計量に関連付けられているp値が、選択したα未満の場合、2つの変数が独立しているとする帰無仮説が棄却されます。
統計モデルのデータに適合しているかどうかの決定です。カイ二乗統計に関連付けられているp値が選択したα未満の場合、モデルがデータに適合しているとする帰無仮説が棄却されます。

カテゴリデータでは、各カテゴリのカイ二乗値への寄与度が報告され、各カテゴリの相違に起因している合計カイ二乗値の割合が定量化されます。たとえば、適合度検定で帰無仮説が棄却された場合、それはすべてのカテゴリがそれぞれの期待値と適度に異なっていたことによるのか、あるいは単一のカテゴリがその期待値と著しく異なっていたことによるのか、という問いに答えることができます。たとえば、とても大きな駐車場で、セダン50台、トラック27台、バン23台の100台の自動車サンプルを期待していますが、実際にはセダン61台、トラック16台、バン23台だったとします。「セダン」と「トラック」のカテゴリは期待を満たしませんでしたが「バン」は期待を満たしています。つまり、「バン」は結果のカイ二乗値に寄与しておらず、データの相違はすべて「セダン」と「トラック」のカテゴリに起因するものです。

注

Minitabでは、カイ二乗統計量を計算するときにイェイツの修正因子を使用しません。