まず、サンプル平均での差を考慮し、次に信頼区間を調べます。
差は、母平均での差の推定値です。差は母集団全体ではなくサンプルデータに基づくため、サンプル差が母集団差に一致する可能性は低いと言えます。より良好に母集団差を推定するためには、差の信頼区間を使用します。
信頼区間は、2つの母平均の差の値が含まれる可能性が高い範囲です。信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。 詳細は、信頼区間の精度を高める方法を参照してください。
差 | 差に対する95%信頼区間 |
---|---|
21.00 | (14.22, 27.78) |
これらの結果では、病院の評価の母平均差の推定値は21です。95%の信頼度で、差の母平均は14.22から27.78の間に含まれると考えることができます。
帰無仮説 | H₀: μ₁ - µ₂ = 0 |
---|---|
対立仮説 | H₁: μ₁ - µ₂ ≠ 0 |
t値 | 自由度 | p値 |
---|---|---|
6.31 | 32 | 0.000 |
この結果で、帰無仮説では、2つの病院の平均評価の差が0であると仮定します。p値が0.000で有意水準の0.05より小さいため、帰無仮説を棄却し、病院の評価が異なると結論付けます。
歪みや外れ値などのデータの問題は、結果に悪影響を及ぼす可能性があります。グラフを使用して歪みを探し(各サンプルの広がりを調べて)、潜在的な外れ値を識別します。
データが歪んでいる場合、ほとんどのデータがグラフの上下に位置していることになります。ヒストグラムや箱ひげ図では歪みを検出するのが最も簡単であるケースが多いです。
データが大きく歪んでいると、サンプルサイズが小さい場合(どちらかのサンプルが15未満)にp値の妥当性が影響を受けます。データが大きく歪んでいて、サンプルサイズが小さい場合はサンプルサイズを増やすことを検討します。
外れ値は、他の大部分のデータから遠くに離れているデータ値のことで、分析の結果に大きな影響を及ぼします。多くの場合、外れ値は、箱ひげ図で容易に識別できます。
外れ値がある場合は、その原因を特定してください。データ入力誤差や測定誤差はすべて修正します。異常な1回だけの事象(特殊原因とも呼ばれます)を示すデータ値を除外することを検討してください。それから、分析を繰り返します。詳細は、外れ値の識別を参照してください。