まず、サンプル平均での差を考慮し、次に信頼区間を調べます。
差は、母平均での差の推定値です。差は母集団全体ではなくサンプルデータに基づくため、サンプル差が母集団差に一致する可能性は低いと言えます。より良好に母集団差を推定するためには、差の信頼区間を使用します。
信頼区間は、2つの母平均の差の値が含まれる可能性が高い範囲です。たとえば、95%の信頼水準は、母集団から100個のサンプルをランダムに採取した場合、そのうちおよそ95個からは母集団差を含む区間が得られると期待することができます。信頼区間により、結果の実質的な有意性を評価しやすくなります。状況に応じた専門知識を利用して、信頼区間に実質的に有意な値が含まれているかどうかを判断します。信頼区間が広すぎて役に立たない場合、サンプルのサイズを増加させることを検討します。詳細は、信頼区間の精度を高める方法を参照してください。
これらの結果では、病院の評価の母平均差の推定値は21です。95%の信頼度で、差の母平均は14.22から27.78の間に含まれると考えることができます。
この結果で、帰無仮説では、2つの病院の平均評価の差が0であると仮定します。p値が0.000で有意水準の0.05より小さいため、帰無仮説を棄却し、病院の評価が異なると結論付けます。
歪度や外れ値などのデータの問題は、結果に悪影響を及ぼす可能性があります。グラフを使用して(各サンプルの広がりを調べて)歪度を探し、潜在的な外れ値を識別します。
データが歪んでいる場合、大半のデータがグラフの上側または下側に表示されます。多くの場合、ヒストグラムまたは箱ひげ図で最も簡単に歪度を検出できます。
データが右方向に歪んだ箱ひげ図は、待ち時間を示しています。ほとんどの待ち時間は比較的短く、いくつかの待ち時間のみが長くなっています。データが左方向に歪んだ箱ひげ図は、故障時間データを示しています。一部の項目はすぐに故障していますが、多くの項目は故障するまでに長い時間がかかっています。
サンプルが小さい(いずれかのサンプル値が15個未満の)場合、大きく歪んだデータはp値の妥当性に影響する可能性があります。データが大きく歪んでいてサンプルが小さい場合は、サンプルサイズを大きくすることを検討してください。
この箱ひげ図で、病院Bのデータは極端に歪んでいるように見えます。
他のデータ値から遠く離れている外れ値は、分析結果に大きく影響する可能性があります。多くの場合、箱ひげ図で最も簡単に外れ値を識別できます。
箱ひげ図では、アスタリスク(*)で外れ値が示されます。
外れ値の原因を特定する必要があります。データ入力や測定の誤差を修正します。異常な1回きりの事象(特別原因)のデータ値は除外することを検討します。その後で、分析を繰り返します。詳細は、外れ値の識別を参照してください。
この箱ひげ図で、病院Bのデータには2個の外れ値があります。