残差のヒストグラムは、すべての観測値について残差の分布を示します。
パターン | パターンが示す意味 |
---|---|
一方向のロングテール | 歪度 |
1本のバーが他のバーから離れている | 外れ値 |
ヒストグラムの外観はデータをグループ化する区間数によって決まるため、残差の正規性の評価にヒストグラムを使用しないでください。代りに、正規確率プロットを使用して下さい。
ヒストグラムは、データ点が約20個以上ある場合に最も効果的です。サンプルサイズが小さすぎる場合、ヒストグラムの各バーには歪みや外れ値を示す充分なデータ点が含まれません。
残差の正規確率プロットには、分布が正規分布する場合の残差と期待値の関係が表示されます。
バッチ因子が変量の場合、条件付き残差を使用して正規性を評価します。
残差の正規確率プロットを使用して、残差が正規分布に従うという仮定を検証します。残差の正規確率プロットは、ほぼ直線になります。
非正規パターンを閲覧する場合、他の残差プロットを使用して、一定ではない分散や時間順序効果などのモデルの他の問題がないかをチェックします。残差が正規分布に基づかず、データに15個未満の観測値がある場合、予測の信頼区間、係数の信頼区間、係数のp値が不正確である可能性があります。
残差対適合値プロットのパターンまたは外れ値を特定する場合、次の解決方法を検討してください。
課題 | 可能性のある解決方法 |
---|---|
不均一分散 | Box-Cox変換を使用することを検討します。詳細は安定性分析のBox-Cox変換を実行するを参照してください。 |
外れ値または影響力のある点 |
|
残差対データ順序プロットには、データの収集順に残差が表示されます。
残差対変数プロットには、別の変数に対する残差の値が表示されます。その変数は既にモデルに含まれているかもしれませんし、あるいは含まれていなくても応答に影響を与える可能性がある値です。
ランダムでない残差のパターンは、変数が応答に体系的に影響を及ぼしていることを示します。この変数を分析に含めることを検討してください。