残差のヒストグラムは、すべての観測値について残差の分布を示します。
パターン | パターンが示す意味 |
---|---|
一方向のロングテール | 歪度 |
1本のバーが他のバーから離れている | 外れ値 |
ヒストグラムの外観はデータをグループ化する区間数によって決まるため、残差の正規性の評価にヒストグラムを使用しないでください。代りに、正規確率プロットを使用して下さい。
ヒストグラムは、データ点が約20個以上ある場合に最も効果的です。サンプルサイズが小さすぎる場合、ヒストグラムの各バーには歪みや外れ値を示す充分なデータ点が含まれません。
残差の正規確率プロットには、分布が正規分布する場合の残差と期待値の関係が表示されます。
残差の正規確率プロットを使用して、残差が正規分布に従うという仮定を検証します。残差の正規確率プロットは、ほぼ直線になります。
S曲線は、長い裾を持つ分布を示唆しています。
逆S曲線は、短い裾を持つ分布を示唆しています。
下向きの曲線は、右方向の歪みを示唆しています。
直線から離れている少数の点は、外れ値のある分布を示唆しています。
非正規パターンを閲覧する場合、他の残差プロットを使用して、項の欠落や時間順序効果などのモデルの他の問題がないかをチェックします。残差が正規分布に従っていない場合、信頼区間とp値は不正確である可能性があります。
残差対適合値グラフでは、y軸に残差が、x軸に適合値がプロットされます。
残差対適合値プロットを使用して、残差はランダムに分布し、均一な分散が存在するという仮定を検証します。点に特徴的なパターンがなく、0の両側にランダムにくるのが理想的です。
パターン | パターンが示す意味 |
---|---|
残差が適合値周辺に扇状または不均等に分散している | 不均一分散 |
曲線 | 高次の項の欠損 |
ゼロから遠い点 | 外れ値 |
ある点が他の点からX軸方向に遠く離れている | 影響力のある点 |
ある点が他の点に比べて大きいです。そのため、この点は外れ値となります。外れ値が多すぎる場合は、モデルが適切ではない可能性があります。外れ値の原因を識別する必要があります。データ入力や測定の誤差はすべて修正します。異常な1回きりの事象(特殊原因)に関連付けられたデータ値は除外することを検討します。その後で、分析を繰り返します。
残差の分散が適合値の増加とともに増加しています。適合値が大きくなるにつれ、残差間でばらつきが大きくなっていることに注意してください。このパターンは、残差の分散が等しくない(不均一である)ことを示しています。
課題 | 可能性のある解決方法 |
---|---|
不均一分散 | 応答変数または重みのBox-Cox変換の使用を検討します。 |
外れ値または影響力のある点 |
|
残差対データ順序プロットには、データの収集順に残差が表示されます。
残差対変数プロットには、別の変数に対する残差の値が表示されます。その変数は既にモデルに含まれているかもしれません。あるいは含まれていなくても応答変数に影響を与える可能性がある値です。
変数がすでにモデルに含まれている場合、変数のより高次の項を追加する必要があるかどうかを決定します。変数がモデルに含まれていない場合、プロットを使用して、変数が応答に体系的な影響を及ぼしているかどうかを判定します。
パターン | パターンが示す意味 |
---|---|
残差に特定のパターンがある | 変数が応答に体系的に影響を及ぼしています。変数がモデル内にない場合、その変数の項をモデルに含めて、モデルを再適合します。 |
点の分布に曲面性 | 変数の高次の項をモデルに取り込む必要があります。たとえば、曲線的なパターンは、2次項を追加する必要があることを示しています。 |