適合線プロットには応答変数と予測変数データが表示されます。プロットには回帰式を示す回帰線が含まれます。また、適合値の信頼区間を表示するかどうかを選択することもできます。
適合線プロットを使用して、応答変数と予測変数の関係を調べることができます。
これらの結果では、式は成功確率を表しています。y軸の応答値1は成功を表します。プロットは、温度が上がると成功確率が下がることを示しています。データの温度が50に近いところでは線の傾斜はあまり大きくなく、成功確率は温度の上昇に伴い少しずつ下がることが分かります。中心部の線の傾斜はかなり大きく、この範囲では温度が1度変わるごとに結果が大きく影響されることが分かります。最高温度付近で成功確率が0に近づくと、線はまた水平になります。
モデルがデータにうまく適合すれば、高い予測確率値によって事象がどこで起こりやすいのかが示されます。データの温度が50に近いところでは、応答変数は1が最も多く、温度の上昇に伴い、応答変数は0が多くなります。
信頼区間をプロットに追加する場合、信頼区間を使用して、適合値の推定の精度を評価できます。以下の最初のプロットでは、信頼区間の線の幅は、予測変数が増加するほど近似します。2番目のプロットでは、信頼区間の幅は、予測変数の値が上昇するにつれて広くなります。区間が広がるのは、1つには、温度が高いときにデータ量が少なくなるためです。
逸脱残差のヒストグラムは、すべての観測値について残差の分布を示します。
パターン | パターンが示す意味 |
---|---|
1つの方向に伸びている | 歪度 |
1本のバーが他のバーから離れている | 外れ値 |
ヒストグラムの外観は、データをグループ化するために使用されている区間の数に依存するので、残差の正規性を評価するときにヒストグラムは使用しません。その代わり、正規確率プロットを使用します。
残差の正規確率プロットには、分布が正規分布する場合の残差と期待値の関係が表示されます。
残差の正規確率プロットを使用して、残差が正規分布に従うという仮定を検証します。残差の正規確率プロットは、ほぼ直線になります。
非正規パターンを閲覧する場合、他の残差プロットを使用して、項の欠落や時間順序効果などのモデルの他の問題がないかをチェックします。残差が正規分布に基づかない場合、通常の近似信頼区間とワルド検定が不正確である可能性があります。
残差対適合値グラフでは、y軸に残差が、x軸に適合値がプロットされます。このプロットはデータのフォーマットが事象/試行の場合に意味があります。データのフォーマットが2値応答/度数の場合はこのプロットは作成されません。
残差対適合値プロットを使用して、残差はランダムに分布するという仮定を検証します。点に特徴的なパターンがなく、0の両側にランダムにくるのが理想的です。
パターン | パターンが示す意味 |
---|---|
残差が適合値周辺に扇状または不均等に分散している | 不適切なリンク関数 |
曲線 | 高次の項の欠損または不適切なリンク関数 |
ゼロから遠い点 | 外れ値 |
ある点が他の点からX軸方向に遠く離れている | 影響力のある点 |
課題 | 可能性のある解決方法 |
---|---|
不均一分散 | 別のモデル項、リンク関数または重みを使うことを検討します。 |
外れ値または影響力のある点 |
|
残差対データ順序プロットには、データの収集順に残差が表示されます。
残差対変数プロットには、別の変数に対する残差の値が表示されます。その変数は既にモデルに含まれているかもしれませんし、あるいは含まれていなくても応答に影響を与える可能性がある値です。
ランダムでない残差のパターンは、変数が応答に体系的に影響を及ぼしていることを示します。この変数を分析に含めることを検討してください。