順位ロジスティック回帰のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。

この予測変数は連続またはカテゴリにすることができる

連続変数は測定および順序付けが可能で、2値間の間の数は無限です。たとえば、タイヤのサンプルの直径は連続変数です。

カテゴリ変数には、有限可算数のカテゴリまたは知覚グループが含まれます。カテゴリデータには、論理的順序がない場合があります。たとえば、カテゴリ予測変数には、性別、材料種、支払い方法が含まれます。

離散変数の場合、それを連続予測変数として扱うかカテゴリ予測変数として扱うかを決めることができます。離散変数は測定と順序付けが可能ですが、計数値をとります。たとえば、一世帯の人数は離散変数です。離散変数を連続として扱うかカテゴリとして扱うかは、水準数および分析の目的によって異なります。詳細は、カテゴリ変数、離散変数、連続変数とはを参照してください。

  • ランダムなカテゴリ因子がある場合は、混合効果モデルを適合を使用します。 一般線形モデルを適合の場合、応答は連続します。
応答変数は順位である
順位応答には、低、中、および高などの順位を持つ結果が3種類以上あります。
ベストプラクティスを使用してデータを収集する
結果が確実に有効になるようにするため、次のガイドラインについて考慮します。
  • データが対象の母集団を表すことを確認します。
  • 必要な精度を達成するために十分なデータを収集します。
  • 可能な限り正確かつ高精度に変数を測定します。
  • データを収集した順序で記録します。
多重共線性としても知られる予測変数間の相関は重度ではない

多重共線性が極端である場合、どの予測変数をモデルに含むべきか判断できないことがあります。多重共線性の大きさを判断するには、予測変数間の相関関係を調べます。予測変数に高度な相関があるかどうかを判断するには、統計 > 基本統計 > 相関を選択します。

モデルがデータに良好に適合している
モデルがデータに適合しない場合、結果は、誤った認識を与える可能性があります。適切なモデルは次の特性を持ちます。
  • 適合度検定のp値は、α値よりも大きくなります。この状態は、モデルがデータに十分に適合しないことを示す証拠が不十分であることを示します。
  • 関連性の測定での値は、モデルの予測能力の要件を満たすか、その要件以上である必要があります。
出力において、適合度検定および関連性の測定値を確認します。
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください