偏最小二乗回帰のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。

予測変数は固定する必要がありません。
PLSでは予測変数が固定されることは想定されていないので、誤差と共に予測変数を測定できます。予測変数が固定されており、大きな測定誤差がない場合は、適合回帰モデルを使用します。
データには観測値より多くの項が含まれているか、予測変数の共線性が高い可能性がある
予測変数の共線性が高くなく、データに予測変数の数より多い数の観測値が含まれている場合は、適合回帰モデルを使用します。
この予測変数は連続またはカテゴリにすることができる

連続変数は測定および順序付けが可能で、2値間の間の数は無限です。たとえば、タイヤのサンプルの直径は連続変数です。

カテゴリ変数には、有限可算数のカテゴリまたは知覚グループが含まれます。カテゴリデータには、論理的順序がない場合があります。たとえば、カテゴリ予測変数には、性別、材料種、支払い方法が含まれます。

離散変数の場合、それを連続予測変数として扱うかカテゴリ予測変数として扱うかを決めることができます。離散変数は測定と順序付けが可能ですが、計数値をとります。たとえば、一世帯の人数は離散変数です。離散変数を連続として扱うかカテゴリとして扱うかは、水準数および分析の目的によって異なります。詳細は、カテゴリ変数、離散変数、連続変数とはを参照してください。

応答変数は連続量である

相関応答変数を使用して分析を実行する場合は、PLSにより、多変量応答パターンと、応答ごとの別個の分析で検出可能な関係より弱い関係を検出することができます。

応答変数がカテゴリの場合、モデルが分析の前提条件を満たしたり、データを正確に表したり、または有効な予測を行ったりする確率は低くなります。

予測変数の相関が高くなく、観測値よりも予測変数の方が多い場合、代わりに以下の分析を検討できます。

  • 応答変数に合格や不合格などの2種類のカテゴリが含まれる場合は、2値ロジスティックモデルを適合を使用します。
  • 応答変数に、「強く反対」「反対」「どちらでもない」「同意」「強く同意」などの自然律に従うカテゴリが3種類以上含まれている場合は、順位ロジスティック回帰を使用します。
  • 応答変数に、傷、へこみ、および裂け目などの自然律に従わないカテゴリが3種類以上含まれている場合は、名義ロジスティック回帰を使用します。
  • 応答変数で欠陥の数などの出現数を数える場合は、適合ポアソンモデルを使用します。
ベストプラクティスを使用してデータを収集する
結果が確実に有効になるようにするため、次のガイドラインについて考慮します。
  • データが対象の母集団を表すことを確認します。
  • 必要な精度を達成するために十分なデータを収集します。
  • 可能な限り正確かつ高精度に変数を測定します。
  • データを収集した順序で記録します。
モデルがデータに良好に適合している

モデルがデータに適合しない場合、結果は、誤った認識を与える可能性があります。出力において、残差プロット、モデル選択統計量と検証統計量、および応答プロットを使用して、モデルのデータへの適合度を判断します。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください