偏最小二乗回帰の分析オプションを選択する

統計 > 回帰 > PLS > オプション
交差検証

交差検証では、潜在的なモデルの予測能力を計算するため、モデルに含める成分の適切な数を決定する際に便利です。交差検証を使用して、データの最適な成分数を判断します。データに複数の応答変数がある場合、Minitabでは、同時にすべての応答に対して成分の妥当性が確認されます。詳細はPLS回帰における交差検証を参照してください。

以下の3つの交差検証法を実行できます。
  • なし: 交差検証を実行しません。
  • 観測値を1つずつ省略: このオプションを使用して、観測値を一度に1つ除外して潜在的なモデルを計算します。大きなデータセットの場合、この方法では時間がかかることがあります。観測値と同じ数だけ、モデルを再計算するからです。
  • 特定のサイズのグループを1つずつ省略: モデルが再計算される度に除外される観測値の数を入力します。このモデルは、モデルを再計算する回数を減らすので、データセットが大きい場合に特に適しています。
  • 指定した列のとおりに省略: このオプションを使用して、グループ識別子の列数に適合する観測値の省略を同時に実行することによりモデルを計算します。この方法を使用すると、同時に省略する観測値を指定することができます。たとえば、数値1、2、3をグループ識別子の列に含める場合は、1を含むすべての観測値が同時に省略され、モデルが再計算されます。次に、2を含むすべての観測値が省略され、モデルが再計算されます。
カテゴリ予測変数のコーディングのタイプ
分析を実行する場合は、2つの方法のうち1つを使用して、カテゴリ予測変数を再コード化する必要があります。予測変数の水準を平均全体または参照水準の平均と比較したいかどうかによって、方法の変更を検討します。詳細はカテゴリ予測変数のコード化方式を参照してください。
  • (1、0): 各水準の平均と参照水準の平均の差を推定するために選択します。コード体系(1,0)を選択する場合、参照水準を指定できます。
  • (-1、0、+1): 各水準の平均と平均全体の差を推定するために選択します。
参照レベル (カテゴリ予測変数、レベル)
カテゴリ予測変数の列に続いて参照水準を入力します。(テキストおよび日付/時間水準は引用符で囲む必要があります。)1、0コーディングを使用する場合のみ、参照水準を割り当てることができます。デフォルトでは、データ型に基づいて以下の参照水準を設定します。
  • 数値カテゴリ予測変数の場合、参照水準は最小の数値が設定された水準です。
  • 日付/時刻カテゴリ変数の場合、参照水準は最も早い日付/時刻に設定された水準です。
  • カテゴリ予測変数がテキストの場合、参照水準はデフォルトのアルファベット順で最初になる水準です。