の回帰式 MARS® 回帰

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

回帰式を使用して、モデル内の応答関数と基底関数の関係を記述します。基底関数は、予測変数の範囲に対する予測変数の効果を記述します。回帰式の一般的な形式は次のとおりです。

y = b0 + b1BF1 + b2BF2 +...+ bkBFk

ここで、
  • yは応答変数
  • b0 は定数項です。
  • b1 + b2 + ...+ bk は基底関数の係数です
  • BF1 + BF2 + ...+ BFk は基底関数です

予測変数の値の基底関数を解いて、応答の予測値を計算します。

基底関数

基底関数は通常、予測変数の値に応じて異なる値を持ちます。連続変数の場合、基底関数の一般的な形式は max(0, ƒ) です。関数 ƒ は、予測変数 X の値と定数 c の値に依存します。次のリストは、基底関数の形式、係数の符号、および予測変数と応答変数に対する予測変数の寄与度の関係を示しています。増加率または減少率は、基底関数の係数によって異なります。
max(0, X − c)
正の係数
寄与度はcまで0で、その後増加します。

max(0, X − c)
負の係数
寄与度はcまで最大で、その後減少します。
max(0, c − X)
正の係数
寄与は最大から始まり、cまで減少します。c の後、寄与度は 0 です。
max(0, c − X)
負の係数
寄与度は 0 から始まり、c まで増加します。cの後、貢献度は最大値になります。

c が予測変数の最小値または最大値に等しい場合、予測変数は基底関数のすべての値に対して同じ効果を持ちます。これら2つのケースの偏依存プロットは直線を示しています。MARS® 回帰 c を、予測変数の変換を許可しない分析のエンドポイントの 1 つにします。

カテゴリ予測変数の場合、基底関数は指標関数です。この関数の値は、一部のカテゴリでは 0 で、他のカテゴリの値は 1 です。基本関数の形式は次のとおりです。

X が x1のとき、...xk ここで、k は基底関数のレベル数 、k 1 です。

基底関数のカテゴリの関数の値は 1 です。基底関数に回帰式の係数を乗算すると、関数が 0 から 1 に変化したときの効果が決まります。

1基底関数の連続予測変数の例

これらの結果では、BF2は回帰式に負の係数を持っています。基底関数の係数は−57.6167です。基底関数の配置は max(0, c − X) です。この配置では、予測変数が増加すると基底関数の値は減少します。この配置と負の係数の組み合わせにより、予測変数と応答変数の間に正の関係が作成されます。の影響 リビングエリア は、438から3,078に増加 販売価格 することです。の リビングエリア 傾きは57.6167で、438から3,078です。

回帰式

BF2=最大(0、3078-リビングエリア)
BF3=品質が8, 9, 10の場合
BF6=最大(0、2002-築き上げました)
BF7=地下1階が欠落していない場合
BF10=最大(0、1696-地下1階) * BF7
BF11=品質が1, 8の場合
BF13=タイプが90, 150, 160, 180, 190の場合
BF15=近所がヴィーンカー, クリアクリーク, グリーンヒルズ, クロフォード, サマセット・ビレッジズ, ティンバーランド, ノースリッジ, ノースリッジハイツ, ブルーステム, ラ
     ンドマーク, 石の橋の場合
BF17=総地下面積が欠落していない場合
BF19=最大(0、総地下面積-1392) * BF17
BF21=最大(0、1階面積-2402)
BF23=状態が1, 2, 3, 4, 5, 6の場合
BF25=品質が1, 7, 10の場合
BF27=最大(0、1階面積-2207)
BF30=最大(0、15138-ロットエリア)

販売価格 = 325577  - 57.6167 * BF2 + 115438 * BF3 - 605.079 * BF6 - 25.3989 * BF10 - 66735.2 *
     BF11 - 23688.9 * BF13 + 22374.5 * BF15 + 50.3801 * BF19 - 576.789 * BF21 - 18099.2 * BF23 +
     22414.2 * BF25 + 361.254 * BF27 - 1.82 * BF30

1つの予測変数の部分依存プロット

加法モデルでは、1つの予測変数の部分依存プロットを使用して、重要な連続予測変数が予測応答にどのように影響するかについての洞察を得ます。1つの予測変数の部分依存性プロットは、予測変数レベルの変更に伴って応答がどのように変化すると予想されるか示しています。の場合 MARS® 回帰、プロットの値は、x軸の予測変数の基底関数から取得されます。Y軸の寄与度は、プロット上の最小値が0になるように標準化されています。

このプロットは、 販売価格 データセットの最小平方フィートから約3,000平方フィートに増加するにつれて リビングエリア 増加することを示しています。3,000平方フィートに達すると リビングエリア 、への 販売価格 貢献は約152,000ドルで横ばいになります。

1基底関数のカテゴリ予測変数の例

これらの結果では、BF3は予測変数 品質です。基底関数は、の 品質 値が 8、9、または 10 の場合です。式のBF3の係数は115,438です。この基底関数は、品質の値が値 1 から 7 から値 8、9、または 10 に変化すると、モデル内の販売価格が $115,438 増加することを示します。品質 BF11とBF25にもあります。応答変数に対する予測変数の効果を理解するには、すべての基底関数を検討します。

回帰式

BF2=最大(0、3078-リビングエリア)
BF3=品質が8, 9, 10の場合
BF6=最大(0、2002-築き上げました)
BF7=地下1階が欠落していない場合
BF10=最大(0、1696-地下1階) * BF7
BF11=品質が1, 8の場合
BF13=タイプが90, 150, 160, 180, 190の場合
BF15=近所がヴィーンカー, クリアクリーク, グリーンヒルズ, クロフォード, サマセット・ビレッジズ, ティンバーランド, ノースリッジ, ノースリッジハイツ, ブルーステム, ラ
     ンドマーク, 石の橋の場合
BF17=総地下面積が欠落していない場合
BF19=最大(0、総地下面積-1392) * BF17
BF21=最大(0、1階面積-2402)
BF23=状態が1, 2, 3, 4, 5, 6の場合
BF25=品質が1, 7, 10の場合
BF27=最大(0、1階面積-2207)
BF30=最大(0、15138-ロットエリア)

販売価格 = 325577  - 57.6167 * BF2 + 115438 * BF3 - 605.079 * BF6 - 25.3989 * BF10 - 66735.2 *
     BF11 - 23688.9 * BF13 + 22374.5 * BF15 + 50.3801 * BF19 - 576.789 * BF21 - 18099.2 * BF23 +
     22414.2 * BF25 + 361.254 * BF27 - 1.82 * BF30

従来の回帰式では、回帰式の係数は常に 0 から 1 への変化を表します。では MARS® 回帰、係数は 1 から 0 への変化を表すことができます。患者が頭痛がないと報告した場合は0、頭痛があると報告した場合は1のバイナリカテゴリ変数を考えてみましょう。予測変数に次の基底関数があるとします。

  • BF1 =頭痛が0の場合
この基底関数の係数は、値 1 から値 0 への変化を表します。

1つの予測変数に対する複数の基底関数

MARS® 回帰 1つの予測変数に対して複数の基底関数を使用して、予測変数と応答の間のより複雑な非線形関係をモデル化します。基底関数を追加すると、予測変数と応答変数の関係の傾きがさらに変化します。MARS® 回帰 加法モデルの複数の基底関数で予測変数を使用できます。

これらの結果では、BF21は予測変数 1階面積です。基底関数 BF27 も 1階面積です。BF21 と BF27 はどちらも同じ配置 max(0, X − c) です。この配置の基底関数は、予測変数の値がcより大きい場合に応答変数に影響します。この配置の2つの基底関数では、予測変数が基底関数の1つの最小値に達するまで、どちらの基底関数も応答に影響を与えません。これらの結果では、その値はBF27で2,207です。1階面積 最小値から 2,207 までの傾きは 0 です。2,207 を過ぎると、BF27 からの傾きが適用され、傾きは 361.254 になります。この傾きは、予測変数がBF21の定数に達するまで持続し、その時点でBF27とBF21の両方の係数が影響します 販売価格。2 つの係数の合計から、新しい傾き 361.254 + (−576.789) = −215.535 が得られます。加法モデルで、 MARS® 回帰 予測変数の効果を示す1つの予測変数の部分依存プロットを表示します。

回帰式

BF2=最大(0、3078-リビングエリア)
BF3=品質が8, 9, 10の場合
BF6=最大(0、2002-築き上げました)
BF7=地下1階が欠落していない場合
BF10=最大(0、1696-地下1階) * BF7
BF11=品質が1, 8の場合
BF13=タイプが90, 150, 160, 180, 190の場合
BF15=近所がヴィーンカー, クリアクリーク, グリーンヒルズ, クロフォード, サマセット・ビレッジズ, ティンバーランド, ノースリッジ, ノースリッジハイツ, ブルーステム, ラ
     ンドマーク, 石の橋の場合
BF17=総地下面積が欠落していない場合
BF19=最大(0、総地下面積-1392) * BF17
BF21=最大(0、1階面積-2402)
BF23=状態が1, 2, 3, 4, 5, 6の場合
BF25=品質が1, 7, 10の場合
BF27=最大(0、1階面積-2207)
BF30=最大(0、15138-ロットエリア)

販売価格 = 325577  - 57.6167 * BF2 + 115438 * BF3 - 605.079 * BF6 - 25.3989 * BF10 - 66735.2 *
     BF11 - 23688.9 * BF13 + 22374.5 * BF15 + 50.3801 * BF19 - 576.789 * BF21 - 18099.2 * BF23 +
     22414.2 * BF25 + 361.254 * BF27 - 1.82 * BF30

欠損値の基本関数

基底関数の検索で、 MARS® 回帰 欠損値を持つ予測変数の指標変数を作成します。標識変数は、予測変数の値が欠落しているかどうかを示します。分析にモデルに欠損値を持つ予測変数の基底関数が含まれる場合、モデルには標識変数の基底関数も含まれます。予測変数の他の基底関数はすべて、標識変数の基底関数と相互作用します。

予測変数に欠損値がある場合、標識変数の基底関数は、0 を乗算することによって、その予測変数の他の基底関数を無効にします。欠損値のこれらの基底関数は、重要な予測変数に欠損値があるすべてのモデルにあり、加法モデルや他のタイプの変換を無効にするモデルも含まれます。

これらの結果では、BF7は予測変数 地下1階です。BF 7 の値は、データ内にあるときに 地下1階 1 になります。BF 7 は、欠落している場合 地下1階 、値 0 を持ちます。BF7は、最終モデルでは基底関数が重要ではなかったため、回帰式には存在しませんが、BF7はBF10と相互作用します。BF10は重要であり、回帰式に存在します。BF7の効果は、欠落しているときに 地下1階 BF10に0を掛けることであり、欠落している場合は 地下1階 効果が削除されます。

回帰式

BF2=最大(0、3078-リビングエリア)
BF3=品質が8, 9, 10の場合
BF6=最大(0、2002-築き上げました)
BF7=地下1階が欠落していない場合
BF10=最大(0、1696-地下1階) * BF7
BF11=品質が1, 8の場合
BF13=タイプが90, 150, 160, 180, 190の場合
BF15=近所がヴィーンカー, クリアクリーク, グリーンヒルズ, クロフォード, サマセット・ビレッジズ, ティンバーランド, ノースリッジ, ノースリッジハイツ, ブルーステム, ラ
     ンドマーク, 石の橋の場合
BF17=総地下面積が欠落していない場合
BF19=最大(0、総地下面積-1392) * BF17
BF21=最大(0、1階面積-2402)
BF23=状態が1, 2, 3, 4, 5, 6の場合
BF25=品質が1, 7, 10の場合
BF27=最大(0、1階面積-2207)
BF30=最大(0、15138-ロットエリア)

販売価格 = 325577  - 57.6167 * BF2 + 115438 * BF3 - 605.079 * BF6 - 25.3989 * BF10 - 66735.2 *
     BF11 - 23688.9 * BF13 + 22374.5 * BF15 + 50.3801 * BF19 - 576.789 * BF21 - 18099.2 * BF23 +
     22414.2 * BF25 + 361.254 * BF27 - 1.82 * BF30

相互作用の基底関数

交互作用をモデル化するために、 MARS® 回帰 異なる予測変数の基底関数を乗算します。MARS® 回帰 デフォルトの加法モデルでの交互作用は考慮されません。部分依存プロットは、交互作用を考慮する分析には使用できません。

交互作用とは、予測変数の効果が他の予測変数の値に依存することを意味します。たとえば、穀物がオーブンで乾燥する速度はオーブン内の時間に依存しますが、時間の影響はオーブンの温度に依存します。時間と温度の変数は相互作用します。

交互作用のあるモデルの結果では、BF9は予測変数 品質です。BF12 は予測変数 1階面積用です。BF12の計算にはBF9による乗算が含まれているため、2つの予測変数は相互作用します。効果の決定には、 品質 他の予測変数の値に関する知識が必要である。 1階面積 BF12の係数-63.1685は、BF9の値が1の場合にのみ適用されます。BF9 の値は、8、9、または 10 の場合 品質 、1 です。BF12 の配置により、平方フィートが 2,470 未満で 品質 値が 8、9、または 10 の場合、 1階面積 傾きは 63.1685 になります。

回帰式

BF2=最大(0、3194-リビングエリア)
BF4=最大(0、2002-築き上げました)
BF5=地下1階が欠落していない場合
BF7=最大(0、地下1階-1758) * BF5
BF8=最大(0、1758-地下1階) * BF5
BF9=品質が8, 9, 10の場合
BF12=最大(0、2470-1階面積) * BF9
BF14=品質が7, 9, 10の場合
BF15=タイプが75, 90, 150, 160, 180, 190の場合
BF19=近所がヴィーンカー, クリアクリーク, グリーンズ, グリーンヒルズ, クロフォード, サマセット・ビレッジズ, ティンバーランド, ノースリッジ, ノースリッジハイツ, ブル
     ーステム, 石の橋の場合 * BF5
BF21=状態が1, 2, 3, 4, 5, 6の場合 * BF4
BF25=最大(0、1階面積-372) * BF7
BF26=総地下面積が欠落していない場合 * BF14
BF28=最大(0、総地下面積-689) * BF26

販売価格 = 320349  - 66.4387 * BF2 - 28.2065 * BF8 + 123645 * BF9 - 63.1685 * BF12 - 23751.7 *
     BF15 + 22818.2 * BF19 - 523.924 * BF21 - 0.036887 * BF25 + 53.9878 * BF28