Random Forests® 回帰の応答情報を求める方法と計算式

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

テストセットによる検証をアウトオブバッグ検証に追加すると、トレーニングセットとテストセットの個別の統計情報が表に表示されます。

N

テストセットによる検証を追加する場合、この統計がテーブルに含まれます。この数値は、テストセットとトレーニングセットに含まれる非欠損の応答値の数です。

Nの%

テストセットによる検証を追加する場合、この統計がテーブルに含まれます。数値は、トレーニングデータセットとテストデータセット内にある観測値のパーセンテージです。

平均

一連の数字の中心として一般的に使用される測度。平均は平均値とも呼ばれます。これは、すべての観測値の和を(非欠損)観測値数で割ったものです。

標準偏差 (StDev)

データセットに 平均 を持つの場合、サンプルの標準偏差は次のようになります。
用語説明
観測値
観測値の平均
N非欠損観測値の数

最小値

データセットにおける最小の値。

Q1

サンプル観測値の25%が第1四分位数の値以下になります。そのため、第1四分位数は第25百分位数とも呼ばれます。

中央値

サンプル中央値は、データの中央にあります。観測値の少なくとも半分は中央値以下、少なくとも半分は中央値以上になります。

N個の値が含まれるデータセットがあるとします。中央値を計算するには、最初にデータ値を最小から最大の順に並べます。Nが奇数の場合は、サンプル中央値は中央にある値です。Nが偶数の場合は、サンプル中央値は中央の2つの値の平均です。

Q3

サンプル観測値の75%が第3四分位数の値以下になります。そのため、第3四分位数は第75百分位数とも呼ばれます。

最大値

データセットにおける最大の値。