Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.
Une équipe de chercheurs recueille des données sur la vente de propriétés résidentielles individuelles à Ames, iowa. Les chercheurs veulent identifier les variables qui influent sur le prix de vente. Les variables incluent la surface du terrain et diverses caractéristiques de la propriété résidentielle.
Après une première exploration à l'aide de Régression CART® pour identifier les prédicteurs importants, l'équipe utilise Régression Random Forests® pour créer un modèle plus avancés à partir du même ensemble de données. L'équipe compare le tableau récapitulatif du modèle et la courbe R2 dans les résultats pour évaluer quel modèle fournit un meilleur résultat de prédiction.
Ces données ont été adaptées à partir d'un ensemble de données public contenant des informations sur les données sur le logement d'Ames. Données originales de DeCock, Truman State University.
Validation de modèle | Validation avec données out-of-bag |
---|---|
Nombre d'échantillons bootstrap | 300 |
Effectif d'échantillon | Identique à la taille des données d'apprentissage de 2930 |
Nombre de prédicteurs sélectionnés pour la partition des nœuds | 30% du nombre total de prédicteurs = 23 |
Taille minimale du nœud interne | 5 |
Lignes utilisées | 2930 |
Moyenne | EcTyp | Minimum | Q1 | Médiane | Q3 | Maximum |
---|---|---|---|---|---|---|
180796 | 79886,7 | 12789 | 129500 | 160000 | 213500 | 755000 |
Nombre total de prédicteurs | 77 |
---|---|
Prédicteurs importants | 68 |
Statistiques | Out-of-Bag |
---|---|
R carré | 90,90% |
Racine de l'erreur quadratique moyenne (RMSE) | 24097,3281 |
Erreur quadratique moyenne (MSE) | 5,80681E+08 |
Ecart absolu moyen (MAD) | 14746,8323 |
Pourcentage d'erreur absolue moyen (MAPE) | 0,0895 |
Le tableau récapitulatif du modèle montre que les valeurs R2 sont légèrement améliorées par rapport aux valeurs R2 de l'analyse CART® correspondante.