Exemple de Découvrir le meilleur modèle (réponse continue)

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Rechercher le meilleur type de modèle

Les chercheurs d’un système de santé recueillent des données auprès de leurs cliniques médicales régionales. En particulier, l’équipe de recherche s’intéresse aux données des examens initiaux des médecins sur les patients malades. À la fin des examens initiaux, les médecins attribuent à chaque patient un score pour la gravité de sa maladie. Les chercheurs veulent développer un court questionnaire pour aider à prioriser les patients les plus malades avant l’examen par un médecin. Grâce à la consultation d’experts en la matière et à l’exploration initiale des données, l’équipe sélectionne 8 variables pour prédire le score de gravité. Les chercheurs veulent déterminer le meilleur type de modèle pour prédire le score de gravité avant d’affiner davantage le modèle.

Les chercheurs Découvrir le meilleur modèle (réponse continue) utilisent pour comparer les performances prédictives de 4 types de modèles: régression multiple, TreeNet®, Random Forests® et CART®. L’équipe prévoit d’explorer plus avant le type de modèle avec les meilleures performances prédictives.

  1. Ouvrez les données échantillons, Maladie.mtw.
  2. Sélectionnez Module d'analyse prédictive > Auto-apprentissage par la machine automatisé > Découvrir le meilleur modèle (réponse continue).
  3. Dans la zone Réponse, saisissez 'Score de gravité de la maladie'.
  4. Dans la zone Prédicteurs continus, saisissez 'Nombre de symptômes maintenant'.
  5. Dans la zone Prédicteurs de catégorie, saisissez 'Haute production de mucosités'-'Limites aux activités normales'.
  6. Cliquez sur OK.

Interpréter des résultats

Le tableau Sélection de modèle compare les performances des types de modèles. Le modèle de régression multiple a la valeur maximale de R2. Les résultats qui suivent sont pour le meilleur modèle de régression multiple.

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5% de conclure à tort qu'il existe une association. Dans ces résultats, plusieurs lois présentent une valeur de p supérieure à 0,05. Essoufflement sévère*Maux de tête sévères et Maux de tête sévères*Troubles graves du sommeil. Lorsque les chercheurs explorent d’autres modèles de régression multiple, ils utilisent des mesures de performance du modèle et des graphiques résiduels pour explorer les effets de l’inclusion de ces termes dans le modèle.

Le tableau récapitulatif du modèle montre que la formation R2 et l’essai R2 sont tous deux d’environ 91 %. L’erreur quadratée moyenne de la racine de test (RMSE), qui représente la distance entre les valeurs de données et les valeurs ajustées, est d’environ 4. Parce que le RMSE est petit sur l’échelle du score de maladie, les chercheurs sont optimistes qu’un petit nombre de questions est suffisant pour aider à hiérarchiser les patients.

Le tableau des ajustements et des diagnostics pour les informations inhabituelles montre les points de données qui ne suivent pas bien l’équation de régression proposée. Ce sont les ajustements et les diagnostics de l’ensemble complet des données.

La lettre R indique un point avec un résidu important. Examinez les points de données aberrants pour voir les valeurs de prédiction pour lesquelles le modèle est susceptible de ne pas être adapté. La lettre X indique un point avec un effet de levier élevé. Les points à fort effet de levier ont des combinaisons de prédicteurs inhabituelles par rapport au reste de l’ensemble de données.

Les résidus importants et les points d’endettement élevés sont des points potentiellement influents. Par exemple, un coefficient pourra être statistiquement significatif ou non selon qu'un point influent est inclus ou exclus. En cas d'observation influente, déterminez si elle est due à une erreur d'entrée de données ou de mesure. Si l’observation n’est pas une erreur, déterminez dans quelle mesure l’observation influence les résultats. Lorsque les chercheurs exploreront davantage le modèle, ils adapteront le modèle avec et sans les observations. Ensuite, comparez les coefficients, les valeurs de p, le R2, et d'autres informations relatives au modèle. Si le modèle change de manière significative lorsque vous supprimez l'observation influente, examinez le modèle plus en détail pour déterminer si vous avez spécifié le modèle de façon incorrecte. Vous pouvez être amené à rassembler davantage de données pour résoudre le problème.

Le nuage de points des montants ajustés de prêt par rapport aux montants réels de prêt montre la relation entre les valeurs ajustées et les valeurs réelles pour les données d'apprentissage et les données de test. Les points se situent approximativement près de la ligne de référence y=x, ce qui indique que le modèle s’adapte bien aux données.

Découvrir le meilleur modèle (réponse continue): Score de gra vs Nombre de sy; Haute produc; ...

Méthode Ajustez un modèle de régression pas à pas avec des termes linéaires et des termes d'ordre 2. Ajustez 6 modèle(s) de régression TreeNet® en utilisant la fonction de perte quadratique. Ajustez 3 modèle(s) de régression Random Forests® avec un effectif d'échantillon bootstrap identique à la taille des données d'apprentissage de 1546. Ajuster un modèle de régression CART® optimal. Sélectionnez le modèle avec un R carré maximal d'après la validation croisée sur 5 partitions. Nombre total de lignes : 1546 Lignes utilisées pour le modèle de régression : 1546 Lignes utilisées pour les modèles basés sur des arbres : 1546
Informations de réponse Moyenne EcTyp Minimum Q1 Médiane Q3 Maximum 31,0110 14,0820 0 19,05 30,95 40,48 76,19

Sélection du modèle

Écart Meilleur modèle pour absolu le type R carré (%) moyen Régression multiple* 91,31 3,0785 TreeNet® 90,90 3,1613 Random Forests® 89,93 3,3248 CART® 86,11 3,9369 *Meilleur modèle avec un R carré maximal, pour tous les types de modèles. Suivi des résultats pour le meilleur modèle.
Sélection pas à pas des termes pour le meilleur modèle de régression multiple Termes sélectionnés : Nombre de symptômes maintenant; Haute production de mucosités; Douleur thoracique sévère; Maux de tête sévères; Troubles graves du sommeil; Limites aux activités normales; Nombre de symptômes maintenant*Nombre de symptômes maintenant; Nombre de symptômes maintenant*Essoufflement sévère; Nombre de symptômes maintenant*Se sentir généralement très mal; Essoufflement sévère*Maux de tête sévères; Douleur thoracique sévère*Troubles graves du sommeil; Maux de tête sévères*Troubles graves du sommeil; Troubles graves du sommeil*Limites aux activités normales α pour inclure = 0,15; α pour exclure = 0,15
Equation de régression Score de gravité de la maladie = 0,344 + 2,985 Nombre de symptômes maintenant + 0,0 Haute production de mucosités_0 + 3,874 Haute production de mucosités_1 + 0,0 Douleur thoracique sévère_0 + 3,247 Douleur thoracique sévère_1 + 0,0 Maux de tête sévères_0 + 4,203 Maux de tête sévères_1 + 0,0 Troubles graves du sommeil_0 + 3,591 Troubles graves du sommeil_1 + 0,0 Limites aux activités normales_0 + 3,400 Limites aux activités normales_1 - 0,0419 Nombre de symptômes maintenant*Nombre  de symptômes maintenant + 0,0 Nombre de symptômes maintenant*Essouffle ment sévère_0 + 0,5118 Nombre de symptômes maintenant*Essouf flement sévère_1 + 0,0 Nombre de symptômes maintenant*Se sentir  généralement très mal_0 + 0,5164 Nombre de symptômes maintenant*Se sen tir généralement très mal_1 + 0,0 Essoufflement sévère*Maux de tête sévère s_0 0 + 0,0 Essoufflement sévère*Maux de tête sévère s_0 1 + 0,0 Essoufflement sévère*Maux de tête sévère s_1 0 + 1,000 Essoufflement sévère*Maux de tête sévè res_1 1 + 0,0 Douleur thoracique sévère*Troubles grave s du sommeil_0 0 + 0,0 Douleur thoracique sévère*Troubles grave s du sommeil_0 1 + 0,0 Douleur thoracique sévère*Troubles grave s du sommeil_1 0 + 1,741 Douleur thoracique sévère*Troubles gra ves du sommeil_1 1 + 0,0 Maux de tête sévères*Troubles graves du sommeil_0 0 + 0,0 Maux de tête sévères*Troubles graves du sommeil_0 1 + 0,0 Maux de tête sévères*Troubles graves du sommeil_1 0 - 0,881 Maux de tête sévères*Troubles graves d u sommeil_1 1 + 0,0 Troubles graves du sommeil*Limites aux a ctivités normales_0 0 + 0,0 Troubles graves du sommeil*Limites aux a ctivités normales_0 1 + 0,0 Troubles graves du sommeil*Limites aux a ctivités normales_1 0 + 1,146 Troubles graves du sommeil*Limites aux  activités normales_1 1
Coefficients Terme Coeff Constante 0,344 Nombre de symptômes maintenant 2,985 Haute production de mucosités 1 3,874 Douleur thoracique sévère 1 3,247 Maux de tête sévères 1 4,203 Troubles graves du sommeil 1 3,591 Limites aux activités normales 1 3,400 Nombre de symptômes maintenant*Nombre de symptômes maintenant -0,0419 Nombre de symptômes maintenant*Essoufflement sévère 1 0,5118 Nombre de symptômes maintenant*Se sentir généralement très mal 1 0,5164 Essoufflement sévère*Maux de tête sévères 1 1 1,000 Douleur thoracique sévère*Troubles graves du sommeil 1 1 1,741 Maux de tête sévères*Troubles graves du sommeil 1 1 -0,881 Troubles graves du sommeil*Limites aux activités normales 1 1 1,146 Terme Coef ErT Constante 0,739 Nombre de symptômes maintenant 0,213 Haute production de mucosités 1 0,224 Douleur thoracique sévère 1 0,412 Maux de tête sévères 1 0,370 Troubles graves du sommeil 1 0,370 Limites aux activités normales 1 0,351 Nombre de symptômes maintenant*Nombre de symptômes maintenant 0,0145 Nombre de symptômes maintenant*Essoufflement sévère 1 0,0398 Nombre de symptômes maintenant*Se sentir généralement très mal 1 0,0332 Essoufflement sévère*Maux de tête sévères 1 1 0,546 Douleur thoracique sévère*Troubles graves du sommeil 1 1 0,557 Maux de tête sévères*Troubles graves du sommeil 1 1 0,493 Troubles graves du sommeil*Limites aux activités normales 1 1 0,487 Terme Valeur de T Constante 0,47 Nombre de symptômes maintenant 13,99 Haute production de mucosités 1 17,32 Douleur thoracique sévère 1 7,89 Maux de tête sévères 1 11,37 Troubles graves du sommeil 1 9,70 Limites aux activités normales 1 9,68 Nombre de symptômes maintenant*Nombre de symptômes maintenant -2,88 Nombre de symptômes maintenant*Essoufflement sévère 1 12,87 Nombre de symptômes maintenant*Se sentir généralement très mal 1 15,56 Essoufflement sévère*Maux de tête sévères 1 1 1,83 Douleur thoracique sévère*Troubles graves du sommeil 1 1 3,13 Maux de tête sévères*Troubles graves du sommeil 1 1 -1,79 Troubles graves du sommeil*Limites aux activités normales 1 1 2,35 Terme Valeur de p Constante 0,641 Nombre de symptômes maintenant 0,000 Haute production de mucosités 1 0,000 Douleur thoracique sévère 1 0,000 Maux de tête sévères 1 0,000 Troubles graves du sommeil 1 0,000 Limites aux activités normales 1 0,000 Nombre de symptômes maintenant*Nombre de symptômes maintenant 0,004 Nombre de symptômes maintenant*Essoufflement sévère 1 0,000 Nombre de symptômes maintenant*Se sentir généralement très mal 1 0,000 Essoufflement sévère*Maux de tête sévères 1 1 0,067 Douleur thoracique sévère*Troubles graves du sommeil 1 1 0,002 Maux de tête sévères*Troubles graves du sommeil 1 1 0,074 Troubles graves du sommeil*Limites aux activités normales 1 1 0,019 Terme FIV Constante Nombre de symptômes maintenant 25,48 Haute production de mucosités 1 1,10 Douleur thoracique sévère 1 2,47 Maux de tête sévères 1 2,69 Troubles graves du sommeil 1 2,98 Limites aux activités normales 1 2,76 Nombre de symptômes maintenant*Nombre de symptômes maintenant 26,19 Nombre de symptômes maintenant*Essoufflement sévère 1 2,42 Nombre de symptômes maintenant*Se sentir généralement très mal 1 2,12 Essoufflement sévère*Maux de tête sévères 1 1 2,68 Douleur thoracique sévère*Troubles graves du sommeil 1 1 2,95 Maux de tête sévères*Troubles graves du sommeil 1 1 3,37 Troubles graves du sommeil*Limites aux activités normales 1 1 4,21
Récapitulatif du modèle Statistiques Apprentissage Test R carré 91,45% 91,31% Racine de l'erreur quadratique moyenne (RMSE) 4,1339 4,1509 Erreur quadratique moyenne (MSE) 17,0889 17,2303 Ecart absolu moyen (MAD) 3,0502 3,0785 R carré (ajus) 91,38% R carré (prév) 91,27%
Analyse de la variance Source DL Régression 13 Nombre de symptômes maintenant 1 Haute production de mucosités 1 Douleur thoracique sévère 1 Maux de tête sévères 1 Troubles graves du sommeil 1 Limites aux activités normales 1 Nombre de symptômes maintenant*Nombre de symptômes maintenant 1 Nombre de symptômes maintenant*Essoufflement sévère 1 Nombre de symptômes maintenant*Se sentir généralement très mal 1 Essoufflement sévère*Maux de tête sévères 1 Douleur thoracique sévère*Troubles graves du sommeil 1 Maux de tête sévères*Troubles graves du sommeil 1 Troubles graves du sommeil*Limites aux activités normales 1 Erreur 1532 Inadéquation de l'ajustement 482 Erreur pure 1050 Total 1545 Source SomCar ajust Régression 280199 Nombre de symptômes maintenant 3346 Haute production de mucosités 5128 Douleur thoracique sévère 1063 Maux de tête sévères 2209 Troubles graves du sommeil 1609 Limites aux activités normales 1602 Nombre de symptômes maintenant*Nombre de symptômes maintenant 142 Nombre de symptômes maintenant*Essoufflement sévère 2831 Nombre de symptômes maintenant*Se sentir généralement très mal 4140 Essoufflement sévère*Maux de tête sévères 57 Douleur thoracique sévère*Troubles graves du sommeil 167 Maux de tête sévères*Troubles graves du sommeil 55 Troubles graves du sommeil*Limites aux activités normales 95 Erreur 26180 Inadéquation de l'ajustement 8929 Erreur pure 17251 Total 306379 Source CM ajust Régression 21553,8 Nombre de symptômes maintenant 3346,0 Haute production de mucosités 5128,2 Douleur thoracique sévère 1063,4 Maux de tête sévères 2208,9 Troubles graves du sommeil 1609,3 Limites aux activités normales 1601,8 Nombre de symptômes maintenant*Nombre de symptômes maintenant 142,1 Nombre de symptômes maintenant*Essoufflement sévère 2831,4 Nombre de symptômes maintenant*Se sentir généralement très mal 4140,1 Essoufflement sévère*Maux de tête sévères 57,4 Douleur thoracique sévère*Troubles graves du sommeil 167,2 Maux de tête sévères*Troubles graves du sommeil 54,6 Troubles graves du sommeil*Limites aux activités normales 94,7 Erreur 17,1 Inadéquation de l'ajustement 18,5 Erreur pure 16,4 Total Source Valeur F Régression 1261,28 Nombre de symptômes maintenant 195,80 Haute production de mucosités 300,09 Douleur thoracique sévère 62,23 Maux de tête sévères 129,26 Troubles graves du sommeil 94,17 Limites aux activités normales 93,74 Nombre de symptômes maintenant*Nombre de symptômes maintenant 8,32 Nombre de symptômes maintenant*Essoufflement sévère 165,69 Nombre de symptômes maintenant*Se sentir généralement très mal 242,27 Essoufflement sévère*Maux de tête sévères 3,36 Douleur thoracique sévère*Troubles graves du sommeil 9,78 Maux de tête sévères*Troubles graves du sommeil 3,19 Troubles graves du sommeil*Limites aux activités normales 5,54 Erreur Inadéquation de l'ajustement 1,13 Erreur pure Total Source Valeur de p Régression 0,000 Nombre de symptômes maintenant 0,000 Haute production de mucosités 0,000 Douleur thoracique sévère 0,000 Maux de tête sévères 0,000 Troubles graves du sommeil 0,000 Limites aux activités normales 0,000 Nombre de symptômes maintenant*Nombre de symptômes maintenant 0,004 Nombre de symptômes maintenant*Essoufflement sévère 0,000 Nombre de symptômes maintenant*Se sentir généralement très mal 0,000 Essoufflement sévère*Maux de tête sévères 0,067 Douleur thoracique sévère*Troubles graves du sommeil 0,002 Maux de tête sévères*Troubles graves du sommeil 0,074 Troubles graves du sommeil*Limites aux activités normales 0,019 Erreur Inadéquation de l'ajustement 0,059 Erreur pure Total
Ajustements et diagnostics pour les observations aberrantes Score de Val. gravité de Valeur résid. Observation la maladie ajustée Résiduelle norm. 11 66,670 56,876 9,794 2,38 R 13 52,380 40,295 12,085 2,94 R 16 59,520 48,753 10,767 2,62 R 24 45,240 53,741 -8,501 -2,07 R 25 54,760 51,951 2,809 0,69 X 33 50,000 60,750 -10,750 -2,61 R 48 64,290 55,761 8,529 2,07 R 54 50,000 41,213 8,787 2,14 R 55 71,430 62,446 8,984 2,20 R 56 50,000 58,812 -8,812 -2,14 R 106 59,520 49,132 10,388 2,52 R 114 59,520 48,176 11,344 2,76 R 128 69,050 58,812 10,238 2,49 R 144 50,000 41,678 8,322 2,03 R 173 47,620 56,876 -9,256 -2,25 R 191 42,860 51,882 -9,022 -2,20 R 198 59,520 48,305 11,215 2,73 R 202 73,810 63,801 10,009 2,43 R 205 47,620 38,376 9,244 2,25 R 226 64,290 55,793 8,497 2,08 R 239 47,620 58,812 -11,192 -2,72 R 241 71,430 65,104 6,326 1,56 X 243 14,290 23,821 -9,531 -2,31 R 352 64,290 51,498 12,792 3,11 R 369 38,100 49,420 -11,320 -2,75 R 391 16,670 31,869 -15,199 -3,69 R 392 0,000 11,616 -11,616 -2,81 R 395 0,000 14,224 -14,224 -3,44 R 424 40,480 52,627 -12,147 -2,95 R 425 47,620 34,968 12,652 3,08 R 479 40,480 30,080 10,400 2,53 R 489 16,670 25,679 -9,009 -2,19 R 493 57,140 44,917 12,223 2,97 R 495 35,710 25,642 10,068 2,45 R 509 38,100 27,094 11,006 2,68 R 520 73,810 58,812 14,998 3,65 R 537 38,100 27,122 10,978 2,67 R 550 14,290 23,248 -8,958 -2,17 R 583 42,860 53,741 -10,881 -2,65 R 720 59,520 64,053 -4,533 -1,12 X 722 40,480 30,734 9,746 2,37 R 802 30,950 41,786 -10,836 -2,63 R 814 40,480 31,869 8,611 2,09 R 823 61,900 48,143 13,757 3,36 R 833 33,330 42,941 -9,611 -2,34 R 839 42,860 34,575 8,285 2,01 R 859 38,100 49,420 -11,320 -2,75 R 868 47,620 36,910 10,710 2,61 R 891 30,950 19,848 11,102 2,69 R 893 28,570 48,766 -20,196 -4,98 R X 905 45,240 55,761 -10,521 -2,56 R 942 42,860 34,526 8,334 2,02 R 977 64,290 54,955 9,335 2,28 R 983 57,140 47,814 9,326 2,27 R 993 73,810 63,801 10,009 2,43 R 997 33,330 23,248 10,082 2,45 R 1003 54,760 45,258 9,502 2,31 R 1025 33,330 45,945 -12,615 -3,12 R X 1034 33,330 41,525 -8,195 -2,00 R 1059 57,140 48,748 8,392 2,05 R 1105 47,620 37,691 9,929 2,41 R 1150 59,520 44,917 14,603 3,55 R 1160 52,380 39,929 12,451 3,02 R 1163 30,950 41,213 -10,263 -2,49 R 1165 69,050 56,876 12,174 2,96 R 1169 59,520 49,420 10,100 2,46 R 1198 42,860 51,887 -9,027 -2,20 R 1207 76,190 62,893 13,297 3,24 R 1213 26,190 40,350 -14,160 -3,44 R 1228 40,480 50,081 -9,601 -2,34 R 1235 59,520 50,799 8,721 2,12 R 1237 57,140 48,792 8,348 2,03 R 1246 64,290 55,761 8,529 2,07 R 1262 45,240 36,607 8,633 2,10 R 1263 57,140 43,803 13,337 3,24 R 1284 45,240 56,429 -11,189 -2,72 R 1285 47,620 60,750 -13,130 -3,19 R 1288 35,710 44,896 -9,186 -2,24 R 1303 26,190 36,882 -10,692 -2,60 R 1305 35,710 45,087 -9,377 -2,28 R 1311 30,950 40,129 -9,179 -2,24 R 1353 42,860 53,294 -10,434 -2,54 R 1377 47,620 35,298 12,322 3,00 R 1380 69,050 55,761 13,289 3,23 R 1384 50,000 39,313 10,687 2,60 R 1414 26,190 35,935 -9,745 -2,37 R 1502 61,900 51,905 9,995 2,43 R 1526 38,100 25,422 12,678 3,07 R 1535 14,290 23,821 -9,531 -2,31 R 1544 38,100 28,117 9,983 2,43 R 1548 50,000 39,319 10,681 2,60 R 1565 38,100 39,528 -1,428 -0,35 X 1582 66,670 55,152 11,518 2,81 R R : Valeur résiduelle élevée X : Valeur de X aberrante

Nuage en points des valeurs de réponse aj. vs aux valeurs de réponse réelles

Sélectionner un autre modèle

Les chercheurs décident d’examiner les résultats du meilleur modèle de TreeNet®.

  1. Dans les résultats de Découvrir le meilleur modèle (réponse continue), après la sélection par étapes des termes pour le meilleur modèle de régression multiple, cliquez sur Sélectionner un autre modèle.
  2. Dans Type de modèle, sélectionnez TreeNet®.
  3. Dans Sélectionner un modèle existant, choisissez le sixième modèle, qui a la meilleure valeur de R2.
  4. Cliquez sur Afficher les résultats.

Interpréter des résultats

Pour cette analyse, Minitab cultive 300 arbres et le nombre optimal d'arbres est de 63. Le modèle utilise un taux d’apprentissage de 0,1 et une fraction de sous-échantillon de 0,7. Le nombre maximal de nœuds terminaux par défaut est de 6.

Régression TreeNet®: Score de gra vs Nombre de sy; Haute produc; ...

Méthode Fonction de perte Erreur quadratique Critères de sélection du nombre d'arbres optimal R carré maximum Validation de modèle Validation croisée pour 5 ensemble(s) Taux d'apprentissage 0,1 Fraction de sous-échantillon 0,7 Nombre maximal de nœuds terminaux par arbre 6 Taille minimale du nœud terminal 3 Nombre de prédicteurs sélectionnés pour la partition des nœuds Nombre total de prédicteurs = 8 Lignes utilisées 1546 Lignes non utilisées 70
Informations de réponse Moyenne EcTyp Minimum Q1 Médiane Q3 Maximum 31,0110 14,0820 0 19,05 30,95 40,48 76,19

Le diagramme du R carré par rapport au nombre d'arbres montre toute la courbe sur le nombre d'arbres développés. La valeur optimale pour les données de test est de 0,3865 lorsque le nombre d'arbres est de 63.

Régression TreeNet®: Score de gra vs Nombre de sy; Haute produc; ...

Récapitulatif du modèle Nombre total de prédicteurs 8 Prédicteurs importants 8 Nombre d'arbres développés 300 Nombre optimal d'arbres 63 Statistiques Apprentissage Test R carré 91,93% 90,90% Racine de l'erreur quadratique moyenne (RMSE) 3,9992 4,2471 Erreur quadratique moyenne (MSE) 15,9932 18,0375 Ecart absolu moyen (MAD) 2,9943 3,1613 Pourcentage d'erreur absolue moyen (MAPE) 0,1088 0,1130

Le tableau récapitulatif du modèle montre que le log de vraisemblance négatif moyen lorsque le nombre d’arbres est de 63 est d’environ 0,23 pour les données de formation et est d’environ 0,39 pour les données d’essai.

La courbe d'importance relative des variables trace les prédicteurs dans l'ordre de leur effet sur l'amélioration du modèle lorsqu'un prédicteur est divisé sur la séquence des arbres. La variable de prédiction la plus importante est Nombre de symptômes maintenant. Si l'importance de la principale variable de prédiction, Nombre de symptômes maintenant, est de 100 %, la variable importante suivante, Limites aux activités normales, présente une contribution de 93,9%. Cela signifie Limites aux activités normales que 44,4 % est aussi important que Nombre de symptômes maintenant dans ce modèle de régression.

Le nuage de points des montants ajustés de prêt par rapport aux montants réels de prêt montre la relation entre les valeurs ajustées et les valeurs réelles pour les données d'apprentissage et les données de test. Les points se situent approximativement près de la ligne de référence y=x, ce qui indique que le modèle s’adapte bien aux données.

Utilisez les diagrammes de dépendance partielle pour mieux comprendre comment les variables ou les paires de variables importantes affectent la réponse prévue. Les diagrammes de dépendance partielle indiquent si la relation entre la réponse et une variable est linéaire, monotone ou plus complexe.

Le premier graphique illustre la relation entre les scores de maladie et le nombre de symptômes que le patient a maintenant. En raison du nombre de points de données, vous pouvez positionner votre curseur sur différents points de données pour afficher des valeurs X et Y spécifiques. Par exemple, le point le plus élevé sur le côté droit du graphique correspond au numéro de région de base 13 et le montant du prêt ajusté est d'environ 435 000 $.

Le deuxième graphique montre que le score de maladie ajusté augmente d’environ 5 points lorsque les patients signalent des limitations de leurs activités normales.

Le troisième graphique illustre que le score de maladie ajusté augmente d’environ 5 points lorsque les patients déclarent généralement se sentir très mal.

Le quatrième graphique illustre que le score de maladie ajusté augmente d’environ 4 points lorsque les patients signalent un essoufflement sévère.

Le dernier graphique illustre comment le score de maladie ajusté pour un certain nombre de symptômes dépend de si le patient a également des limites sur ses activités normales. Pour le même nombre de symptômes, les patients qui signalent également des limites à leurs activités normales ont des scores de maladie ajustés plus élevés.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique