Une variable sous-jacente est une variable qui n'est pas incluse en tant que variable de réponse ou explicative dans l'analyse, mais qui peut affecter l'interprétation des relations entre les variables. Une variable sous-jacente peut à tort indiquer une forte relation entre des variables ou cacher la véritable relation. Par exemple, un scientifique étudie l'effet d'un régime et d'exercices physiques sur la tension artérielle d'une personne. Les variables sous-jacentes qui affectent également la tension artérielle concernent le statut de fumeur/non fumeur de la personne et son niveau de stress.
Dans des modèles statistiques, le terme d'erreur rend compte des variables sous-jacentes qui influent sur le procédé. Pour identifier les variables sous-jacentes, vous devez prendre le temps de comprendre vos données et les variables importantes susceptibles d'influencer un procédé. Vous pouvez également créer un diagramme des données pour rechercher des tendances non linéaires qui pourraient révéler la présence de variables sous-jacentes.