Définition du test de Student
Le test de Student, parfois appelé Test T, est une famille de tests statistiques permettant de comparer deux échantillons de données, en confrontant notamment leurs moyennes respectives. Le test de Student est un outil permettant de vérifier une hypothèse formulée sur un jeu de données. Il est principalement utilisé lorsque l’on sait que l’échantillon de données est supposé suivre une loi normale, comme lorsque l’on joue 100 fois de suite au pile ou face.
Le test de Student fait intervenir une statistique de test suivant une loi de Student : un type de loi de probabilité faisant intervenir la loi normale centrée réduite. Le test de Student permet de déterminer la probabilité que deux groupes de données soient différents.
Le test de Student expliqué
Le test de Student permet de comparer la valeur de la moyenne de deux échantillons et de déterminer ensuite si ces deux échantillons sont issus de la même population – c’est-à-dire qu’ils décrivent en réalité le même phénomène. Si l’on prend l’exemple des moyennes obtenues sur un trimestre par des élèves de deux classes différentes : si l’on sélectionne un échantillon de quelques élèves de chacune des deux classes, on peut s’attendre à ce que ces échantillons possèdent une moyenne et un écart-type différents.
Mathématiquement, le test de Student consiste à sélectionner un échantillon dans chacun des deux groupes puis à formuler une hypothèse principale, appelée hypothèse nulle, stipulant que les moyennes de ces deux groupes sont égales. On effectue ensuite plusieurs calculs dont les résultats sont comparés à des valeurs connues, les T-valeurs, déterminées au préalable grâce à la loi de Student. L’hypothèse nulle est ensuite ou validée ou rejetée suivant les résultats. L’hypothèse nulle n’est rejetée que lorsque les résultats du test sont extrêmement fiables et que l’on peut être certains de la validité du rejet.
Le test de Student n’est qu’un des nombreux tests statistiques utilisés pour vérifier la validité d’une hypothèse. Le test Z, faisant intervenir la loi normale, en est un autre exemple majeur. Le test du chi-2 ou le test F sont également des tests statistiques ayant le même objectif que le test T.
L’utilité du test de Student
Considérons le cas pratique d’une société pharmaceutique souhaitant tester l’efficacité d’un nouveau médicament. La procédure classique dans ce cas de figure consiste à sélectionner deux groupes de patients puis à donner à l’un des groupes le médicament tandis que l’autre groupe, appelé le groupe de contrôle, ne prend qu’un placebo. Le placebo en question n’a aucune valeur thérapeutique, et ne sert qu’à établir une référence à comparer au groupe ayant pris le véritable médicament.
Imaginons maintenant qu’après la prise du médicament, on constate chez le groupe de contrôle une augmentation de 3 ans de l’espérance de vie, tandis que le groupe testant le nouveau médicament voit son espérance de vie moyenne augmenter de 4 ans. La conclusion naïve serait de conclure que le médicament est performant, et fonctionne comme la compagnie le souhaite. Cependant, cet écart d’un an dans l’augmentation de l’espérance de vie peut très bien être anecdotique ou n’être que le fruit du hasard. Le test de Student peut ainsi permettre de déterminer si les résultats de l’expérience sont bien fiables et décrivent la réalité de l’efficacité du médicament.
L’essentiel sur le test de Student
- Un test de Student est une famille de tests d’inférence statistique, c’est-à-dire qu’il permet de déduire les caractéristiques d’une population à partir d’un échantillon de ces deux groupes.
- Le test de Student nécessite la connaissance de trois données fondamentales : la différence entre les moyennes des deux échantillons, l’écart-type de chaque échantillon et le nombre d’éléments dans chaque groupe.
- Le test de Student n’est qu’un type parmi les nombreuses familles de tests d’inférence statistique, comme le test Z.