Définition de l’échantillonnage aléatoire
L’échantillonnage aléatoire correspond à la situation dans laquelle, au sein d’une population statistique quelconque dont on cherche à produire un échantillon, chaque individu possède la même probabilité d’être choisi pour constituer cet échantillon. Un échantillon aléatoire de la population est supposé représenter fidèlement la population de départ, puisque les individus ont été choisis sans aucun biais.
Par exemple, considérons le cas d’une entreprise souhaitant tirer au sort 25 de ses 250 employés. Dans cet exemple, la population statistique est l’ensemble des 250 noms des employés, et l’échantillon est aléatoire puisque le tirage au sort est fait au hasard.
La constitution d’un échantillon aléatoire
Les statisticiens peuvent constituer des échantillons aléatoires d’une population grâce à plusieurs méthodes. La plus intuitive, la loterie, consiste à assigner à chaque individu de la population un numéro, avant de sélectionner au hasard autant de numéros que l’on souhaite pour constituer l’échantillon.
L’exemple précédent des 25 noms tirés au sort est un exemple de loterie : on peut faire correspond à chaque nom un numéro entre 1 et 250, avant d’en choisir 25 au hasard.
Puisque chaque individu possède la même probabilité d’être choisi pour constituer l’échantillon, le résultat est le plus souvent un échantillon le plus équilibré possible, capable de représenter fidèlement la population de départ.
Pour des populations très importantes, mettre en place une loterie peut se révéler fastidieux. Choisir un échantillon aléatoire est le plus souvent un processus informatique, suivant certes la même méthodologie que pour la loterie, mais dont la sélection n’est plus faite par un humain mais un ordinateur.
Le risque d’erreur
Quelle que soit la méthode choisie, constituer un échantillon dans le but de représenter une population plus grande est toujours sujet à des erreurs de représentation – l’erreur d’échantillonnage – et l’échantillonnage aléatoire n’en est pas exempt.
Par exemple, dans l’exemple précédent, si l’on considère que 15% des 250 employés de l’entreprise sont gauchers, effectuer la mesure sur les 25 employés tirés au sort pourrait donner une proportion de 10% de gauchers, suivant les individus sélectionnés. Le seul moyen d’éviter systématiquement cette erreur d’échantillonnage est d’effectuer la mesure sur la totalité de la population…
Cela reste vrai quel que soit le type de population et le type de mesure que l’on souhaite effectuer. Mesurer la proportion d’employés hommes, ou d’employés possédant les yeux verts sur l’échantillon de 25 employés ne produira que rarement une conclusion parfaitement fidèle à la réalité des 250 employés. Cette méthode demeure cependant un excellent moyen d’obtenir une bonne vision globale de la réalité tout en économisant les ressources nécessaires à l’évaluation de la totalité de la population étudiée.
L’essentiel sur l’échantillonnage aléatoire
- Un échantillon aléatoire est un sous-groupe d’une population de départ dont les constituants sont choisis parfaitement aléatoirement.
- L’échantillon aléatoire fournit une représentation souvent proche de la réalité.
- Un risque d’erreur est cependant toujours présent, puisqu’il est souvent difficile de capturer de manière aléatoire un sous-groupe qui soit parfaitement représentatif de la population initiale.