Chapitre 6 : Tests d’hypothèses – données quantitatives

Chapitre 6 : Tests d’hypothèses – données quantitatives 2018-05-15T18:05:14+00:00
PDF

Une application importante de la théorie des probabilités consiste à tester des hypothèses scientifiques à partir des résultats d’expériences ou d’enquêtes. Les données issues de ces études comportent un important élément aléatoire, de sorte que certaines variations observées peuvent être purement accidentelles, sans signification aucune; alors que d’autres révèlent des faits scien­tifiques ou confirment des conjectures.

Lorsqu’on conclut, par exemple, que « le médicament Tamoxifen est la cause de certains cancers », c’est qu’une étude a révélé un taux de cancer particulièrement élevé parmi ceux qui en prennent. Est-ce à cause du Tamoxifen, ou est-ce un accident?  La réponse exige parfois un raisonnement complexe et sophistiqué, mais le fonds de la démarche est simple et intuitif. On observe les taux de cancer parmi deux groupes de sujets : le groupe dit expérimental, constitué de ceux qui ont subi un traitement (ont consommé du Tamoxifen); et le groupe témoin (ceux qui ne l’ont pas subi). Si l’écart entre les deux taux est faible, on l’attribuera au hasard; s’il est important, on l’attribuera à une cause—présumément le traitement au Tamoxifen.

On exclut l’hypothèse d’un pur hasard lorsqu’on calcule que si seul le hasard était à l’œuvre, l’écart n’aurait pas pu être aussi grand.  On s’entend : l’écart aurait pu, théoriquement, être aussi grand. Mais pour cela il aurait fallu qu’un événement très peu probable se soit produit. On trouve donc plus vraisemblable que la différence a été causée par le traitement.

Voilà pour l’idée centrale d’un test d’hypothèse. Reste l’aspect technique : comment tenir compte des particularités d’un contexte expérimental pour calculer la probabilité qu’un événement observé se soit produit par pur hasard? Le traitement technique dépend entre autres du caractère quantitatif ou qualitatifs des données.  C’est pour cela qu’on réserve un chapitre séparé pour ces deux cas.

Dans celui-ci on se limite au cas où les données observées sont des réalisations de variables qualitatives.  Leur loi de probabilité sera pour la plupart la loi normale, et les tests d’hypothèses porteront sur les paramètres de la loi normale : la moyenne µ et la variance σ2, ainsi qu’à la différence entre deux moyennes (une des situations élémentaires les plus courantes) et au rapport de deux variances. D’autres lois interviendront pour décrire le comportement de variables calculées à partir des observations : la loi de Student, la loi khi-deux, la loi de Fisher.

Les exercices sont de deux types. L’un invite l’étudiante à appliquer les techniques décrites dans le chapitre.  L’autre lui propose de développer des techniques dans des situations nouvelles, non traitées dans le chapitre.  Leur but étant surtout de renforcer la maîtrise de la théorie, les situations présentées ne servent parfois qu’à cette fin et si elles ne sont donc pas toutes parfaitement réalistes, il faut se rappeler que ce n’est pas leur but premier.