PDF

Ce chapitre présente les principes d’un test d’hypothèse et familiarisera le lecteur avec les termes utilisés abondamment dans la littérature scientifique: région critique, valeur p, puissance d’un test. Ces principes seront appliqués à des tests pour une moyenne, une proportion et une variance; ainsi qu’à des tests d’égalité de moyennes et de variances.

Toute expérience ou observation scientifique a pour objectif de confirmer ou d’infirmer une hypothèse.  La démarche est celle-ci : on formule l’hypothèse; on observe des faits pertinents; on rejette l’hypothèse si les observations sont incompatibles avec l’hypothèse.

Que signifie « incompatibles avec l’hypothèse »? Dans certains domaines, cela signifie que quand l’hypothèse est vraie, les données observées sont impossibles. Et par un simple argument par l’absurde, si elles ont en fait été observées, on rejette l’hypothèse.

Mais dans les situations qui nous préoccupent ici, une hypothèse ne détermine pas les conséquences avec certitude : le hasard y est pour beaucoup.  Considérons, par exemple, l’hypothèse « le médicament Tamoxifen ne cause pas le cancer ». On observe, dans un échantillon de sujets qui prennent du Tamoxifen, un taux de cancer anormalement élevé. Cela indique que l’hypothèse est peut-être fausse, mais on ne peut pas la rejeter d’emblée parce que cette observation peut être fortuite : un hasard. On ne peut jamais dire que les observations auraient été impossibles sous l’hypothèse.

Alors on assouplit le critère de rejet : on dira que les données sont « incompatibles avec l’hypothèse » si elles sont non pas impossibles, mais très peu probables sous l’hypothèse. Si un calcul de probabilité révèle que c’est effectivement le cas, on affirme que l’hypothèse est fausse — sachant bien, pourtant, qu’on peut être dans l’erreur.  On ne cherche pas à éliminer l’erreur, on se contente d’en réduire la probabilité.

Un test d’hypothèse est une procédure qui justifie une conclusion quand les données le permettent, ou pas : on affirme que l’hypothèse est fausse, ou on ne l’affirme pas. On peut toujours l’affirmer à tort, mais la procédure est conçue de telle sorte à limiter le risque d’une telle erreur.

Dans un contexte statistique, on entend par « observations » les données d’un échantillon — donc des variables aléatoires. La distribution de ces variables dépend de certains paramètres; les « hypothèses » sont des restrictions concernant ces paramètres.

Remarque Il existe manifestement un lien étroit entre un test d’hypothèse et l’estimation d’un paramètre. La différence est dans la nature de la question posée. Estimer un paramètre, c’est poser la question « quelle est sa valeur? » ou « dans quelle région se situe-t-elle? »  Tester une hypothèse, c’est poser une question du genre « le paramètre est-il être égal à zéro? », ou « la différence entre ces deux paramètres est-elle nulle? ».  L’estimation d’un paramètre aboutit à un nombre ou à un intervalle. Un test aboutit à une conclusion concernant l’hypothèse : on affirme elle est fausse ou on ne l’affirme pas.

Une première section définit les termes et développe la théorie des tests.  Afin d’éviter un traitement purement théorique qui serait presque incompréhensible sans un appui concret, la théorie est développée dans le cadre d’un cas particulier (un test concernant une moyenne). On percevra assez facilement la procédure générale à travers ce cas particulier,  pour pouvoir l’appliquer presque intégralement à tout autre paramètre.

On développera des tests concernant trois paramètres : une moyenne (ou deux); une variance (ou deux); une proportion.  Mais la lectrice sera outillée pour développer des tests dans d’autres contextes.

Les tests développés ici (à l’exception du test sur une proportion) sont basés sur des variables continues.  On réserve le prochain chapitre à de nombreux tests sur des données qualitatives.