Chapitre 7 : Tests d’hypothèses – Données qualitatives

Chapitre 7 : Tests d’hypothèses – Données qualitatives 2018-06-14T17:41:53+00:00
PDF

Dans plusieurs domaines, en particulier dans les sciences sociales et humaines, les expériences et enquêtes donnent lieu à des données qualitatives complexes, et les hypothèses à tester se présentent sous une multitude de formes.  Ce chapitre traite de plusieurs tests classiques, dont un test d’ajustement et un test d’indépendance.

Test pour une proportion et test d’égalité deux proportions. Test d’uniformité, test d’ajustement, test d’indépendance. Données appariées (test de McNemar). Somme de variables khi-deux indépendantes. Comparaisons multiples; méthode de Hochberg. Quelques problèmes résolus.

Test pour une proportion et test d’égalité deux proportions. Test d’uniformité, test d’ajustement, test d’indépendance. Données appariées (test de McNemar).  Somme de variables khi-deux indépendantes.  Comparaisons multiples; méthode de Hochberg.  Quelques problèmes résolus.

Au chapitre 6, les observations d’un échantillon X1X2, …, Xn représentent des quantités mesurées — des poids, des longueurs, des résultats de tests psychométriques, etc. Nous passons maintenant aux données dites qualitatives ou catégorielles: chaque élément de l’échantillon est catégorisé, et les observations sont des décomptes: le nombre d’observations appartenant à telle ou telle catégorie.

Il sera donc question de proportions là où il était question de moyennes au chapitre 6.  Lorsque les données représentent une classification en deux catégories (succès et échec) le paramètre d’intérêt est normalement une proportion ou une probabilité : la probabilité qu’une personne tirée dans une population appartienne à un groupe culturel donné; ou la probabilité qu’une pièce fabriquée soit défectueuse.  On voudra donc tester une hypothèse du genre p = po, où po est une valeur donnée.

Ce problème est généralisé lorsque chaque observation est classée en plus d’une catégorie.  C’est le cas, par exemple, lorsqu’on demande à une cliente de coter la qualité du service reçu sur une échelle de 1 à 5.  Le modèle est caractérisé par un vecteur de 4 probabilités p = [p1 ; p2 ; p3 ; p4] (p5, étant fonction des quatre premiers, p5 = 1 ‑ (p1p2p3p4) n’est pas un cinquième paramètre indépendant). L’hypothèse qui correspond à p = po est p = po, où po est un vecteur de probabilités fixes.  Ce test est appelé test d’ajustement.  Lorsque les composantes de po sont égales, on parlera d’un test d’uniformité.

Lorsqu’on compare deux groupes, un groupe expérimental et un groupe témoin et les données observées sont qualitatives (par exemple lorsque l’efficacité d’un traitement est mesurée par le taux de succès), on testera plutôt l’hypothèse p1p2 ou p1 et p2 sont les probabilités de succès dans les deux groupes. Là aussi le problème se généralise au cas de deux vecteursp1 et p2.

Et se généralise plus encore : certains modèles s’expriment en fonction de plusieurs vecteurs de probabilité, p1p2, …, pk et l’hypothèse à tester sera p1p2 = … = pk. Ce test est appelé test d’indépendance.