Tests d'hypothèses données qualitatives | Statistique Chapitre 7

PDF

Dans plusieurs domaines, en particulier dans les sciences sociales et humaines, les expériences et enquêtes donnent lieu à des données qualitatives complexes, et les hypothèses à tester se présentent sous une multitude de formes. Ce chapitre traite de plusieurs tests classiques, dont un test d’ajustement et un test d’indépendance.

Test pour une proportion et test d’égalité deux proportions. Test d’uniformité, test d’ajustement, test d’indépendance. Données appariées (test de McNemar). Somme de variables khi-deux indépendantes. Comparaisons multiples; méthode de Hochberg. Quelques problèmes résolus.

Au chapitre 6, les observations d’un échantillon X₁, X₂, …, X_n représentent des quantités mesurées — des poids, des longueurs, des résultats de tests psychométriques, etc. Nous passons maintenant aux données dites qualitatives ou catégorielles: chaque élément de l’échantillon est catégorisé, et les observations sont des décomptes: le nombre d’observations appartenant à telle ou telle catégorie.

Il sera donc question de proportions là où il était question de moyennes au chapitre 6. Lorsque les données représentent une classification en deux catégories (succès et échec) le paramètre d’intérêt est normalement une proportion ou une probabilité p : la probabilité qu’une personne tirée dans une population appartienne à un groupe culturel donné; ou la probabilité qu’une pièce fabriquée soit défectueuse. On voudra donc tester une hypothèse du genre p = p_o, où p_o est une valeur donnée.

Ce problème est généralisé lorsque chaque observation est classée en plus d’une catégorie. C’est le cas, par exemple, lorsqu’on demande à une cliente de coter la qualité du service reçu sur une échelle de 1 à 5. Le modèle est caractérisé par un vecteur de 4 probabilités p = [p₁ ; p₂ ; p₃ ; p₄] (p₅, étant fonction des quatre premiers, p₅ = 1 ‑ (p₁ + p₂ + p₃ + p₄) n’est pas un cinquième paramètre indépendant). L’hypothèse qui correspond à p = p_o est p = p_o, où p_o est un vecteur de probabilités fixes. Ce test est appelé test d’ajustement. Lorsque les composantes de p_o sont égales, on parlera d’un test d’uniformité.

Lorsqu’on compare deux groupes, un groupe expérimental et un groupe témoin et les données observées sont qualitatives (par exemple lorsque l’efficacité d’un traitement est mesurée par le taux de succès), on testera plutôt l’hypothèse p₁ = p₂ ou p₁ et p₂ sont les probabilités de succès dans les deux groupes. Là aussi le problème se généralise au cas de deux vecteurs, p₁ et p₂.

Et se généralise plus encore : certains modèles s’expriment en fonction de plusieurs vecteurs de probabilité, p₁, p₂, …, p_k et l’hypothèse à tester sera p₁ = p₂ = … = p_k. Ce test est appelé test d’indépendance.