Chapitres

La notion d’échantillonnage, qui consiste à se fonder sur des observations aléatoires afin d’estimer des paramètres, est présente dans presque toutes les applications de la statistique. C’est encore ce qu’on fait dans ce cours : on estime une moyenne, une proportion, une variance, un ratio, etc. à prtir des données d'un échantillon. Mais pourquoi ce cours—et seul celui-ci—porte-t-il ce nom? 

Ce qui caractérise son contenu, c’est le fait que l’action d’échantillonner est au cœur de ses préoccupations.  D’abord, l’échantillon est tiré d’une population finie et sa taille est connue.  Ensuite, les éléments de la population (appelés « unités » dans ce contexte), sont généralement des objets bien concrets : les ménages d’une ville, les employés d’une compagnie, les sièges sociaux installés dans une ville, les étudiants d’une ou de plusieurs universités. Ses unités sont identifiées : on en a au moins une liste.  Et souvent, on dispose de données auxiliaires sur toutes les unités de la population. Pour une population d’entreprises, par exemple, des données publiques permettent d’assigner une mesure de la taille de l’entreprise.

Le fait que la population n'est pas totalement inconnue offre plusieurs possibilités quant à la façon de tirer l’échantillon. Chaque mode de tirage soulève une problématique nouvelle : comment estimer les paramètres? Car les propriétés d’un estimateur dépendent fortement du mode de tirage.  La moyenne d’un échantillon peut être un bon estimateur ou un mauvais estimateur de la moyenne de la population, dépendant de la façon dont l’échantillon a été tiré.

Dans un contexte donné, c’est-à-dire, une population, les paramètres à estimer, et les informations disponibles, on se posera inévitablement les questions suivantes : comment tirer l’échantillon et comment estimer les paramètres.

L’échantillonnage prend une importance croissante dans plusieurs domaines. Pour n'en donner qu'un : la vérification comptable.  Une vérificatrice fait face à un nombre colossal de comptes dont elle doit certifier la conformité à certaines normes. Elle ne pourra procéder que par échantillonnage. Par souci de transparence, elle doit révéler sa méthodologie, donc préciser non seulement que l’échantillon a été tiré « au hasard » —ce qui dans le passé voulait dire « n’importe comment »—, mais quel est, précisément son mode de tirage et quels sont ses estimateurs.  Dans un contexte de litige, en particulier, il peut être coûteux de se soustraire à cette obligation.