Caractéristiques de la population
Avant de sélectionner un échantillon, il est nécessaire d’avoir une bonne compréhension de la population dans son ensemble. Il importe de savoir quels types de variables peuvent être étudiés au sein de la population et de déterminer son niveau d’homogénéité. D’autres questions importantes, telles que la disponibilité et la qualité des données, sont abordées plus loin dans ce guide. (Voir la section Analyse de la population.)
Variables continues et variables nominales
Les variables d’intérêt dans une population peuvent être de deux grands types : continues et nominales. Les variables continues sont des variables qui peuvent prendre toutes les valeurs possibles dans un continuum donné. Voici quelques exemples de variables continues :
- la valeur monétaire (par exemple, la valeur d’une transaction, d’un achat ou d’un contrat)
- la distance (par exemple, la distance par rapport au service d’incendie le plus proche)
- le temps (par exemple, le temps d’attente dans une salle d’urgence ou le nombre de jours nécessaires pour traiter une transaction)
- les niveaux de pollution (par exemple, milligrammes de mercure retrouvé dans les poissons)
Parfois, il est nécessaire de classer les unités de la population en fonction d’une variable continue, par exemple en catégorisant des contrats selon leur valeur monétaire (faible, moyenne ou élevée). Ces catégories peuvent ensuite être utilisées pour adapter une stratégie d’échantillonnage.1
Les variables nominales sont non continues. Elles comprennent, par exemple :
- l’état civil (célibataire, marié, séparé, divorcé, veuf)
- la citoyenneté et le statut d’immigrant (citoyen canadien, résident permanent, nouvel immigrant, réfugié)
- le statut d’emploi (travail à temps plein, travail à temps partiel, sans emploi)
- le niveau de scolarité atteint (école primaire, école secondaire, collège, maîtrise, doctorat)
- la situation géographique (continent, pays, province, région, ville, quartier)
- l’administration publique (type d’entité, secteur d’activité, modèle de gouvernance)
Bien que les variables nominales puissent avoir des unités pouvant être classées selon un ordre déterminé, comme les niveaux de scolarité, elles représentent la plupart du temps des catégories distinctes et non hiérarchiques.
La distribution des variables, qu’elles soient nominales ou continues, peut être évaluée à l’aide de diagrammes (histogrammes pour les variables continues et graphiques à barres pour les variables nominales). Comme le montrent les figures 2 et 3, les graphiques sont un outil efficace pour évaluer la distribution d’une population. (La partie 2 du présent guide contient de plus amples renseignements sur la manière d’analyser les populations.)
Source : données tirées de Statistique Canada, Revenu des particuliers selon le groupe d’âge, le sexe et la source de revenu, Canada, provinces et certaines régions métropolitaines de recensement (consulté le 10 décembre 2020)
Source : Institut canadien d’information sur la santé (2019), La main-d’œuvre de la santé, 2018 : indicateurs (d’après les renseignements fournis par l’Association des infirmières et infirmiers du Canada, Certification et perfectionnement professionnel).
1 Il est également possible de recourir à la méthode de l’échantillonnage avec probabilité proportionnelle à la taille, si l’on connaît la taille de chaque unité avant l’échantillonnage, de telle sorte que la probabilité de sélectionner une unité est proportionnelle à sa taille. Cette méthode est similaire à un échantillonnage en unités monétaires dans un audit financier.