Réaliser un sondage d’opinion c’est mesurer certaines variables d’une population en interrogeant une partie de celle-ci (échantillon) jugée représentative de l’ensemble.
Principe du sondage :
Prenons une population mère sur laquelle on souhaite mesurer une variable, exemple : taux de possession d’une TV couleur. On pourra :
Procéder à un recensement, mais avec comme défaut un coût d’enquête maximum et un délai de réalisation important.
Interroger une partie de la population mère (un échantillon jugé représentatif), avec certes une marge d’erreur mais avec une précision suffisante du point de vu commercial (notion d’efficience dans la collecte des informations)
Historique :
Le sondage n’est pas une invention française. C’est au Etats-Unis, lors de la campagne présidentielle de 1936 qu’il fut utilisé pour la première fois avec succès.
En France, les premiers sondages d’opinion ont été réalisés en 1938 par Jean Stoetzel, fondateur de l’IFOP.
Les pratiques de sondage d’opinion se sont depuis généralisées à tous les acteurs de la société.
La représentativité de l’échantillon
Constituer un échantillon représentatif c’est faire en sorte que les composantes essentielles de sa population de référence figurent dans l’échantillon, dans des proportions identiques.
A cette condition, les résultats observés sur l’échantillon peuvent être extrapolés à l’ensemble de sa population de référence.
Autrement dit, on qualifie de représentatif un échantillon, à partir du moment où il reflète le plus exactement possible sa population de référence, tant dans sa diversité que dans ses proportions.
Pour prélever un échantillon représentatif, on peut recourir à 2 familles de méthodes : les méthodes probabilistes et les méthodes empiriques.
Les méthodes probabilistes
Elles peuvent être simples ou adaptées. Dans tous les cas, elles reposent sur des mêmes principes :
- On doit disposer d’une base de sondage, c’est à dire d’une liste complète et actualité des individus (unités de sondage) qui appartiennent à l’univers de l’étude.
- Il doit y avoir équiprobabilité de désignation des unités de sondage : chaque unité de sondage doit avoir la même chance d’être désignée.
La méthode probabiliste simple
On dispose d’une base de sondage des individus (ou des entreprises) qui appartiennent à un univers d’étude. Les unités de sondage seront désignées par une méthode de prélèvement aléatoire (table de hasard, nombres aléatoires…) et chaque unité désignée sera interviewée.
Cette méthode présente de nombreuses limites : difficulté voire impossibilité d’obtenir une base de sondage, dispersion des individus à interviewer.
Elle est très peu utilisée par les cabinets d’études, sauf dans des situations bien précises : enquête au sein d’un fichier clients, population très homogène et facilement repérable (les médecins, les architectes…).
Pour palier à certaines de ces limites, on peut recourir à des méthodes probabilistes adaptées. On distingue 2 principales méthodes adaptées : la méthode des strates et celle de grappes.
L’échantillonnage stratifié
Stratifier un échantillon c’est diviser la base de sondage en groupes homogènes appelés strates, puis à prélever l’échantillon au prorata du poids de chaque strate.
Exemple : On vous demande d’évaluer le budget de formation des entreprises de votre région. On peut penser que ce budget dépend des effectifs employés par les entreprises. On divisera alors la population en 3 groupes d’entreprises : les petites, les moyennes et les grandes. On recherchera des informations statistiques sur le nombre d’entreprises appartenant à chacun de ces 3 groupes et on prélèvera l’échantillon en tenant compte de leurs poids.
Le principal avantage de cette méthode est d’apporter plus de précision dans les résultats obtenus. En effet, l’écart type sera plus réduit et donc la dispersion autour du résultat moyen sera plus faible.
On peut aussi stratifier par régions, voire par communes. Dans ce cas on parle d’un prélèvement au prorata du poids des régions.
Une variante de cette méthode, appelée stratifié non proportionnelle consiste à volontairement sur-représenter le poids de certaines strates d’effectif faible, afin de pouvoir mieux étudier les interactions entre variables, visibles par des tris croisés.
Exemple : Vous souhaitez mesurer l’incidence du niveau d’étude des parents sur les pratiques de lecture des enfants. Dans le cadre d’un stratifié proportionnel, on peut penser que les parents ayant un niveau d’étude supérieur seront peu représentés. De ce fait, cette sous population aura un effectif trop réduit pour valider vos observations (les tris croisés ne seront pas statistiquement significatifs). La solution consiste alors à interroger le même nombre de parents, quels que soient les niveaux d”étude. Chacune des sous-populations ayant alors la même taille, vous pourrez plus aisément vérifier, par des croisements, si le niveau d’étude est un facteur pertinent pour expliquer des différences dans les pratiques de lecture des enfants.
Dans ce cas, l’échantillon est volontairement non représentatif car il majore le poids de certaines sous-populations. Les résultats à plats doivent donc être redressés pour une l’interprétation d’ensemble.
La méthode des grappes
Une population peut être considérée comme un ensemble de groupes d’individus appelés grappes. Les ménages sont des groupes d’individus, les immeubles des groupes de ménages, les vols des groupes de passager, un lycée est constitué de classes qui sont des groupes d’élèves, les bureaux de vote sont des groupes d’électeurs, etc.
La base de sondage n’est plus constituée par les individus mais par les grappes. Exemple : base de sondage constituée par les bureaux de votes, ou encore la division d’une ville en quartiers. Chaque unité peut également être subdivisée : on tire au hasard des avions et au sein des avions quelques passagers seront interrogés (tirage à plusieurs degrés).
Exemple de sondage à plusieurs degrés : dans le cadre d’un sondage électoral, je constitue une base de sondage avec les bureaux de vote. Je désigne au hasard une trentaine de bureaux de vote. Dans chaque bureau j’envoie un enquêteur qui notera et me communiquera le résultat des 30 premiers dépouillements.
A l’inverse du stratifié, la diversité (hétérogénéité) des unités de sondage au sein des groupes provoque une plus grande dispersion (écart type) et donc une plus grande imprécision dans les résultats obtenus. Par contre, la constitution de l’échantillon est plus facile et les individus à interviewer sont moins dispersés.
Une variante de sondage à plusieurs degrés appelée sondage aréolaire consiste par exemple à diviser la Réunion en zones géographiques de densité démographique équivalente : 700 zones de 1000 habitants, par exemple. La base de sondage est alors constituée d’une liste des zones numérotées de 1 à 700 dont 30 au moins seront désignées aléatoirement. Au sein de chaque grappe, un enquêteur interrogera un certain nombre d’individus ou relèvera un certain nombre d’observations (plancher commercial, équipement urbains…)
Les méthodes empiriques
Dans une majorité des cas, les cabinets d’études ne disposent pas de base de sondage. Ils utiliseront alors des méthodes empiriques.
L’échantillon de convenance
Un échantillon est qualifié de convenance s’il ne repose sur aucune méthode qui garantit à priori sa représentativité. Exemple : j’interroge les gens dans la rue ou les clients à la sortie d’un hypermarché.
On peut améliorer sa représentativité en donnant aux enquêteurs des consignes de prélèvement et en s’efforçant de reproduire au mieux les conditions du hasard.
La méthode des quotas
Principes : L’échantillon sera représentatif s’il reproduit à l’identique des caractères socio-démographiques présents dans la population mère.
Ainsi, si dans une population il y a 52% d’hommes et 25% de 25/35 ans, L’échantillon de 1000 personnes comportera 520 hommes, 250 25/35 ans ….
L’enquêteur est donc libre d’interroger qui il veut, à condition de respecter les quotas. Pour ce faire, il dispose d’une feuille de quota. On a le plus souvent recours à des critères de quota socio-démographiques : age, sexe, CSP.
Mise en œuvre : Cette méthode, très pratiquée par les cabinets d’étude, est donnée comme facile à mettre en œuvre sous réserve d’une bonne organisation terrain et de critères réellement corrélés avec le sujet d’étude.
La fiabilité de cette méthode est comparable à celle obtenue par les méthodes probabilistes.
Conclusion
- Dans de nombreuses situations d’études, on a recours à une combinaison des méthodes empiriques et probabilistes. Par exemple, on couplera un prélèvement à plusieurs degrés avec une méthode de route au hasard, ou encore une stratification géographique avec une méthode des quotas (très fréquent).
- Quelle que soit la méthode utilisée il faut, une fois l’enquête réalisée, comparer la composition de l’échantillon avec des données de référence (INSEE). S’il y a un écart (pas trop important), on peut procéder à un redressement de l’échantillon. Il faut toutefois tenir compte de l’ancienneté des données INSEE et de l’évolution rapide de certaines variables.
- Il convient de qualifier la représentativité : degré de représentativité, précautions de lecture ; davantage que de trancher : échantillon représentatif ou pas représentatif.
- La non-représentativité n’empêche pas l’étude des interactions (tris croisés). En fait, une bonne représentativité est uniquement nécessaire pour l’extrapolation des résultats d’ensemble (les tris à plats).
- Une bonne représentativité ne suffit pas à garantir la pertinence de l’information recueillie. Il existe de nombreuses sources d’erreur dans une enquête (questionnaire, saisie, interprétation…).
- Il n’existe aucun rapport entre la représentativité et la taille de l’échantillon. Cependant, un échantillon d’effectif trop faible ne permet pas une bonne utilisation des résultats.
Bonjour, vous parler de la méthode des quotas mais comment définit-on la proportion de personnes à interroger par rapport à notre base de sondage pour que cela soit représentatif. Par exemple si j’ai une base de sondage de 22000 personnes combien dois-je en interroger pour que cela soit représentatif.