En théorie, plus la taille de l’échantillon est importante, plus la marge d’erreur est réduite et donc plus les résultats sont précis.
Une estimation de la précision des résultats peut être calculée par la formule d’échantillonnage (dans le cadre d’une méthode probabiliste mais souvent utilisée comme indicateur quelque soit la méthode) :
Dans le cadre d'une intervalle de confiance de 95% :
N = population mère
n = taille de l'échantillon
p = probabilité de réponse positive
q = = 1-p
E = erreur acceptée
4 pq
n > ------
(E)2
ou E = +/- 2 racine (pq)/ n
Si p est connu : si p inconnu : on pose p = 0,5
Dans les faits, pour déterminer la taille de l’échantillon, on tient compte surtout des contraintes de l’étude (budget, temps, moyens humains et informatiques) et de ses objectifs.
Remarques :
Le plus important n’est pas la taille de l'échantillon, mais sa représentativité. Un échantillon important (plus de 800 personnes) n'est nécessaire que si vous recherchez une grande précision dans les résultats d'ensemble, ou si vous mesurer des interactions (tris croisés), ou travailler sur des sous-populations (par exemple diviser l'échantillon en 4 groupes de population selon les régions).
L’erreur d’échantillonnage annoncée par les cabinets d’étude est souvent globale (ensemble des interviewés). Cette erreur augmente lorsqu’on réalise des croisements (sous-population).
Il n’existe aucune relation entre la représentativité de l’échantillon et sa taille. Le taux de sondage (taille de l'échantillon / population de référence) importe donc peu.
On a tort de réduire l’erreur dans les sondages à la seule erreur d’échantillonnage. Dans les faits, un mauvais questionnement, une administration bâclée, des erreurs de saisie ou encore une mauvaise interprétation sont des sources d'erreurs plus importantes.