Estimates of Sampling Error
Les erreurs de sondage peuvent être évaluées statistiquement. L'échantillon sélectionné pour l'EPSF 2003-2004 n'est qu'un parmi un grand nombre d'échantillons de même taille qui peuvent être sélectionnés dans la même population avec le même plan de sondage. Chacun de ces échantillons peut produire des résultats peu différents de ceux obtenus avec l'échantillon actuellement choisi. L'erreur de sondage est une mesure de cette variabilité entre tous les échantillons possibles. Bien que cette variabilité ne puisse pas être mesurée exactement, mais elle peut être estimée à partir des données collectées.
L'erreur-type (ET) est un indice particulièrement utile pour mesurer l'erreur de sondage d'un paramètre (moyenne, proportion ou taux), elle est la racine carrée de la variance du paramètre. L'erreur type peut être utilisée pour calculer des intervalles de confiance dans lesquels se situe la vraie valeur du paramètre avec un certain niveau de confiance. Par exemple, la vraie valeur d'un paramètre se trouve dans les limites de sa valeur estimée plus ou moins deux fois son erreur-type, avec un niveau de confiance de 95 %.
Si l'échantillon avait été tiré d'après un plan de sondage aléatoire simple, il aurait été possible d'utiliser des formules simples pour calculer les erreurs de sondage. Cependant, l'échantillon de l'EPSF 2003-2004 étant un échantillon stratifié et tiré à deux degrés, des formules plus complexes ont été utilisées. Le module « erreurs de sondage » du logiciel ISSA a été utilisé pour calculer les erreurs de sondage suivant la méthodologie statistique appropriée. Ce module utilise la méthode de linéarisation (Taylor) pour des estimations telles que les moyennes ou proportions, et la méthode de Jackknife pour des estimations plus complexes tels que l'indice synthétique de fécondité et les quotients de mortalité.
La méthode de Jackknife dérive les estimations des taux complexes à partir de chacun des souséchantillons de l'échantillon principal, et calcule les variances de ces estimations avec des formules simples. Chaque sous-échantillon exclut une grappe dans les calculs des estimations. Ainsi, des souséchantillons pseudo-indépendants ont été créés. Dans l'EPSF 2003-2004, il y a 480 grappes non-vides. Par conséquent, 480 sous-échantillons ont été créés.
Il existe un deuxième indice très utile qui est la racine carrée de l'effet du plan de sondage (REPS) ou effet de grappe : c'est le rapport de l'erreur-type observée sur l'erreur-type qu'on aurait obtenue si un sondage aléatoire simple avait été utilisé. Cet indice révèle dans quelle mesure le plan de sondage qui a été choisi se rapproche d'un échantillon aléatoire simple de même taille : la valeur 1 de la REPS indique que le plan de sondage est aussi efficace qu'un échantillon aléatoire simple, alors qu'une valeur supérieure à 1 indique un accroissement de l'erreur de sondage dû à un plan de sondage plus complexe et moins efficace au point de vue statistique. Le logiciel calcule aussi l'erreur relative et l'intervalle de confiance pour chaque estimation.
Les erreurs de sondage pour l'EPSF 2003-2004 ont été calculées pour certaines des variables les plus intéressantes. Les résultats sont présentés en annexe du Rapport Final pour l'ensemble du pays, le milieu urbain et le milieu rural. Pour chaque variable, le type de statistique (moyenne, proportion ou taux) et la population de base sont présentés dans le tableau B.1 du Rapport Final. Les tableaux B.2 à B.4 présentent la valeur de la statistique (M), l'erreur-type (ET), le nombre de cas non-pondérés (N) et pondérés (N'), la racine carrée de l'effet du plan de sondage (REPS), l'erreur relative (ET/M), et l'intervalle de confiance à 95 % (M±2ET) pour chaque variable. L'effet du plan de sondage (REPS) est non-défini quand l'écart type sous l'échantillon aléatoire simple est zéro (quand l'estimation est proche de 0 ou 1). Dans le cas de l'indice synthétique de fécondité, le nombre de cas non-pondérés n'est pas pertinent, car la valeur non-pondérée de femmes-années d'exposition au risque de grossesse n'est pas connue.
L'intervalle de confiance est interprété de la manière suivante : pour la variable Enfants nés vivants, l'EPSF 2003-2004 a donné un nombre moyen d'enfants nés vivants de 1,887 pour l'ensemble des femmes, auquel correspond une erreur-type de 0,026 enfants. Dans 95% des échantillons de taille et de caractéristique identiques, la valeur réelle du nombre moyen d'enfants nés vivants des femmes âgées de 15 à 49 ans se trouve entre 1,887 - 2×0,026 et 1,887 + 2×0,026, soit 1,835 et 1,939.
Les erreurs de sondage ont été analysées pour l'échantillon national de femmes et pour deux groupes d'estimations : (1) moyennes et proportions, et (2) taux démographiques. Les erreurs relatives (ET/M) des moyennes et proportions se situent entre 0,1 % et 9,7 % avec une moyenne de 2,7 %. Les erreurs relatives les plus élevées sont généralement celles des estimations de très faible valeur (par exemple, parmi les femmes actuellement mariées qui Utilise actuellement le condom). Si on enlève les estimations de très faible valeur (moins de 10 %), la moyenne tombe à 1,9 %. Ainsi, en général, les erreurs relatives de la plupart des estimations pour l'ensemble du pays sont faibles, sauf dans le cas de très faibles proportions. L'erreur relative de l'indice de fécondité est assez faible, soit 2,4 %. Cependant, pour les taux de mortalité, l'erreur relative moyenne est plus élevée, soit 8,6 %.
Il existe des différences entre les erreurs relatives au niveau des sous-échantillons. Par exemple, pour la variable Enfants nés vivants des femmes âgées de 40 à 49 ans, l'erreur relative pour l'échantillon de femmes est respectivement de 1,6 %, 2,0 % et 2,4 % pour l'ensemble du pays, le milieu urbain et le milieu rural.
Pour l'échantillon national de femmes, la moyenne de la racine carrée de l'effet du plan de sondage (REPS) calculée pour l'ensemble des estimations est de 1,29 ce qui veut dire que, par rapport à un échantillon aléatoire simple, l'erreur de sondage est multipliée en moyenne par un facteur de 1,29 parce qu'on utilise un plan de sondage complexe (par grappes et à plusieurs degrés) et moins efficace.