Estimates of Sampling Error
les erreurs de sondage peuvent être évaluées statistiquement. L’échantillon sélectionné pour l’EDSBF-III n’est qu’un parmi un grand nombre d’échantillons de même taille qui peuvent être sélectionnés dans la même population avec le même plan de sondage. Chacun de ces échantillons peut produire des résultats peu différents de ceux obtenus avec l’échantillon actuellement choisi. L’erreur de sondage est une mesure de cette variabilité entre tous les échantillons possibles. Bien que cette variabilité ne peut pas être mesurée exactement, elle peut être estimée cependant, à partir des données collectées.
L'erreur-type (ET) est un indice particulièrement utile pour mesurer l'erreur de sondage d'un paramètre (moyenne, proportion ou taux), elle est la racine carrée de la variance du paramètre. L’erreurtype peut être utilisée pour calculer des intervalles de confiance dans lesquels nous considérons se trouver la vraie valeur du paramètre avec un certain niveau de confiance. Par exemple, la vraie valeur d’un paramètre se trouve dans les limites de sa valeur estimée plus ou moins deux fois de son erreur-type, avec un niveau de confiance de 95 %.
Si l'échantillon avait été tiré d'après un plan de sondage aléatoire simple, il aurait été possible d'utiliser des formules simples pour calculer les erreurs de sondage. Cependant, l'échantillon de l’EDSBF-III étant un échantillon stratifié et tiré à deux degrés, des formules plus complexes ont été utilisées. Le module « erreurs de sondage » du logiciel ISSA a été utilisé pour calculer les erreurs de sondage suivant la méthodologie statistique appropriée. Ce module utilise la méthode de linéarisation (Taylor) pour des estimations telles que les moyennes ou proportions, et la méthode de Jackknife pour des estimations plus complexes tels que l'indice synthétique de fécondité et les quotients de mortalité.
Il existe un deuxième indice très utile qui est la racine carrée de l'effet du plan de sondage (REPS) ou effet de grappe : c'est le rapport de l'erreur-type observée sur l'erreur-type qu'on aurait obtenue si un sondage aléatoire simple avait été utilisé. Cet indice révèle dans quelle mesure le plan de sondage qui a été choisi se rapproche d'un échantillon aléatoire simple de même taille : la valeur 1 de la REPS indique que le plan de sondage est aussi efficace qu'un échantillon aléatoire simple, alors qu'une valeur supérieure à 1 indique un accroissement de l'erreur de sondage dû à un plan de sondage plus complexe et moins efficace au point de vue statistique. Le logiciel calcule aussi l'erreur relative et l'intervalle de confiance pour chaque estimation.
Les erreurs de sondage pour l’EDSBF-III ont été calculées pour certaines des variables les plus pertinentes. Les résultats sont présentés dans cette annexe pour l'ensemble du pays, le milieu urbain, le milieu rural et les treize régions administratives. Pour chaque variable, le type de statistique (moyenne, proportion ou taux) et la population de base sont présentés dans le tableau B.1. Les tableaux B.2 à B.17 présentent la valeur de la statistique (M), l'erreur-type (ET), le nombre de cas non-pondérés (N) et pondérés (N'), la racine carrée de l'effet du plan de sondage (REPS), l'erreur relative (ET/M), et l'intervalle de confiance à 95 % (M±2ET) pour chaque variable. L’effet du plan de sondage (REPS) est non-défini quand l'écart type sous l'échantillon aléatoire simple est zéro (quand l'estimation est proche de 0 ou 1). Dans le cas de l'indice synthétique de fécondité, le nombre de cas non-pondérés n'est pas pertinent, car la valeur non-pondérée de femmes-années d'exposition au risque de grossesse n'est pas connue.
L'intervalle de confiance est interprété de la manière suivante : pour la variable Enfants nés vivants, l’EDSBF-III a donné un nombre moyen d'enfants nés vivants de 3,308 pour l'ensemble des femmes, auquel correspond une erreur-type de 0,037 enfants. Dans 95 % des échantillons de taille et caractéristique identiques, la valeur réelle du nombre moyen d'enfants nés vivants des femmes âgées de 15 à 49 ans se trouve entre 3,308 - 2×0,037 et 3,308 + 2×0,037, soit 3,234 et 3,381.
Les erreurs de sondage ont été analysées pour l'échantillon national de femmes et pour deux groupes d'estimations : (1) moyennes et proportions, et (2) taux démographiques. Les erreurs relatives (ET/M) des moyennes et proportions se situent entre 0,6 % et 32,6 % avec une moyenne de 4,8 %. Les erreurs relatives les plus élevées sont généralement celles des estimations de très faible valeur (parexemple, parmi les femmes actuellement en union qui Utilise actuellement la stérilisation féminine). Si on enlève les estimations de très faible valeur (moins de 10 %), la moyenne tombe à 3,0 %. Ainsi, en général, les erreurs relatives de la plupart des estimations pour l'ensemble du pays sont faibles, sauf dans le cas de très faibles proportions. L'erreur relative de l'indice de fécondité est assez faible 2,1 %. Cependant, pour les taux de mortalité, l'erreur relative moyenne est plus élevée 4,9%.
Il existe des différences entre les erreurs relatives au niveau des sous-échantillons. Par exemple, pour la variable Enfants nés vivants des femmes âgées de 40 à 49 ans, l'erreur relative pour l’échantillon de femmes est respectivement de 1,1 %, 2,7 % et 3,6 % pour l'ensemble du pays, le milieu urbain et le Centre-Nord.
Pour l'échantillon national de femmes, la moyenne de la racine carrée de l'effet du plan de sondage (REPS) calculée pour l'ensemble des estimations est de 1,71 ce qui veut dire que, par rapport à un échantillon aléatoire simple, l’erreur de sondage est multipliée en moyenne par un facteur de 1,71 parce qu’on utilise un plan de sondage complexe (par grappes et à plusieurs degrés) et moins efficace.