Estimates of Sampling Error
Les estimations obtenues à partir d'une enquête par sondage sont sujettes à deux types d'erreurs, les erreurs de mesure et les erreurs de sondage. On appelle erreurs de mesure les biais imputables à la mise en oeuvre de la collecte et de l'exploitation des données telles que l'omission de ménages sélectionnés, la mauvaise interprétation des questions, soit de la part de l'enquêtrice, soit de la part de l'enquêté, ou encore les erreurs de saisie des données.
Bien que tout le possible ait été fait pour minimiser ce type d'erreur pendant la mise en oeuvre de I'EDSB-I, il est difficile d'éviter et d'évaluer toutes les erreurs de mesure. Par contre, les erreurs de sondage peuvent être évaluées statistiquement. Les estimations qui figurent dans ce rapport ont été obtenues à partir d'un échantillon de 5 491 femmes âgées de 15 à 49 ans et de 1 535 hommes âgés de 20 à 64 ans. Si l'enquête avait été effectuée auprès d'autres enquêtés, on a tout lieu de penser que les fréquences des réponses auraient été très peu différentes de celles que l'on a présentées. C'est l'incertitude de cette assomption que reflète l'erreur de sondage; celle-ci permet donc de mesurer le degré de variation des réponses suivant l'échantillon. L'erreur-type (ET) est un indice particulièrement utile pour mesurer l'erreur de sondage d'un paramètre (moyenne ou proportion). On l'estime à partir de la variance des réponses dans l'échantillon même : l'erreurtype est la racine carrée de la variance. Cet indice a pour propriété que dans 95 % des échantillons de taille et de caractéristique identiques, la valeur vraie d'un paramètre pour l'ensemble d'une population se trouve à l'intérieur de l'intervalle de ± 2 ET.
Si l'échantillon des femmes ou des hommes avait été tiré d'après un plan de sondage aléatoire simple, il aurait été possible d'utiliser des formules simples pour calculer les erreurs de sondage. Cependant, l'échantillon de rEDSB-I est un échantillon stratifié à deux degrés. Par conséquent, on a besoin d'utiliser des formules plus complexes. Le module « erreurs de sondage » du logiciel ISSA a été utilisé pour calculer les erreurs de sondage suivant la méthodologie statistique appropriée. Ce module utilise la méthode de linéarisation (Taylor) pour les estimations qui sont des moyennes ou proportions. La méthode de Jackknife a été utilisée pour les estimations plus complexes telles que l'indice synthétique de fécondité et les quotients de mortalité.
Il existe un deuxième indice très utile qui est la racine carrée de l'effet du plan de sondage (REPS) ou effet de grappe : c'est le rapport de l'erreur-type observée sur l'erreur-type qu'on aurait obtenue si on avait eu recours à un sondage aléatoire simple. Cet indice révèle dans quelle mesure le plan de sondage qui a été choisi se rapproche d'un échantillon aléatoire simple de même taille : la valeur 1 de la REPS indique que le plan de sondage est aussi efficace qu'un échantillon aléatoire simple, alors qu'une valeur supérieure à 1 indique un accroissement de l'erreur de sondage dU à un plan de sondage plus complexe et moins efficace au point de vue statistique. Le logiciel calcule aussi l'erreur relative et l'intervalle de confiance pour chaque estimation. Les erreurs de sondage pour rEDSB-I ont été calculées pour certaines des variables les plus intéressantes. Les résultats sont présentés dans cet annexe pour l'ensemble du pays, le milieu urbain et le milieu rural et les six départements. Pour chaque variable, le type de statistique (moyenne ou proportion) et la population de base sont présentés dans le tableau B.1. Les tableaux B.2 à B.10 présentent la valeur de la statistique (M), l'erreur-type (ET), le nombre de cas non-pondérés (N) et pondérés (N'), la racine carrée de l'effet du plan de sondage (REPS), l'erreur relative (ET/M), et l'intervalle de confiance à 95 % (M±2ET) pour chaque variable. On considère que la REPS est non-définie quand l'écart-type sous l'échantillon aléatoire simple est zéro (quand l'estimation est proche de 0 ou 1). Dans le cas de l'indice synthétique de fécondité, le nombre de cas non-pondérés n'est pas pertinent, car la valeur non-pond~rée de femmes-années d'exposition au risque de grossesse n'est pas connue.
On interprète l'intervalle de confiance de la manière suivante : pour la variable Enfants nés vivants aux femmes âgées de 15-49 ans, I'EDSB-I a donné un nombre moyen d'enfants nés vivants de 3,437 pour l'ensemble des femmes, auquel correspond une erreur-type de 0,051 enfant. La fourchette dans laquelle se place la moyenne ± 2 ET est donc 3,335 et 3,539. La probabilité que la vraie valeur du nombre moyen d'enfants nés vivants des femmes ãgées de 15 à 49 ans soit à l'intérieur de cet intervalle est de 95 %. On a analysé les erreurs de sondage pour l'échantillon national de femmes et pour deux groupes d'estimations : (1) moyennes et proportions de valeur supérieure ou égale à 1%, et (2) taux démographiques. Les erreurs relatives (ET/M) des moyennes et proportions se situent entre 1,1% et 17,5 % avec une moyenne de 4,3 %; les erreurs relatives les plus élevées sont celles des très faibles estimations (par exemple, parmi les femmes actuellement en union qui Utilisent la pilule). Si on enlève les estimations de très faible valeur (moins de 10 %), la moyenne tombe à 3,3 %. Ainsi, en général, les erreurs relatives de la plupart des estimations pour l'ensemble du pays sont faibles, sauf dans le cas de très faibles proportions. L'erreur relative de l'indice de fécondité est assez faible (2,1%). Cependant, pour les taux de mortalité, l'erreur relative moyenne est un peu plus élevé (6,2 %).
On remarque certaines différences dans les erreurs relatives au niveau des sous-échantillons : par exemple, pour la variable Enfants nés vivants aux femmes âgées de 15 à 49 ans, l'erreur relative en tant que pourcentage de la moyenne estimée est de 1,5 %, 3,4 % et 4,7 % pour, respectivement, l'ensemble des femmes du pays, pour celles de l'ensemble urbain et pour celles du département de l'Atlantique.
Pour l'échantillon national de femmes, la moyenne de l'effet du plan de sondage (REPS) calculée pour l'ensemble des estimations est de 1,4 ce qui veut dire que, par rapport à un échantillon aléatoire simple, la variance est multipliée par un facteur de 1,45 = 1,96 parce qu'on utilise un plan de sondage complexe (par grappes et à plusieurs degrés).