Sampling Procedure
OBJECTIFS
On s'est donné comme objectif de constituer un échantillon de 5.000 femmes de 15 à 49 ans, ainsi que de 750 hommes mariés, de manière à représenter les populations de fait correspondantes dans l'ensemble du Burundi. Comme l'enquête devait également appréhender le volet "santé maternelle et infantile", le sous-échantillon des enfants ågés de 3 à 36 mois a été retenu en vue de relever le poids et la taille de ces enfants. Il s'agissait de tous les enfants dont les mères devaient être enquêtées.
Trois petites catégories ont été cependant exclues:
- les personnes résidant dans les camps militaries
- les résidents des internats de filles
- les membres des ménages (rugo en milieu rural) dont le chef est ressortissant d'un pays étranger non limitrophe (c'est-à-dire, autre que le Rwanda, le Zaïre et la Tanzanie).
Nous avons interprété la "taille" de 5.000 pour l'échantillon dans le sens de 5.000 femmes effectivement enquêtées. L'expérience des autres pays africains indique qu'on pourrait prévoir une perte dans l'ordre de 10 pour cent lors des différentes opérations, que ce soit la conséquence:
- d'une couverture incomplète lors du dénombrement des ménages
- des ménages non-contactés
- des ménages qui refusent l'enquête
- des individus (femmes ou maris sélectionnés) non-contactés
- des individus qui refusent l'enquête
- des individus exclus à la suite d'une déclaration erronnée (par exemple femme agée de 49 ans déclarée 50).
Nous avons introduit donc un facteur de correction de 100/90 = 1,111 pour compenser ces pertes dès le début. C'est-à-dire que nous avons adopté l'objectif de tirer un échantillon de 5.555 femmes afin d'en enquêter 5.000.
DONNEES DE BASE
Le Burundi est divisé en
- 15 provinces
- 114 communes (dont Bujumbura en est une)
- 2.454 collines (Bujumbura-viUe exclue)
- 8.050 sous-collines approximativement.
Le pays a été également découpé en 11 régions naturelles selon des critères surtout agricoles mais aussi suivant le mode de vie et la nature de l'habitat. Ces régions ne coupent jamais les limites des collines mais peuvent souvent couper les communes.
Le recensement démographique de 1979 a recensé au total 4.028.420 habitants. A l'époque, le nombre de provinces, celui des communes et même le nombre de collines étaient différents des chiffres cités plus haut. L'effectif total de population a été cependant re-ventilé selon le nouveau découpage jusqu'au niveau des collines, et ensuite enregistré au Département de la Population pour servir aux besoins de l'échantillonnage EDS.
On a disposé également des projections de la population, basées sur le recensement, qui prévoyaient un total, au ler janvier 1987, de 4.922.000 habitants.
La population rurale est extrêmement dispersée. Bien que la densité soit très élevée (180 habitants par km2, environ, en 1987) il n'y a pratiquement pas de villages. Les habitants se groupent en "rugo" (habitations paysannes) qui sont éloignées l'un de l'autre. Au recensement on a estimé 6,3 personnes en moyenne par rugo et 6,6 pour la période actuelle.
D'après le recensement, les femmes de 15 à 49 ans constitueraient 23,7 pour cent de la population. Le chiffre correspondant à Bujumbura serait de 21,6 pour cent. On a supposé les mêmes taux pour 1987.
TAUX DE SONDAGE
Il est évident que le mode de vie de la population urbaine au Burundi est très différent de celui de la population rurale. De plus, le premier mène le deuxième, dans ce sens que les phénomènes de la modernisation paraissent d'abord en milieu urbain et se diffusent peu à peu en milieu rural. La conséquence pour la présente enquête est qu'il importe d'estimer avec précision les résultats relatifs au milieu urbain que nous pouvons considérer comme "groupe-cible" du comportement.
En ce qui concerne la ville de Bujumbura un nouveau périmètre vient d'être établi par l'administration. Nous avons adopté celui-ci pour les besoins de l'enquête. Quant aux autres villes, on considère que seul Gitega possède vraiment le caractère urbain. Une visite sur le terrain a permis de vérifier que, si on met de coté la population institutionnelle, la colline administrative de Nyamugari couvre presque la totalité de la zone urbanisée de cette ville. Vue l'avantage de travailler en termes de collines entières, nous avons adopté cette colline comme définissant le secteur urbain.
Des travaux préliminaires de cartographie ont été effectués pour estimer le taux d'occupation des différents quartiers de la ville de Bujumbura. Suite à ces travaux, on a estimé que la population urbaine est d'environ 180.000, dont 170.000 à Bujumbura, et 10.1300 habitants à Gitega-Ville (colline de Nyamugari). Sur une population totale de 4.922.000 habitants (estimations de 1987), le secteur urbain du Burnndi constituerait donc 3,6 pour cent de la population nationale (3,3 pour cent de la population féminine de 15 à 49 ans). Cela veut dire que dans un échantillon de 5.000 femmes tiré à probabilité égale, on aurait trouvé en moyenne 165 femmes résidant dans le milieu urbain. Avec un échantillon aussi faible il aurait été impossible d'établir des estimations valables relatives à ce secteur.
La solution adoptée a été de suréchantillonner le milieu urbain en appliquant un taux de sondage 5 fois plus élevé qu'en milieu rural.
L'effectif de femmes déduit nous a permis de calculer le taux (F) de sondage, sachant qu'il fallait appliquer un taux 5 fois plus élevé en milieu urbain qu'en milieu rural et que nous cherchions à atteindre un effectif de 5.555 femmes.
F a été calculé en résolvant l'équation suivante:
5 F x 38.900 + 1 F x 1.139.100 = 5.555
d'où
- F rural = 1/240
- F urbain = 1/240x5=1/48
Les taux de sondage rural et urbain appllqués aux effectifs estimes correspondants devaient fournir les effectifs suivants: 4.746 femmes rurales et 810 femmes urbaines. En tenant compte de la perte de 10 pour cent, ces effectifs devaient revenir à 4.270 en milieu rural et 730 en milieu urbain, soit 5.000 femmes au total.
SONDAGE EN MILIEU RURAL
Une enquête nationale effectuée par interview personnelle doit être basée sur un échanfillon à deux degrés au moins. Dans un premier temps on doit sélectionner un échantillon aréolaire, constitué d'un certain nombre de zones; ensuite on doit tirer au sein de chaque zone un certain nombre de maisons, de ménages ou de personnes.
Base de sondage en milieu rural
Au Burundi le type d'unité aréolaire la plus petite pour laquelle on dispose d'une liste est la colline, au moins en milieu rural.
La taille moyenne des 2.453 collines rurales est de l'ordre de 2.000 habitants, mais varie entre 200 et 11.000, leur superficie moyenne étant de 10 km2. Cette taille moyenne est trop grande pour que les collines constituent l'unité ultime de sondage aréolaire, vu que le dénombrement des rugo deviendrait excessivement lourd et en même temps les rugo de l'échantillon final seraient excessivement dispersés. On a cherché donc un moyen de définir des unités plus petites et si possible moins variables de taille. On a trouvé en effet une telle unité, la sous-colline, qui est identifiée avec sa population dans les dossiers du recensement relatifs à chaque colline, bien qu'il n'existe pas de liste. Les sous-collines comportent environ 600 habitants en moyenne. Malheureusement elles sont très variables de taille, ce qui pourrait augmenter la variance erreur de l'enquête. On a donc regroupé les plus petites (taille en-dessous de 200 habitants) avec une souscolline voisinante sur la liste, et on a subdivisé les plus grandes (taille au dessus de 1.000 habitants) en parties égales en nombre suffisant pour que chacune ait moins de 1.000 habitants. Une liste des rugo a été établie pour chaque sous-colline échantillonnée en effectuant une visite à la sous-colline pendant les 6 mois précédant l'enquête.
La stratification en milieu rural
Les 11 régions naturelles telles qu'elles ont été décrites dans le premier chapitre ont constitué des strates assez convenables eu milieu rural, vu leur rapport avec les conditions socioéconomiques et de santé de la population. Dans chacune de ces régions naturelles, on a tiré un nombre de sous-collines proportionnel à la taille de la région. On a d'abord établi une liste des communes par ordre "serpentin", allant de l'ouest à l'est et en descendant du nord au sud à l'intérieur de chaque région. Le tirage étant systématique, l'ordre géographique a joué par conséquent le rôle d'une variable de stratification. A l'intérieur des communes la liste des collines a été établie en ordre alphabétique.
La sélection des collines, des sous-collines et des rugo:
Le sondage est à trois degrés: collines, sous-collines, rugo. Afin de contrôler l'effet de la taille variable des unités areolaires on a tiré l'échantillon aux deux premiers degrés avec probabilité proportionnelle à la taille. Notons, cependant, que les mesures de taille ne sont pas les memes pour les deux degrés. Au ler degré on a pu se baser sur les données du recensement tandis qu'au 2e degré (sous-collines) on ne disposait que du précomptage qui a précédé le recensement et dont les résultats se trouvent dans le dossier de chaque colline. Ces deux sources ne concordent pas en général. Enfin ni l'une ni l'autre ne concorde avec le nombre de rugo établi pour chaque souscolline de l'échantillon lors du dénombrement dont nous avons fait mention à la fin du paragraphe.
Nous avons donc:
Ni = population recensée dans la colline i
Nij = population énumérée au ptécomptage dans la sous-colline i j
Mij = nombre de rugo énumérés lors du dénombrement dans la souscolline ij quelques mois avant l'enquête.
Examinons de plus pres les modalités du sondage aux trois degrés:
1er degré
Le nombre de collines ah à tirer dans la strate h (région naturelle) a été d'abord déterminé en proportion avec la population recensée de la strate. Comme on a voulu tirer 100 collines au total on a calculé:
a h = Population de la strate x 100 / Population totale rurale
arrondi à l'entier, ces populations étant celles du recensement.
On a effectué ensuite dans chaque strate h un tirage systématique de ah collines avec probabilities proportionnelles aux tailles Ni. L'intervalle de sondage a été somme(Ni/ah), cette somme s'étendant sur
l'ensemble des collines de la strate h.
2e degré
Au second degré on a tiré au sein de la colline i une seule sous-colline i j avec probabilité proportionnelle à la taille Ni j.
3e degré
Au 3e degré on a tiré mij rugo sur les Mij dénombrés.
Identification des rugo d'enquête
Des listes des chefs de rugo ont été établies avec l'aide des chefs de sous-collines lors du travail de cartographie et de dénombrement. A partir de ces listes, des rugo au nombre de mxj ont été sélectionnés et identifiés dans chaque sous-colline i j de l'échantillon. L'habitat au Burundi est très dispersé. Pour réduire la dispersion des rugo échantillonnés, sans avoir une concentration excessive, on a tiré dans chaque sous-colline 2 suites de rugo consécutifs figurant sur la liste et de manière à ce que les rugo débutant chaque suite soient séparées par un intervalle égal à la moitié de la liste. Par la suite, les enquêtrices ont dû enquêter toutes les femmes agées de 15 à 49 ans, présentes dans les rugo échantillonnés la nuit précédant la visite de l'enquêtrice, et dont le chef de rugo était burundais ou ressortissant d'un pays limitrophe.
SONDAGE EN MILIEU URBAIN
Base de sondage et stratification en milieu urbain
La méthode de tirage utilisée en milieu rural n'était pas applicable en ville. Les villes de Bujumbura et de Gitega sont divisées en zones et quartiers. Ces demiers sont assez homogènes a l'intérieur, du point de vue de leurs conditions socio-économiques et de l'habitat. Il convenait donc de les considérer comme des strates de sondage.
Il s'agit ensuite de définir l'unité de sondage aréolaire. On a procédé par le regroupement d'un certain nombre de parcelles limitrophes pour constituer des segments, en se basant sur les cartes parceliaires qui sont disponibles pour les différents quartiers des deux villes. Les parcelles varient de 1 à 20 habitants. D'ailleurs la moyenne varie fortement selon le quartier. On a voulu constituer des segments d'une taille moyenne de 500 habitants très approximativement. Afin de regrouper les parcelles en des segments de cette taille il a fallu estimer d'abord la densité d'occupation. Deux méthodes ont été utilisées afin d'estimer l'effectif moyen de population par parcelle.
1.Dans les anciens quartiers de Bujumbura on dispose des résultats du recensement de 1979 pour chaque parcelle. On a tir6 un échantillon systématique de 30 parcelles par quartier. Les agents de terrain ont dénombré les habitants de ces parcelles et à partir de ces resultats on a estimé le taux d'accroissement de la population depuis 1979, par quartier, en comparant ces chiffres avec les effectifs recensés en 1979 dans les mêmes parcelles.
2. Pour Gitega, et pour les quartiers de Bujumbura qui ont connu une importante extension depuis le recensement, cette méthode n'est plus possible. On a donc tiré un échantillon systématique de 50 parcelles dans chaque quartier, à partir duquel on a estimé directement la population actuelle. Après avoir calculé la densité d'occupation pour chacun des quartiers, on a constitué des segments de 500 personnes et effectué le tirage systématique de 1 segment sur 8. Une fois les segments sélectionnés, des listes de ménages résidant dans ces segments ont été établies et on y a tiré un échantillon systématique de 1 ménage sur 6. Les distances en ville étant beaucoup moins grandes qu'en milieu rural, on n'a pas appliquée la méthode de tirage par suites. Un cas particulier a été réservé aux homes universitaires de filles. En les insérant dans leur quartier d'appartenance, on aurait couru le risque soit de les enquêter toutes si leur segment était tiré, soit de n'en enquêter aucune dans le cas contraire. Pour éviter ce biais, on a considéré ce cas à part en établissant une liste exhaustive de toutes les filles résidant dans le campus universitaire et en effectuant directement un tirage systématique de 1/48.
Au total, nous avons obtenu un échantillon de 45 segments y compris ce dernier cas. Comme dans le milieu rural, les enquêtrices devaient interviewer toutes les femmes é1igibles présentes dans le ménage la nuit précédant la visite de l'enquêtrice.
L'ECHANTILLON DES MARIS
Le plan de l'enquête a prévu un échantillon de 750 maris de femmes enquêtées. Pour effectuer cet échantillonnage, on a procédé au calcul du taux de sous-échantillonnage à partir des données du recensement de 1979 relatives à la répartition des femmes de 15 à 49 ans selon l'état matrimonial. Ces données montraient que le nombre moyen de maris pour 100 femmes était de 58,3 dont 53,8 pour cent étaient monogames, 4,1 pour cent bigames et 0,4 pour cent trigames. En supposant que 2 femmes d'un même mari n'habitent pas le même rugo, ni le même ménage urbain (hypothèse justifiée compte tenu des moeurs du pays), un homme qui a deux femmes n'avait pas deux chances d'être enquêté puisqu'il n'habitait qu'un seul rugo ou ménage. Pour 100 femmes il y a 58,3 maris; donc pour les 5.000 femmes de l'échantillon, il y aurait 2.915 maris.
Il fallait donc prendre un sous-échantillon de 1 sur 4 parmi les maris co-résidants des femmes interviewées pour obtenir un échantillon d'environ 750 maris. Le choix a été effectué au bureau en tirant 1 rugo sur 4 en milieu rural ou 1 ménage sur 4 en milieu urbain et en enquêtant tous les maris co-résidants des femmes enquêtées dans le rugo ou le ménage en question.