Survey ID Number
BOL_2003_DHS_v01_M
Title
Encuesta Nacional de Demografía y Salud 2003
Sampling Procedure
OBJETIVOS DEL DISEÑO MUESTRAL
El principal objetivo de la ENDSA 2003 es de producir estimaciones de los diversos indicadores con niveles de confianza aceptables, tales como la fecundidad, la mortalidad infantil y la materna, la planificación familiar y la salud para los diversos dominios de interés. Los principales dominios de análisis son cada departamento (ocho en total), cada una de las 3 regiones naturales (El Altiplano, El Valle y El Llano), cada una de las 2 áreas de residencia urbana y rural, y finalmente para el total del país.
El diseño también atiende el interés de tener estimaciones para las zonas periurbanas de las cuatro ciudades principales del país (La Paz, El Alto, Santa Cruz y Cochabamba) como un todo. Una estimación bruta del porcentaje de este grupo dentro de cada ciudad varía entre el 10 por ciento para Santa Cruz y Cochabamba, del 50 por ciento para El Alto y del 25 por ciento para La Paz. Con estos porcentajes estimados se espera tener alrededor 50 UPMs a ser seleccionadas, para tener estimaciones similares a la de los principales dominios de estudio
MARCO MUESTRAL
Bolivia está dividida en 9 departamentos. Cada departamento está dividido en provincias y cada provincia en secciones municipales. Durante el último censo de población y vivienda (2001) el país fué dividido en segmentos censales respetándose los limites de las diversas unidades jerarquicoadministrativas. Con la información censal se creó un archivo con 16,790 unidades denominadas Unidades Primarias de Muestreo (UPM), con un promedio de 80 a 150 en áreas amanzanadas y entre 150 y 350 en áreas dispersas. Este archivo de UPMs fué estratificado dentro de cada departamento en categorías de tamaños de poblados: Ciudad Capital, poblados grandes (10,000 y más habitantes), poblados menores (entre 2,000 y 10,000), poblados pequeños (250 a 2,000), y área dispersa (menos de 250) ). Este archivo se utilizó como el marco de muestreo para la selección de una muestra maestra con 2019 UPMs. Esta muestra maestra constituye el marco de muestreo de la ENDSA 2003 y de toda muestra a llevarse a cabo en el futuro próximo como un esfuerzo para poder integrar la información de las diversas encuestas durante este decenio. Cada UPM tiene una completa identificación que corresponde a códigos de departamento, provincia, sección y de divisiones menores donde se encuentra localizada. Además cada unidad tiene un levantamiento cartográfico de la UPM.
ESTRATIFICACIÓN
En cada departamento, las UPMs fueron estratificadas de acuerdo a la categorización de los tamaños de los poblados definidos en la muestra maestra. El área de residencia urbana está definida como todos los poblados de 2,000 habitantes y más, y el área de residencia rural se define como todo poblado menor de 2,000 habitantes. La estratificación definida en la muestra maestra también se aplica implícitamente a la ENDSA 2003. Además de estos niveles de estratificación para la muestra maestra, las UPMs fueron también estratificadas en sus diferentes niveles de marginalidad con la metodología
desarrollada por el INE.
MÍNIMO TAMAÑO DE MUESTRA PARA CADA DOMINIO
En general, el diseño de la muestra para una encuesta del tipo de la ENDSA 2003 es estratificado, por conglomerado y en dos étapas. El error muestral para este diseño tiene dos componentes: el primero corresponde a la variación entre las UPMs y el segundo a la variación de los hogares dentro de las UPMs. La variabilidad entre UPMs es mucho mayor para las áreas urbanas que en las áreas rurales, pero en general la variabilidad dentro de las UPMs seleccionadas es menor en lo urbano que en lo rural. Por lo tanto, un importante factor para controlar el error muestral es la reducción del mayor componente de variabilidad (que es la variación entre UPMs) y el cual es inversamente proporcional al número de UPMs (especialmente en el área urbana).
La política del proyecto de encuestas DHS es la de recomendar seleccionar un mínimo de alrededor de 35 UPMs por dominio de estudio para el análisis adecuado de la información. También es bien conocido que un aumento del número de UPMs en la muestra reduce el error muestral pero no en razón proporcional al incremento de ese número. Especificamente, si se doblara el número de UPMs el error muestral no se reduce a la mitad, sino sólo a un 30 por ciento del valor original.
ASIGNACIÓN DE LA MUESTRA
Se consideró un total de 20,000 hogares a seleccionar y se utilizó información de la encuesta ENDSA 1998 como un instrumento de ayuda para estimar el número esperado de entrevistas completas para la ENDSA 2003. En la ENDSA 1998 se seleccionaron 13,136 hogares para conseguir un total aproximado de 11,187 entrevistas completas de mujeres. Con la ayuda de dicha información se espera obtener un total aproximado de 17,033 entrevistas completas. El total de viviendas seleccionadas fue distribuido por departamento pero no proporcionalmente a su tamaño poblacional sino de tal modo de poder cumplir con los objetivos requeridos de la encuesta de tener un tamaño adecuado para cada departamento. Por está razón la muestra no es autoponderada. El número asignado de hogares se detalla en el Cuadro A.1 por departamento y tamaño de la localidad.
SELECCIÓN DE LA MUESTRA
La selección de la muestra para la ENDSA 2003 se realiza en cada departamento en dos etapas: la primera etapa consiste de una selección sistemática de UPMs con probabilidad proporcional a su tamaño, siendo el tamaño el número de hogares. En una segunda etapa, un número fijo de 20 hogares fueron seleccionados dentro de cada UPM. En cada departamento, la selección de los sectores censales en la primera étapa consideró los siguientes pasos:
- En la muestra maestra, el número de UPMs a ser seleccionados en cada departamento y tipo de poblado fué calculado aproximadamente como una distribución de 2,019 UPMs entre ellos en una forma proporcional a la raíz cuadrada del tamaño poblacional.
- Para la ENDSA 2003 se seleccionaron 1,000 UPMs entre las 2,019 en la muestra maestra.
- Dentro de cada UPM se considero un tamaño de muestra de 20 hogares seleccionados (esperando tener un total de 17 entrevistas de mujeres completas).
- En la muestra maestra, la selección de las UPMs en cada grupo poblado de cada departamento fué hecha con probabilidad proporcional al tamaño de las UPMs:
P0i = (a * mi) / ( Smi )
donde
a : es el número de UPMs seleccionados en cada grupo poblado en el departamento,
mi : es el número de hogares en la i-ésima UPM de acuerdo al censo de 2001,
Smi : es el total de hogares en el grupo poblado en el departamento según censo 2001.
- Se subselecciona una muestra de b UPMs de las a UPMs incluidas en la muestra maestra, con una selección sistemática para cada grupo poblado.
- Estas dos étapas prácticas se convierten es una sola étapa desde el punto de vista teórico, lo cual se puede resumir como:
P1i = (b/a) * P0i = (b * mi) / ( Smi )
- En la segunda étapa se selecciona un total de 20 hogares en cada UPM con una selección sistemática. La probabilidad final de selección del hogar en la j-ésima UPM para la ENDSA 2003 está dada como:
Probfi = { b * mi } / { Smi } { d/ Li }
d : es el número de hogares en la i-ésima UPM (20 hogares)
Dentro de cada departamento y para cada UPM urbana, la selección de hogares debe ser en forma sistemática con un intervalo de selección, Iij =Lij/d . La primera selección es hecha al azar dentro del rango del intervalo de selección y las restantes 19 en forma sistemática usando el intervalo de selección. Para cada UPM rural, la selección de los hogares se hizo en un grupo compacto de 20 hogares contiguos en el listado total de hogares de la UPM con el siguiente procedimiento:
- Se enumeraron los hogares en forma consecutiva en el listado de cada UPM.
- Se estableció el número total de hogares Li en la UPM rural
- Se seleccionó un número al azar entre 1 y Li . Llámese a ese número Ai.
- Se seleccionan todos los d=20 hogares contiguos comenzando en el hogar número Ai. Se consideró la lista total de hogares como una lista circular, es decir el último elemento es seguido por el primer elemento de la lista.
Como se mencionó antes, debido a la selección de un número fijo de viviendas en la segunda etapa, la muestra no es autoponderada. La ponderación básica del diseño para cada UPM (hogar) seleccionado es:
wj = 1 / Probfi
Después de calcular las ponderaciones básicas como resultado del diseño, ellas son ajustadas por las tasas de no respuesta a nivel urbano/rural del departamento para hogares e individuos. Finalmente, toda estimación se ha calculado con un estimador de razón
r = ( S wj*yj ) / ( S wj*xj )
donde la suma es llevada sobre todas las unidades de análisis y wj es la ponderación asignada a cada unidad de análisis. En general yj es el valor de la variable bajo consideración; xj es una variable de conteo.