Survey ID Number
PER_1986_DHS_v01_M
Title
Encuesta Demografiga y de Salud Familiar 1986
Sampling Procedure
Durante una visita al Peru, en octubre de 1985, del estadistico inglés Dr. Christopher Scott, junto con técnicos de la Dirección General de Censos y Encuestas del INE, se diseñó la muestra para la ENDES. Esta se basó en el marco muestral desa-rrollado para la Encuesta Nacional de Nutrición y Salud (ENNSA) de 1984. Tomando como referencia las proyecciones de población hechas por el INE y con la esperanza de obtener aproximadamente 8000 entrevistas efectivas con mujeres en edad fértil (MEF), se decidió usar una tasa global de muestreo de 1/500 = 0.002, autoponderada a ral y en toda la Sierra, y 20 través de los dominios muestrales.
Un problema que se tuvo que enfrentar fue que la muestra de la ENNSA no era autoponderada. Además fue diseñada para proporcionar en promedio 6 entrevistas de hogares por conglomerado en el Area Metropolitana de Lima, 12 en el resto urbano de la Costa, 16 en la Costa rural y en toda la Sierra, y 20 en la Selva. En cambio, la meta establecida para la ENDES fue la de entrevistar a 20 MEF por conglomerado en el área urbana, y 40 en el área rural. En la tabla que se presenta a continuacion se muestra cómo se resolvió el problema y cómo se llegó a la muestra de conglomerados para la ENDES.
Asi se procedió a la selección de 383 conglomerados. Posteriormente, para el Area de Lima Metropolitana se formó un estrato incluyendo a las nuevas invasiones y urbanizaciones periféricas, seleccionándose 8 conglomerados más, dando el número total de conglomerados de 391, de los cuales 143 corresponden al Area Metropolitana de Lima. Las listas de direcciones de las viviendas en los conglomerados seleccionados fueron actualizadas en una operación de campo que duró unos cuatro meses (de junio a setiembre de 1986). Luego se procedió a la selección sistemåtica de direcciones.
El cálculo que se empleó para determinar el intervalo de selección en cada conglomerado es el siguiente: I1 '= 500Pli PO' ajustada, donde Pli corresponde a la probabilidad de selección del conglomerado para la ENNSA y PO' ajustada se obtiene de la columna 8 de la tabla. Una vez seleccionadas las direcciones, se asignó una submuestra de 1 en 3 a la encuesta experimental. La asignación fue sistemática a través de toda la muestra, sin utilizar un nuevo arranque en cada conglomerado.
En el trabajo de campo para las entrevistas se empleó la técnica del intervalo semiabierto, en donde si se encuentra na o más viviendas entre la vivienda seleccionada y la siguiente vivienda en el listado, estas viviendas extras quedan automaticamente seleccionadas.Esta técnica es rigurosamente matemática y ayuda a remediar deficiencias en el listado.
Una vez empezado el trabajo de campo, se observó que el número de direcciones seleccionadas por conglomerado, fuera de Lima, fue bastante menor que lo esperado. Tras una investigagación urgente y minuciosa de todos los procedimientos muestrales, se encontró que las probabilidades de seleción realmente utilizadas en los dominios rurales del marco de la ENNSA no llevaban a un rendimiento esperado de 16 hogares sino a un número que variaba entre 13.0 y 15.4. En promedio, el rendimiento esperado real fue de aproximadamente 10% por debajo del número calculado de 16. El problema no se restringió al área rural. La parte urbana de la muestra (excluyendo el Area Metropolitana de Lima) no reflejaba el crecimiento poblacional esperado, que a nivel nacional se calculaba en 2.58% anual, cifra utilizada para calcular la fracciÓn de muestreo de la ENDES. Seguramente esto se debió al hecho que, contrariamente al caso de Lima, en las otras ciudades no se abrió un estrato de crecimiento periférico.
Finalmente, considerando los problemas de listado, una posible sobreproyección de la poblacion en los calculos iniciales, los marcos no actualizados para el crecimiento periférico en areas urbanas y algunos listados viciados en áreas rurales, se decidió incrementar en 10% la toma muestral en áreas urbanas, excluyendo al Area Metropolitana de Lima, y de 20% en áreas rurales. Sin esta medida se habría terminado con aproximadamente 650 entrevistas (MEF) menos que las 7533 realmente logradas. En cuanto al efecto que pueda tener esta medida sobre la representatividad de la muestra, parece que sí mejoró la calidad de la muestra. Al expandir los resultados por el inverso de la fracción de muestreo (500), ajustada por la no respuesta, se está muy cerca a la proyección vigente. También, la distribución urbano-rural se parece a la esperada.