Sampling Procedure
DISEÑO Y TAMAÑO DE LA MUESTRA
-----------------------------------------------------------------
La muestra ENDES Continua 2007-2008 está constituida por la unión de dos muestras, una que corrresponde a la ENDES Continua 2007-2008 propiamente, y , otra correspondiente a la ampliación muestral 2008, las que juntas se denominan: ENDES Continua 2007-2008, al ser esta una submuestra de la ENDES 2000 se enmarca en el mismo diseño muestral. Por lo tanto, el diseño muestral de la ENDES Continua 2007-2008 es probabilístico, autoponderado por departamentos y de áreas, estratificado, multietápico e independiente para cada departamento.
Sin embargo la ampliación muestral para el 2008 presenta características similares al diseño muestral propuesto para la ENDES Continua, con la única diferencia que se utilizó un marco muestral más reciente. En tal sentido, el diseño muestral para la ampliación muestral 2008 es probabilístico, autoponderado por departamentos y por áreas, estratificado, bietápico e independiente para cada departamento. A continuación se presenta el diseño muestral de cada caso.
1.1 La ENDES Continua 2007 - 2008, al ser una submuestra de la ENDES 2000 se enmarca en el mismo diseño muestral
================================================================================================
Unidad de Muestreo
---------------------------------
Las Unidades Primarias de Muestreo (UPM) fueron los centros poblados empadronados en el Censo de Población y Vivienda del año 1993. Cada UPM fue dividida en conglomerados (USM), y toda vivienda localizada en dicha área se considera como a unidad última de muestreo (UUM).
Marco Muestral
------------------------
El Marco Muestral de la ENDES tiene de base la información de los Censos de Población y Vivienda de 1993, investigación que provee un listado de los centros poblados con información censal, lo que permite el diseño muestral para cualquier muestra utilizando dicho marco de unidades. Este marco ha sido actualizado con la información básica y la cartografía del precenso de 1999. En la ENDES Continua 2007 - 2008, el marco estuvo constituido por el listado de centros poblados de los conglomerados que fueron seleccionados al azar de la ENDES 2000 para ser entrevistados en el año 2007 y 2008 respectivamente.
El diseño de la ENDES Continua 2007 - 2008 es multietápico, es decir, se elaboró un marco para cada una de las etapas:
- Para la primera etapa, selección de unidades primarias de muestreo (UPM), se realizó a partir de la información proveniente del Censo de Población y Vivienda de 1993.
- Para la segunda etapa, selección de unidades secundarias de muestreo (USM), se utilizó información estadística y cartografía proveniente de la actualización cartográfica y el registro de edificios y viviendas de 1999.
- Para la tercera etapa, selección de unidades terciarias de muestreo (UTM), se utilizó información estadística y actualización cartográfica y el registro de edificios y viviendas que se ejecutó antes del trabajo de
campo, con el fin de disminuir los errores de marco muestral.
1.2 El diseño para la ampliación muestral ENDES 2008, por concepto, es probabilístico, de áreas, estratificado, bietápico, autoponderado e independiente por departamento.
- La muestra es probabilística porque las unidades de muestreo han sido seleccionadas mediante métodos aleatorios, lo cual permite efectuar inferencias a la población sobre la base de la teoría de probabilidades.
- La muestra es de áreas, porque cada vivienda está asociada al área geográfica (conglomerado) dentro de cada departamento de estudio.
- La muestra es estratificada, porque previamente a la selección, la población se ha dividido en estratos, con el objeto de mejorar su representatividad.
- La muestra es bietápica, porque en la primera etapa se utilizará una selección sistemática de UPMs con probabilidad proporcional al tamaño de viviendas (PPT) y en la segunda etapa (selección de viviendas) sistemático simple con arranque aleatorio. Además, se considero bietápica con el objetivo de dispersar geográficamente los conglomerados de la muestra adicional.
- La muestra es autoponderada, porque la probabilidad de selección (conocida y diferente de cero) es la misma para cada una de las unidades últimas de selección (viviendas particulares) dentro de cada departamento de estudio.
Unidad de muestreo
-------------------------------
La ampliación muestral para el 2008 presenta características similares al diseño muestral propuesto para la ENDES Continua, con la única diferencia que se utilizó un marco muestral más reciente.
El marco muestral utilizado para la ampliación muestral 2008 en la primera etapa de selección de conglomerados, proviene de los Censos Nacionales de Población y Vivienda del 2005; en tanto que, en la segunda etapa se utilizaron dos fuentes de información el Marco del Precenso 2007 y el Registro de Edificios y Viviendas y de la Actualización Cartográfica, realizadas como actividades preparatorias a la operación de campo de esta investigación.
Las Unidades Primarias de Muestreo (UPM) fueron los centros poblados empadronados en el Censo de Población y Vivienda del año 1993. Cada UPM fue dividida en conglomerados (USM), y toda vivienda localizada en dicha área se considera como a unidad última de muestreo (UUM).
Unidades de Muestreo Urbano
-----------------------------------------------
- La Unidad Primaria de Muestreo (UPM), representada por la manzana o grupo de manzanas que en conjunto tienen 120 viviendas particulares en promedio.
- La Unidad Secundaria de Muestreo (USM), es la vivienda particular que integra la UPM seleccionada.
Unidades de Muestreo Rural
--------------------------------------------
- La Unidad Primaria de Muestreo (UPM), representada por el centro poblado con 500 a menos de 2 mil habitantes y el AER (áreas de empadronamiento rural) representada por la manzana o grupo de manzanas que en conjunto tienen 120 viviendas particulares.
- La Unidad Secundaria de Muestreo (USM), es la vivienda particular que integra la UPM (AER seleccionado).
Tipo de Diseño
------------------------
- La muestra es probabilística, de áreas, estratificada, trietápica y autoponderada sin reemplazo.
- La muestra es probabilística porque las unidades de muestreo han sido seleccionadas mediante métodos aleatorios, lo cual permite efectuar inferencias a la población sobre la base de la teoría de las probabilidades.
- La muestra es de áreas, porque la probabilidad de cada vivienda de ser seleccionada está asociada a áreas geográficas (conglomerados) dentro de cada departamento de estudio.
- La muestra es estratificada, porque previamente a la selección, la población se ha dividido en estratos, con el objeto de mejorar su representatividad.
- La muestra es trietápica. En la primera y en la segunda fase se utiliza la selección sistemática con probabilidad proporcional al tamaño de viviendas(PPT) y en la tercera etapa (selección de viviendas) es
sistemática simple con arranque aleatorio.
- La muestra es autoponderada, porque la probabilidad de selección (conocida diferente a cero) es la misma para cada una de las unidades últimas de selección (viviendas particulares) dentro de cada departamento de
estudio.
El diseño de las ENDES es multietápico, es decir, se elaboró un marco para cada una de las siguientes etapas:
- Primera Etapa de Selección: Proviene de los Censos Nacionales de Población y Vivienda de 1993 .
- Segunda Etapa de Selección: Se seleccionaron conglomerados del Precenso de 1999.
- Tercera Etapade Selección: Se utilizó información del Registro de Edificios y Viviendas y de la Actualización Cartográfica, realizadas como actividades preparatorias a la operación de campo de esta investigación.
Marco Muestral
-------------------------
Dado que el diseño para la ampliación muestral 2008 es bietápico, utilizaremos un Marco Muestral para cada una de las etapas de la selección de las unidades de muestreo. Para la primera etapa: selección de UPM's (conglomerados), utilizaremos la información del Censo de Población y Vivienda del 2005, actualizado con los resultados de la información básica y la cartografía realizada en el Censo del 2005. Para la segunda etapa:selección de USM's (viviendas), utilizaremos el marco muestral del precenso del 2007. Además, en la última etapa se consideró la actualización cartográfica de los conglomerados adicionales a objeto de identificar y registrar cambios en las áreas seleccionadas, el cual constituirá el marco de muestreo para la selección de un nuevo conjunto de viviendas.
Selección de la Ampliación Muestral
----------------------------------------------------------
Una vez identificados los conglomerados pertenecientes a la ENDES Continua 2007 - 2008, en el Marco Muestral 2005 se procedió a la selección de los conglomerados de la ampliación muestral de acuerdo con el diseño muestral planteado y siguiendo las técnicas de selección probabilística.
En la formación de los dos subestratos generados por departamento, se elegirán los conglomerados adicionales para la Encuesta ENDES Continua 2007-2008, así como su directorio de viviendas y su respectiva cartografía (planos urbanos y mapas distritales).
Etapas del muestreo de la Ampliación Muestral
-------------------------------------------------------------------------
La muestra resultante adicional de los nuevos conglomerados es en dos etapas:
La primera etapa, consiste de una selección sistemática de UPM con probabilidad proporcional a su tamaño, cada uno de los conglomerados (UPM) tiene un tamaño promedio de 120 viviendas particulares. Las UPM seleccionadas, se actualizan con los registros y la cartografía del precenso del 2007.
En la segunda etapa, un número de viviendas (USM) en cada UPM de la muestra es seleccionado manteniendo una fracción de muestreo uniforme para cada vivienda (e implícitamente para cada hogar) dentro de cada departamento.
Para el proceso de selección de la muestra, se tuvo en cuenta el número de conglomerados a ser seleccionados en cada departamento y fue calculado como la división del tamaño de muestra de viviendas esperado en el departamento y del tamaño promedio de muestra de viviendas esperado dentro del conglomerado. En el caso del estudio ENDES Continua 2007-2008, este promedio fue de aproximadamente 27 viviendas.
Selección de UPM de la Ampliación Muestral
-----------------------------------------------------------------------
Previa selección, los conglomerados fueron ordenados en cada estrato del marco muestral 2005 bajo un criterio geográfico. Se tiene de esa manera, una estratificación implícita del marco. Luego se procedió a seleccionar las UPM en cada subestrato del departamento, en forma sistemática, con arranque aleatorio y probabilidad proporcional a su número de viviendas particulares en el estrato. El proceso es similar al determinado en la ENDES Continua, en este caso las UPM son los conglomerados, ya que la selección es bietápica.
Selección de las USM de la Ampliación Muestral
-----------------------------------------------------------------------------
Previa selección de USM, se realiza un control de calidad de la actualización de las viviendas de cada UPM seleccionada (En este caso de los registros de viviendas correspondientes al Censo 2005 y el precenso del 2007 de cada conglomerado).
En cada UPM, seleccionada se procede a seleccionar las viviendas con arranque aleatorio y en forma sistemática simple aleatoria.
Una vez establecido el número total de viviendas a ser seleccionadas para cada conglomerado, el
procedimiento de selección dependerá del tipo de conglomerado, urbano o rural.
Conglomerado urbano Se procedió a seleccionar automáticamente las unidades secundarias de muestreo usando una selección sistemática para cada conglomerado seleccionado, usando el siguiente algoritmo:
-----------------------------------
· Se listan las viviendas particulares de la UPM seleccionada.
· Se enumeran las viviendas en la lista desde 1 hasta Mij.
· Se determina el intervalo de selección (K):
Total de viviendas ocupadas acumuladas en el conglomerado Mij
K = = _____________________________________________________
Total de viviendas a seleccionarse en el conglomerado mij
· Se elige al azar un número como "arranque aleatorio" (a a).Este número muestral debe estar entre 1 y K.
· El arranque aleatorio (a a) es el número muestral que corresponde a la primera vivienda seleccionada. La segunda vivienda seleccionada será el arranque aleatorio (a a) + K. La tercera vivienda seleccionada será
el arranque aleatorio (a a)+ 2K, y así sucesivamente hasta completar el número requerido de viviendas a seleccionar dentro del conglomerado.
Conglomerado Rural (AER)
---------------------------------------------
Para cada conglomerado rural, la selección de viviendas se hizo en grupos compactos de ocho viviendas contiguas sobre el listado de viviendas de acuerdo con el procedimiento siguiente:
· Se enumeran las viviendas en forma consecutiva en el listado del conglomerado rural.
·Después de cada múltiplo de ocho (es decir, 8, 16, 24, etc.), se traza una línea horizontal (con un marcador de color). Cada grupo está formado por las viviendas entre cada dos líneas horizontales consecutivas y el primer grupo está constituido por la primera vivienda en la lista hasta el anterior inmediato a la primera línea horizontal; y en el caso de existir más de cuatro viviendas después de la última línea horizontal, el último grupo estará constituido por esas viviendas.
- Si hubieran viviendas (menos de cuatro) después de la última línea horizontal, ellas serán distribuidas uniformemente entre los grupos compactos anteriores en forma sistemática y con inicio al azar.
- Todos estos grupos así formados, se denominan grupos compactos, y Gij es el total de grupos compactos formados en el conglomerado.
- Se calcula el número de grupos compactos a seleccionar:
Gij = mij / 8
- Se selecciona entonces gij grupos compactos del total Gij, en forma sistemática simple con arranque aleatorio.
- Todas las viviendas dentro de los grupos compactos en el conglomerado rural son considerados como la muestra de viviendas de dicho conglomerado.
1.3 La muestra ENDES Continua 2007-2008, contempla la utilización de dos estudios muestrales; la Encuesta Continua sobre la base del marco precensal 2000 y la Ampliación Muestral basado en el marco censal 2005.
El estudio de las ponderaciones debe considerar la implementación del diseño contemplado en los dos estudios muestrales y de sus metodologías de selección. Cada muestra separadamente puede ser analizada con su propio marco siguiendo las fórmulas apropiadas en su proceso de selección. Sin embargo, cuando se consideran ambos procesos de muestreo, las fórmulas exactas de sus probabilidades de selección son demasiadas complicadas; en particular por los cambios ocurridos en el periodo del precenso 1999 y Censo 2005.
Bajo ciertos supuestos una buena aproximación es obtenible y se observa que su comportamiento es de gran utilidad para la determinación de un proceso aproximado.
El marco del Censo del 2005 puede ser particionado en los siguientes grupos:
- E1 el conjunto de conglomerados seleccionados con el marco de 1999 y ubicables en el marco 2005.
- E2 el conjunto de conglomerados no seleccionados con el marco de 1999 y ubicables en el marco 2005.
- E3 el conjunto de conglomerados seleccionados con el marco de 2005 y no existentes en 1999
En la aproximación se establece las probabilidades de selección en ambas muestras. Para E1 y E3, la participación de cada marco es una sola vez, pero para E2 cada marco contribuye en 2005 más de una vez; por lo tanto la participación de cada muestra debería ser ajustada en esta área.
Metodología de Estimación
------------------------------------------
La muestra de la ENDES Continua 2007-2008 es la expresión integrada de la ENDES Continua correspondiente a los años 2007 y 2008, más la ampliación muestral del 2008 para la estimación de la desnutrición crónica a nivel departamento y la estimación de los otros indicadores de la salud materna infantil identificados como indicadores de los programas estratégicos.
El diseño de la ENDES Continua 2007-2008, por concepto, es multietápico, estratificado e independiente por departamento y se sustenta en el diseño de la ENDES 2000, cuya estructura se ajustó de manera integrada, como un todo, a la estructura del Censo de Población y Vivienda de 2007.
De manera integrada, al considerarse que la ampliación muestral de la muestra acumulada de la ENDES Continua 2007 - 2008, es una muestra complementaria y dependiente de la acumulación muestral de los años involucrados, dándose por entendido que el periodo de recolección de datos es el que va de enero de 2007 a octubre de 2008.
En dicho contexto, los factores que intervienen en el cálculo de la ponderación de la muestra son:
- Total de viviendas por área de residencia: urbana y rural, según departamento en el Censo de Población y Vivienda de 2007.
- Total de viviendas con entrevista completa por área de residencia: urbana y rural, según departamento en la muestra integrada.
Tamaño Muestral
------------------------- -
- 27 204 hogares particulares seleccionados, 15 915 en el área urbana y 11 289 en el área rural. Se completaron entrevistas en 25 633 hogares.
- 23 094 mujeres de 15 a 49 años elegibles para entrevista en hogares seleccionados, 15 194 en el área urbana y 7 900 en el área rural. Se completaron 22 558 entrevistas individuales.