Survey ID Number
BOL_2006_EH_v01_M
Title
Encuesta de Hogares 2006
Sampling Procedure
DISEÑO MUESTRAL
El diseño muestral para la Encuesta de Hogares 2006 está basado en el contexto de diseños muestrales probabilísticos, estratificados, por conglomerado y multiétapicos. La selección de la muestra se llevó a cabo dentro de estratos fila y estratos estadísticos, respectivamente.
Las unidades seleccionadas en la primera etapa, están referidas en la literatura del diseño muestral como Unidades Primarias de Muestreo (UPM). Cada UPM está construida en base a las áreas de enumeración censal identificadas y utilizadas en el Censo Nacional de Población y Vivienda del 5 septiembre de 2001. Éstos son generalmente sectores censales o fusión de dos sectores censales.
Las unidades seleccionadas dentro de cada UPM seleccionada se llaman unidades de segunda etapa o Unidades Secundarias de Muestreo (USM); unidades seleccionadas en la tercera etapa se denominan Unidades Terciarias de Muestreo (UTM). En general, las unidades seleccionadas en la última etapa en un diseño multiétapico se llaman Unidades Últimas de Muestreo (UUM).
TAMAÑO
El tamaño muestral fue obtenido por requisitos de confiabilidad, establecidos por el coeficiente de variación (CV). El CV es una medida relativa del error muestral y es calculada como el error muestral (desviación estándar) con respecto al valor esperado de la característica o variable dada. El CV especificado para el nivel de desempleo anual para el país, dada una tasa de desempleo abierto de 6%, es 7 por ciento de coeficiente de variación. El 7% de CV está basado en el requisito que una diferencia de 0.2 por ciento en la tasa de desempleo durante años consecutivos y es significativo al nivel 0.8. El CV especificado para el nivel de desempleo anual para los 9 departamentos, dada una tasa de desempleo abierto de 6 por ciento, es 8% de CV.
Debido al uso de un diseño muestral bietápico en área urbana y trietápico en área rural, la determinación del tamaño de la muestra es complejo, ya que incorpora un análisis de precisión de las variables de estudio, tanto en las Unidades Primarias de Muestreo (UPM) como las Unidades Secundarias de Muestreo (USM) y Unidades Terciarias de Muestreo (UTM), respectivamente. En este caso, se suma la dificultad asociada al hecho de que la infraestructura del diseño muestral es de propósitos múltiples y, por lo tanto, considera la posibilidad de que otras variables estén bien medidas. En este contexto, la determinación del tamaño de la muestra, trata, en primer lugar, de ser compatible con los niveles de estimación o dominios de estudio y la importancia de los estratos definidos, y con las principales variables que son objeto de estimación.
En ese entendido, el problema consiste en determinar el tamaño de muestra óptimo considerando las recomendaciones sobre tópico de tamaño de muestra que se dan en el manual sobre Encuestas de Población Económicamente Activa de la Organización Internacional de Trabajo (OIT) y el Mapa de Pobreza generado en base a la información Censal de 1992 y 2001, respectivamente. El tamaño de muestra óptimo para estimar las proporciones multinomiales, en este caso, la Condición o Estrato de Pobreza, es equivalente a la construcción de intervalos de confianza simultáneos para la variable pobreza que se ajusta a una distribución multinomial debido que está compuesto por 5 categorías (1. Necesidades Básicas Satisfechas; 2. Umbral de pobreza; 3. Pobreza Moderada; 4. Indigencia; 5. Marginalidad).
Distintos autores (Quesenberry y Hurts, 1964; Goodman, 1965; Tortora, 1978; Medina, 1998) han analizado procedimientos para determinar el tamaño de muestra necesario para proporciones multinomiales. El procedimiento consiste en dividir una muestra de tamaño n en k (5) categorías exhaustivas y mutuamente excluyentes. Fijando el error máximo deseado por e = 0,00936 para la incidencia verdadera de pobreza, con un nivel de confianza del 95% de confianza y la notación utilizada por Tortora, el tamaño de muestra preliminar está dado:
Número de personas: 9869,65
Número de viviendas: 2780,91
Tamaño de muestra: 4260,564 (4260)
Conforme a los cálculos habituales, se aconsejaría elegir 9869.65 (aproximadamente 9870) personas, situación que representa el 58% del número de selecciones sugeridas a partir del procedimiento propuesto por Tortora.
En una primera aproximación se trató de fijar un tamaño de muestra, en términos del total de viviendas, que resultase compatible con la obtención de un error de muestreo de baja magnitud en las estimaciones. El tamaño se fijó suponiendo un Muestreo Aleatorio Simple (MAS) de viviendas, el cual se ajustó por un factor que da cuenta del efecto de diseño (Deff) en el tamaño, al muestrear por conglomerados (sectores censales) en lugar de viviendas.
Otro de los aspectos necesarios a considerar en la determinación del tamaño de la muestra, es la cobertura de la encuesta, con el propósito de identificar viviendas donde no se hizo la
encuesta continua de hogares de 2003 - 2004.
Weighting
CONSTRUCCIÓN Y USO DE FACTORES DE EXPANSIÓN MUESTRAL
El factor de expansión se define como el valor recíproco de la fracción de muestreo o la inversa de la probabilidad con que fue seleccionada cada vivienda en la muestra o el factor de expansión se puede comprender o interpretar como la cantidad de personas en la población que representa una persona en la muestra. Este puede ser distinto para cada persona, y esa diferencia proviene del hecho que la muestra no es autoponderada.
PROCEDIMIENTO DE ESTIMACIÓN INSESGADO
Una muestra probabilística se define como una muestra que tiene una probabilidad distinta de cero y conocida de selección para cada unidad muestral (vivienda particular). Con las muestras probabilísticas pueden obtenerse estimadores insesgados. Un estimador insesgado de la población total para cualquier característica o variable investigada en la encuesta puede obtenerse multiplicando el valor de esa característica por cada unidad muestral (persona o vivienda) por el recíproco de la probabilidad con que esa unidad fue seleccionada y sumando los productos de todas las unidades muestrales (Hansen, 1953).
Empezando con las estimaciones insesgadas de una muestra probabilística, diferentes tipos de estimación y procedimientos de ajuste (tales la de no entrevista) puede aplicarse con la convicción razonable de que la exactitud global de las estimaciones mejorará. En la muestra de la Encuesta de Hogares durante cualquier año dado, no todas las unidades responden la encuesta generando la no - respuesta que constituye una fuente potencial del sesgo. La tasa de no respuesta en promedio es de 6 a 7 puntos porcentuales aproximadamente en el MECOVI.
Otros factores, donde ocurren errores ocasionales en el procedimiento de selección de muestra, la vivienda o la omisión de personas por los encuestadores, también puede introducir el sesgo. Estas omisiones de viviendas o personas pueden ser consideradas como una probabilidad igual a cero de selección. Estas dos excepciones no restringen la probabilidad de seleccionar cada unidad, en la Encuesta de Hogares . Si todas las unidades en la muestra tienen la misma probabilidad de selección, la muestra se llama autoponderada, y los estimadores insesgados pueden ser calculados multiplicando la muestra total por el recíproco de esta probabilidad. La mayoría de las muestras a nivel de estratos en la Encuesta de Hogares son aproximadamente autoponderadas.
FACTOR DE EXPANSIÓN DE BASE
La muestra designada para el diseño muestral es de 355 UPM con 12 viviendas por UPM en el área urbana y tanto en el área rural, respectivamente haciendo un total de 4260 viviendas particulares seleccionadas con probabilidades iguales a la inversa del estrato, denominados factores de expansión básicos (o factores de expansión base). Aproximadamente todas las personas de la muestra dentro del mismo estrato tienen la misma probabilidad de selección.
Como primer paso, en el procedimiento de estimación, los valores brutos de las unidades de viviendas de la muestra son multiplicadas por los factores de expansión base. Cada persona en la misma unidad de vivienda recibe el mismo factor de expansión base.
AJUSTE DE FACTORES DE EXPANSIÓN ESPECIAL
Algunas Unidades Secundarias de Muestreo (USM) son submuestreados en la "Unidad de Muestreo del INE" en el caso del área rural, porque su tamaño observado es más grandeque lo esperado de 135 unidades de viviendas en promedio por UPM a nivel nacional.
Si estas desviaciones son bastante grandes para afrontar la realización exitosa de la asignación del personal de trabajo de campo. Cuando estas situaciones ocurren, una segunda etapa de muestreo son implementadas para mantener manejable el operativo de campo. Esta segunda etapa de muestreo se llama submuestreo de campo. El submuestreo de campo ocurre cuando una UPM consta de más de 3 segmentos censales identificados para la entrevista de áreas extensas de terreno en el área rural.
Las USMs son las unidades muestrales seleccionadas después de la primera etapa de muestreo para la Encuesta de Hogares, en la teoría la mayoría de las USMs constan de un conglomerado geográficamente compacta de viviendas particulares. El uso de conglomerado de segmentos baja los costos de viaje para el personal de trabajo de campo. El conglomerando logra aumentos ligeros de la varianza dentro de la UPM de las estimaciones para algunas características de fuerza de trabajo, pobreza y otras puesto que el informante dentro de un conglomerado compacto tiende a tener características similares. Entonces, el factor de expansión es el inverso de la fracción de muestreo o la probabilidad de selección de un segmento (USM).
Normalmente, las Unidades Últimas de Muestreo - UUMs son identificadas después de la operación del listado de viviendas o la actualización cartográfica. El personal de la oficina central selecciona un submuestreo sistemático de UUM con arranque aleatorio para reducir el número de unidades de viviendas actualizadas a un número manejable, de un promedio de 135 a 12 unidades de viviendas en cada UPM seleccionado. El factor de expansión se define como el inverso de la fracción de muestreo o la probabilidad de selección de una vivienda (UUM o UTM).
AJUSTE POR NO - RESPUESTA
Ocurre la no - respuesta cuando las viviendas u otras unidades de observación que se han seleccionado para la inclusión en una encuesta no reportan todos o algunos de los datos. Esta pérdida para obtener los resultados completos de todas las unidades seleccionados que puede levantarse de diferentes fuentes, mientras dependiendo dela situación de la encuesta. Hay dos tipos de no - respuesta:
- Item de no - respuesta
- La unidad de no - respuesta completa.
La unidad de no - respuesta completa se refiere a la perdida de recolectar cualquier dato en la encuesta de una unidad muestral. Por ejemplo, no pueden obtenerse los datos de una vivienda elegible en la encuesta debido a la ausencia del informante, los caminos intransitables, la negativa para participar en la entrevista, o ndisponibilidad del informante por otras razones. Este tipo de no - respuesta en la Encuesta de Hogares se llama Tipo A de no - entrevista.
Históricamente, era entre 4 y 5 por ciento de las unidades elegibles en un año dado de Tipo A de no - entrevistadas. Recientemente, la proporción de tipo A ha subido a entre 6 y 7 por ciento. El ítem de no - respuesta ocurre cuando una unidad encuestado tiene inexactitudes o se niega a proporcionar algunos ítems (preguntas) específicos de información. Se discuten procedimientos para tratar con este tipo de no - respuesta en el acápite correspondiente denominado el proceso de imputación. En el
proceso de estimación de la Encuesta de Hogares, los factores de expansión de todas las viviendas entrevistadas se ajustan para considerar viviendas ocupadas de la muestra para que ninguna información que se obtuvo debido a la unidad de no - respuesta (Tipo A de no - entrevista o cobertura). Aumentando los factores de expansión de unidades muestralesentrevistadas para considerar para unidades de la muestra elegibles que no se han entrevistado, se asume que las unidades entrevistadas son similares a las unidades de no - entrevistado con respecto a sus características demográficas y socio-económicas. Esto puede o no puede ser verdad.
Los resultados de los sesgo de no - respuesta cuando las unidades de no - respuesta difieren en importancia con respecto a aquellos que responden a la encuesta o a los ítems particulares.
Como en toda encuesta, la Encuesta de Hogares 2006 registró una proporción o tasa de hogares "sin respuesta", lo que obligó a estimar coeficientes de corrección como paso previo al cálculo de los factores de expansión finales. Los coeficientes de corrección por "no respuesta" se estimaron a nivel de las UPM, de esta manera se mantiene el peso o la contribución específica de cada una de ellas. Este criterio se consideró el más adecuado debido a que generalmente los hogares de estratos altos son los que más rechazan las encuestas y, por ende, no sería acertado aplicar un factor de ajuste por "no respuesta" a nivel de ámbitos mayores a la UPM pues ello introduce una distorsión, es decir, traería como efecto el diluir o subestimar la contribución de los estratos altos.
Grupo A Grupo B
En este nivel de análisis, los registros del archivo o la base de datos para todos los individuos en la misma vivienda por UPM tienen el mismo factor de expansión, puesto que los ajustes que se discutieron hasta ahora sólo dependen de las características de la vivienda.
FACTORES DE EXPANSIÓN DESPUÉS Factores de expansión después del ajuste de no - entrevista
A la realización del procedimiento de ajuste de no - respuesta, el factor de expansión para cada una de las personas entrevistados es:
(Factor de expansión base) x (Factor de expansión especial) x (Factor de ajuste de no - entrevista)
En este nivel de análisis, los registros del archivo o la base de datos para todos los individuos en la misma vivienda por UPM tienen el mismo factor de expansión, puesto que los ajustes que se discutieron hasta ahora sólo dependen de las características de la vivienda.
Supervision
El supervisor se encarga de controlar directamente, tanto en el terreno como en la oficina, la labor que desarrollada por los encuestadores. Para ello, debe tener conocimiento de la metodología definida para la recolección de los datos de la encuesta y los parámetros de trabajo establecidos. De esta manera se logra información de alta calidad.
Al supervisor le compete la planificación del trabajo de terreno. Eso significa:
- Organizar los recursos humanos y de movilización.
- Dirigir, controlar y evaluar las acciones planificadas, de acuerdo a la programación establecida por la Coordinación General.
El proceso de supervisión se cierra con la función de controlar y evaluar el trabajo en su desarrollo y una vez concluido.
ASPECTOS QUE COMPRENDE LA SUPERVISION
Los aspectos que debe abarcar obligatoriamente la supervisión son:
- Control de desempeño, es la revisión de la tarea diaria del encuestador en cuanto a: diligenciamiento oportuno de los formularios en cada uno de los hogares seleccionados y al logro de las entrevistas de todos los miembros del hogar correspondiente.
- Control de calidad, tiene como objetivo verificar la calidad y consistencia de la información recolectada por los encuestadores.
- Control de visitas, apunta a revisar que el encuestador haya concurrido directa y personalmente a los hogares que debe encuestar. Además, que cumpla con las visitas concertadas para ubicar al informante indicado.
- Control de cobertura, que también se logra en parte con el control de visitas, tiene como propósito comprobar que los hogares encuestados correspondan exactamente a los seleccionados en la muestra.
- La evaluación de entrevistas, busca verificar el manejo del cuestionario por parte del encuestador. Específicamente en el conocimiento conceptual de éste, observancia de las secuencias, planteamiento de las preguntas a los informantes, determinación e inclusión de todos los miembros del hogar.
- La revisión de cuestionarios, implica examinar en gabinete todos los formularios diligenciados. El objetivo es detectar y corregir en terreno, si es necesario, inconsistencias, omisiones, legibilidad y grado de detalle de ciertas preguntas. Y comprende los siguientes aspectos:
· Verificación de las correcciones hechas por el encuestador en terreno generadas en la revisión de los formularios diligenciados.
· Comprobación de que las viviendas y hogares encuestados correspondan efectivamente a la selección muestral.
· Revisión de que la aplicación de los formularios, al hogar seleccionado, sea acorde con la metodología prevista para esta encuesta.
ALCANCE DE LA SUPERVISIÓN
El alcance de la supervisión cubre:
1. Revisión de cuestionarios del 100% de los cuestionarios de forma detallada y analítica.
2. Control de calidad, comprobando que los datos obtenidos en un hogar sean verdaderos, en días posteriores al trabajo del encuestador, cuando se trata de secciones urbanas. En secciones rurales se puede realizar en la misma jornada de trabajo, con posterioridad a la visita del encuestador. El Supervisor programa las visitas, de tal manera que cada sección de la muestra es controlada al menos una vez, visitando aleatoriamente algunos de los hogares encuestados. En las secciones que supervisa.
En caso de rechazo, el supervisor visita el hogar y trata de convencer al entrevistado para que suministre la información.
Es necesario prestar especial atención a aquellos encuestadores que reportan muchos casos de no-respuesta (rechazos, entrevistas incompletas, ocupados, moradores ausentes, etc.); es posible que se trate de personas ineficientes o descuidadas en el trabajo o que su técnica de entrevista no sea la más apropiada, por lo que se toman las medidas necesarias para corregir esta situación.
PAUTAS PARA LA REVISION DE LAS ENCUESTAS LOGRADAS
El supervisor:
1. Revisa el traspaso de los códigos de identificación desde la carpeta de sección al cuestionario.
2. Comprueba que el número de hogar, sea el mismo que el del directorio de hogares seleccionados.
3. Verifica que el número de hogar sea correlativo dentro de la vivienda, deben haber tantos formularios numerados correlativamente, como hogares tengan la vivienda.
4. Revisa la legibilidad de la escritura, (letra y números).
5. Verifica orden de anotación de los miembros del hogar.
6. Examina que todas las personas a entrevistar están en los módulos correspondientes y todas las preguntas contestadas.
7. Verifica que todos los datos de la EH 2006 están respondidos
8. Siempre registra la fecha de la entrevista y el nombre y firma del encuestador que logró la encuesta.
9 Revisa que las secuencias que indica el propio cuestionario, a través de los saltos que se señalan, esté completa y correcta.
10. Verifica que las observaciones anotadas, si las hay, son concordantes con la información registrada en el cuestionario.
11. Cualquier otra que indiquen los responsables de la encuesta.
El supervisor, para poder evaluar el trabajo que realiza el encuestador, actúa como observador en el momento en que éste entrevista al informante. Eso implica que la evaluación se realiza en el marco de la programación habitual del trabajo de levantamiento de información. La frecuencia recomendada para efectuar la supervisión directa a los encuestadores, es realizar 2 evaluaciones semanales por encuestador, al comienzo del período de encuesta. Posteriormente se puede reducir la frecuencia, de acuerdo al comportamiento observado en los encuestadores. Como no es posible verificar la información de cada cuestionario, se acude a una submuestra de hogares. En esta se hace acompañamiento a aquellos encuestadores que a juicio del supervisor estén cometiendo errores de diligenciamiento u omisiones muy frecuentes.