COL_2012_ENUT_v01_M
Encuesta Nacional de Uso del Tiempo 2012-2013
National Time Use Survey
Name | Country code |
---|---|
Colombia | COL |
Other Household Survey [hh/oth]
a) Antecedentes
Establecer cómo distribuyen el tiempo las personas en sus actividades cotidianas, ha sido una inquietud constante en investigadores alrededor del mundo. Las primeras investigaciones sobre el uso del tiempo se remontan a la primera década del siglo XX con estudios sociales sobre las condiciones de vida de la clase obrera, en barrios específicos de algunas ciudades de Europa y Estados Unidos, en donde se buscaba determinar la distribución entre trabajo y tiempo libre (Reeves, 1913).
En 1964 se desarrolló el Proyecto Multinacional de Investigación Comparativa sobre la Distribución del Tiempo. Este abarcó 12 países (siete de Europa oriental, tres de Europa occidental, Estados Unidos y Perú) y permitió realizar comparaciones internacionales y evidenciar las dificultades metódicas y analíticas al comparar la información, lo que dio como resultado una base para el desarrollo de metodologías para la investigación de este tema (Szalai, ed., 1972).
En la Primera Conferencia Mundial sobre la Condición Jurídica y Social de la Mujer realizada en México (1975), se plantea como uno de los objetivos para la labor de las Naciones Unidas, la integración y plena participación de la mujer en el desarrollo. En sintonía con los acuerdos de la Primera Conferencia (1975), los países miembros de la CEPAL aprobaron en La Habana en 1977 el Plan de Acción Regional sobre la Integración de la Mujer en el Desarrollo Económico y Social de América Latina (PAR). Dicho Plan de Acción se evalúa periódicamente y a la fecha contiene numerosos aspectos orientados a medir y reconocer el trabajo no remunerado y su aporte al Producto Interno Bruto (PIB).
En 1979 el reporte de progreso en el desarrollo de estadísticas de uso del tiempo, presentado a la Comisión de Estadística de las Naciones Unidas en su sesión número 20, consideró la información sobre el uso del tiempo como un nuevo campo de estadísticas que permite obtener información relacionada con los aspectos económicos y condiciones sociales de la población y en especial con el desarrollo de métodos de medición de la fuerza laboral en los cuales se incluyan las labores del hogar, principalmente desarrolladas por mujeres.
En la Plataforma de Acción de Beijing realizada en 1995 y adoptada en la Cuarta Conferencia Mundial sobre la Mujer, se recomendó que los servicios estadísticos internacionales, y los organismos gubernamentales así como los de las Naciones Unidas, deben procurar “Mejorar la obtención de datos sobre toda la contribución de la mujer y del hombre a la economía, incluyendo su participación en el sector no estructurado”, además “Desarrollar una clasificación internacional de actividades para las estadísticas sobre el uso del tiempo en que se aprecien las diferencias entre mujeres y hombres en lo relativo al trabajo remunerado y no remunerado, y reunir datos desglosados por sexo” (Declaración y Plataforma de Acción de Beijing,1995, págs. 94 y 95).
Teniendo en cuenta lo anterior, la ENUT es una respuesta al contexto descrito anteriormente, permitiendo la recolección sistemática de información sobre tiempos y actividades diarios de las personas encuestadas.
b) Referentes internacionales
En los últimos años las investigaciones sobre el uso del tiempo han girado en torno a dos temas de vital importancia: la utilización del recurso humano en los hogares y la mejora de la medición del empleo, desempleo y subempleo (Naciones Unidas, 1990).
Sobre los antecedentes de las encuestas de uso del tiempo de gran cobertura, en América Latina se cuenta con los documentos de la Comisión Económica Para América Latina (CEPAL), en donde se identifica la importancia de las encuestas de uso de tiempo y el lugar que han venido cobrando en los últimos años en América Latina y se hace un reporte sobre el estado de estas investigaciones en cada país.
En la década de los noventa y principios del siglo XXI, países como República Dominicana (1995), México (1996 y 1998), Nicaragua (1998) y Cuba (2002), realizaron las primeras encuestas de este tipo a nivel nacional. Hoy día se cuenta con la experiencia de una encuesta específica sobre uso del tiempo en Argentina, Cuba, Chile, Ecuador, México, Brasil y Uruguay. Sumado a lo anterior, la mayoría de los países latinoamericanos han incluido o están en proceso de incorporar módulos de uso de tiempo a sus encuestas de hogares.
Por su parte, España ha realizado dos encuestas independientes de tipo diario durante los años 2002-2003 y 2009-2010. Así mismo, Estados unidos realizan encuestas anuales sobre este tema.
Dichas encuestas han permitido establecer un referente para la ENUT en torno a los temas de la encuesta, el listado de actividades descrito y los rangos de tiempo con respecto a los cuales se hacen las preguntas.
c) Referentes nacionales
En relación con el uso del tiempo, Colombia cuenta con un módulo denominado Otras actividades incluido en la Gran Encuesta Integrada de Hogares (GEIH), en donde a partir de septiembre de 2006 se miden algunas actividades no remuneradas. Las actividades no remuneradas incluidas en el módulo comprenden aquellas que, en forma agregada, permiten aproximarse a la medición de tiempo que las personas dedican al trabajo no remunerado. Las más representativas de las diez actividades del módulo son: oficios que las personas realizan en su hogar, cuidado de niños, cuidado de personas enfermas, mayores y discapacitadas, ayuda en labores de campo o cría de animales, y autoconstrucción de vivienda.
En relación con la estructura del cuestionario de la ENUT, se han utilizado las experiencias de la GEIH y la Encuesta Nacional de Calidad de Vida, para crear módulos que permiten contextualizar a las personas en relación con temas como: mercado laboral, sistema de salud, caracterización de la vivienda y datos del hogar.
El DANE para el desarrollo de su objetivo misional de producir estadísticas oficiales, que cumplan con los estándares internacionales y que sirvan de base para la toma de decisiones, se propone dar cumplimiento a la Ley 1413 de 2010. Por medio de esta, se regula la inclusión de la economía del cuidado en el Sistema de Cuentas Nacionales (SCN), con el objeto de medir la contribución de la mujer al desarrollo económico y social del país y como herramienta fundamental para la definición e implementación de políticas públicas. En su artículo 4 indica que el DANE es el organismo encargado de “establecer los mecanismos y realizar las gestiones necesarias para planear, diseñar, aplicar y actualizar una Encuesta de Uso del Tiempo, instrumento indispensable para obtener la información sobre Trabajo de Hogar No Remunerado”.
Sample survey data [ssd]
La unidad de análisis de este estudio describe: vivienda, individuos y hogares
El alcance de la encuesta incluye:
Identificación
Condiciones de la vivienda
Datos del hogar
Composición del hogar
Salud
Cuidado de los niños y niñas menores de 5 años
Educación
Fuerza de trabajo
Uso del tiempo trabajo no remunerado, así como las actividades personales realizadas por los miembros del hogar de 10 años y más.
Tiene un cubrimiento nacional y corresponde a la cabecera y el resto de los municipios, con excepción del área rural de San Andrés. Para esta encuesta se constituyeron los siguientes dominios: Región Atlántica, Región Oriental, Región Central, Región Pacífica, Bogotá D.C. y la cabecera de la isla de San Andrés.
El universo para la Encuesta Nacional de Uso del Tiempo está conformado por la población civil no institucional residente en todo el territorio nacional.
Name | Affiliation |
---|---|
Dirección de Metodología y Producción Estadística - DIMPE | Departamento Administrativo Nacional de Estadística - DANE |
Name | Role |
---|---|
Departamento Administrativo Nacional de Estadística | Ejecutor |
Teniendo en cuenta los objetivos de la ENUT, se optó por conformar una muestra manteniendo las premisas del diseño de la muestra maestra de las encuestas a hogares y colapsando los 360 estratos probabilísticos agregándolos a 180 para la representatividad de la muestra en regiones y distribuyéndolas mensualmente en 15 UPM, que agregadas a las 24 capitales de departamento garantizaran una distribución adecuada en el territorio. Por consiguiente, prevalecen las premisas y características de la Muestra Maestra, con las particularidades propias de la investigación.
La precisión se expresa en términos del error estándar, que es el indicador de la precisión de los resultados estimados, y refleja la variabilidad del azar propia de las muestras probabilísticas.
El error estándar relativo (ESrel) o coeficiente de variación (CV) es el error estándar absoluto expresado como proporción o como porcentaje del valor del estimador. Se estableció como precisión deseable de los indicadores de nivel o magnitud, un error estándar relativo (ESrel) máximo de 0,05 o 5%, para tasas de alrededor del 10%.
Por ser una submuestra de la Muestra Maestra para las Encuestas a Hogares adquiere las mismas características:
a) Probabilístico: cada unidad de muestreo tiene una probabilidad de selección conocida y mayor que cero. Esta información permite determinar a priori la precisión deseada en las estimaciones y, posteriormente, calcular la precisión de los resultados obtenidos a partir de la información recolectada.
b) De conglomerados: son grupos de las unidades de observación de la investigación, que se han dado en forma natural por razones geográficas, demográficas y socioeconómicas. El muestreo de conglomerados permite minimizar los costos de la recolección, a costa de un moderado incremento en el error estándar de las estimaciones. El efecto de la conglomeración de las unidades de muestreo en la precisión de los resultados está asociado con la correlación intraclásica (dentro de los conglomerados) de las variables de resultado, con el tamaño y con el número de los conglomerados seleccionados. En un diseño óptimo, a mayor correlación intraclásica, menor el tamaño del conglomerado o la sub-muestra dentro de este, y mayor el número de conglomerados, y viceversa.
Las estimaciones provenientes del muestreo de conglomerados desiguales son sesgadas, pues los valores de la distribución de muestreo no son iguales a los valores poblacionales o del universo de estudio. El sesgo se reduce considerablemente estratificando por tamaño los conglomerados. Las siguientes son las categorías de conglomerados de la muestra:
· Unidades Primarias de Muestreo (UPM): se denominan así los municipios de 7.000 y más habitantes. Los municipios de menor tamaño se han combinado con algún vecino de similares características, para completar un tamaño mínimo de 7.000 habitantes, y poder así garantizar los requerimientos de tamaño muestral a este nivel.
· Unidades Secundarias de Muestreo (USM): son las manzanas en las cabeceras municipales y secciones en el resto del municipio.
· Unidades Terciarias de Muestreo (UTM): son los segmentos o medidas de tamaño MT (áreas de 10 viviendas en promedio) tanto en la cabecera como en el resto del municipio, con límites naturales fácilmente identificables, en los cuales se encuestan todos los hogares.
c) Estratificado: es la clasificación de las unidades de muestreo del universo en grupos homogéneos, en función de variables independientes, altamente asociadas con los indicadores de estudio y poco correlacionadas entre sí, con el objeto de maximizar la precisión de los resultados. La estratificación es la técnica de optimización por excelencia, su efecto en la magnitud del error estándar de estimación depende del grado de homogeneidad interna de los estratos y de su heterogeneidad entre si.
Criterios de estratificación
El primer estrato corresponde a las veinticuatro capitales y áreas metropolitanas de las cuales se seleccionó una muestra. Para la estratificación y selección de la muestra, las áreas geográficas se organizaron según la nomenclatura cartográfica establecida, en sectores, secciones y manzanas con la información del número de viviendas en el nivel de manzana y por estrato socio-económico.
El segundo estrato corresponde al resto de cabeceras, centros poblados y zona rural dispersa. Los municipios se estratificaron de acuerdo con los siguientes criterios:
Geográficos, a nivel de departamento.
Socioeconómicos, a nivel de UPM, con los siguientes indicadores: Volumen de población; Nivel de urbanización, en términos de la cantidad de población de las cabeceras municipales; Estructura urbano-rural de la población municipal (% de población en cabecera); Proporción de la población con necesidades básicas insatisfechas (NBI), la cual, a su vez, se clasificó en 4 intervalos: A [0-29,8%); B [29,8%-42,7%); C [42,7%-57,3%); y D [57,3%-100%].
Los municipios cuyo tamaño era similar al tamaño promedio de los estratos, se constituyeron en UPM de certeza o inclusión forzosa, con probabilidad 1; las demás UPM se agruparon en estratos de no certeza o inclusión probabilística, aplicando las variables de estratificación en el orden de prioridad especificado anteriormente. De cada estrato de no certeza, se seleccionó una UPM con probabilidad proporcional al tamaño de su población (PPT), utilizando la Técnica de Selección Controlada, para optimizar su composición interdepartamental e interregional.
Adicionalmente, la selección de las UPM a partir de los estratos elaborados se hizo con la Técnica de Selección Controlada la cual es un proceso extendido de estratificación que optimiza aún más la selección.
d) Multietápico: para lograr la selección de las unidades de observación (viviendas, hogares o personas), se seleccionaron secuencialmente las unidades de muestreo de cada tipo (UPM, USM y UTM), con probabilidades de selección en función del número de viviendas. La probabilidad final de selección de viviendas, hogares y personas, es el producto de las probabilidades de las tres etapas.
Definición del tamaño de la muestra
Los cálculos se hicieron con fórmulas correspondientes un diseño muestral aleatorio simple de elementos (MAS) ajustado por un efecto de diseño (DEFF). El efecto de los conglomerados en el diseño, es una relación, para cada dominio, entre la varianza real de este diseño de conglomerados y la que se obtendría con un diseño aleatorio simple de elementos (MAS). Los valores de DEFF provienen de los resultados de las diferentes encuestas que se realizan con regularidad.
Los tamaños de muestra en hogares, se presentan a continuación:
Cabecera: 36.993
Resto: 9.317
Total: 46.310
Los resultados de la muestra son representativos de la población objetivo total; por tanto, éstos se deben expandir a partir de cada segmento seleccionado con el fin de producir estimaciones válidas de dicha población.
Los componentes del factor de expansión se explican a continuación:
Factor básico de expansión (F). Aplicado a los datos muestrales proporciona a cada elemento de la muestra el peso o representación que le corresponde en el universo investigado. En consecuencia, mediante su aplicación, se estiman numéricamente, en forma aproximada, las características de dicho universo
Peso de sub-muestreo (Ph). Está dado por segmento y teóricamente es igual a 1 para todos los segmentos en razón que representa una medida de tamaño. Sin embargo, en algunos casos por el desarrollo dinámico del marco de muestreo puede hacer que este peso sea mayor o menor que 1, de acuerdo con la densidad de viviendas del segmento en el momento de hacer la encuesta; por tal motivo, modifica el factor básico de expansión en el segmento.
Ajuste por el periodo de tiempo de referencia de la encuesta (T). Para incorporar la dimensión temporal en las encuestas de uso del tiempo es necesario introducir un factor adicional para la elaboración de las estimaciones por días/persona el cual se obtiene dividiendo los 365 días del año por los días de referencia en la encuesta. En este caso, como se toma el hogar completo, la ponderación se aplica tomando el total de hogares dividido por el número efectivo de días aplicados de la encuesta, para cada uno de los dominios desagregados por zona. El ajuste consiste en dividir el promedio diario de hogares encuestados entre el número de hogares efectivamente encuestados en el día.
Ajuste de cobertura por no-respuesta (Rh) Es importante, cuando las tasas de no-respuesta varían en los subgrupos de la población de diferentes características (ejemplo, en los estratos socioeconómicos). En este caso, la no-corrección, daría lugar a estimaciones sesgadas para el conjunto de la población estudiada. El ajuste habitual es asignar a los hogares y personas no encuestadas, el promedio de las características de los encuestados en el mismo segmento. Esto se logra, corrigiendo el factor básico de expansión por un nuevo factor resultante de la razón entre el número de hogares seleccionados en un segmento y el número de hogares encuestados en el mismo segmento.
En la metodología se describen las definiciones de las probabilidades de selección y de los factores de expansión y ajuste.
El tipo de formulario utilizado en la ENUT está conformado por un listado de diferentes actividades que se van preguntando al encuestado. Cuando este reporta realizar la actividad, se le solicita informar el tiempo que les tomó en desarrollar dicha actividad, especificándolo en horas y minutos. Aunque el periodo de referencia es el día anterior, el tiempo total reportado por el encuestado puede diferir de las 24 horas por presencia de simultaneidad.
Para la ENUT se ha diseñado un formulario analítico que está compuesto por 9 capítulos diseñados para responder a las necesidades de información que se presentan sobre los temas relacionados con el uso del tiempo.
A continuación, se presenta la estructura del formulario y los objetivos de cada capítulo:
Capítulo A, identificación: contiene 20 preguntas cuyo objetivo es el de captar la información de la vivienda, la ubicación, los datos de identificación y el día asignado de visita.
Capítulo B, condiciones de la vivienda: contiene 3 preguntas con las que se busca obtener información para caracterizar los espacios que habitan los hogares mediante datos como: el tipo de vivienda, el material predominante de sus pisos y el acceso a servicios públicos domiciliarios.
Capítulo C, datos del hogar: contiene 6 preguntas que componen este capítulo se pretende caracterizar los hogares objeto de encuesta de acuerdo al régimen de tenencia de la vivienda, recepción de subsidios, prácticas de disposición de basuras, disposición y uso de bienes de equipamiento del hogar entre otras.
Capítulo D, composición del hogar: contiene 10 preguntas que tienen como objetivos el Identificar las personas que conforman el hogar, establecer el parentesco con la persona que tiene la jefatura del hogar así como identificar los diferentes núcleos familiares, el auto-reconocimiento a grupos étnicos y establecer el estado civil de las personas de 12 años y más.
Capítulo E, salud: contiene 8 preguntas se pretende obtener información sobre afiliación al Sistema General de Seguridad Social en Salud (SGSSS), enfermedad temporal, enfermedad crónica (no transmisible), condición de discapacidad y tiempo requerido para acceder a servicios de salud.
Capítulo F, cuidado de los niños y niñas menores de 5 años: contiene 5 preguntas busca recopilar información acerca de asistencia a establecimientos de cuidado, distribución de tiempo por lugar de permanencia y tiempo dedicado a actividades específicas de esparcimiento y descanso.
Capítulo G, educación: contiene 15 preguntas que tienen como objetivo obtener información de asistencia a la educación formal, informal y no formal, nivel educativo, tiempos dedicados a asistencia, traslado, realización de deberes escolares para todas las personas de 5 años y más, que sean miembros del hogar, así como actividades específicas de esparcimiento y descanso para las personas del hogar de 5 a 9 años.
Capítulo H, fuerza de trabajo: contiene 37 preguntas con las que se busca caracterizar a la Población en Edad de Trabajar (PET) así como obtener información sobre empleo principal y secundario, ingresos laborales, tiempos de trabajo, traslados de la población ocupada e ingresos no laborales para el componente restante de la Población en Edad de Trabajar (PET).
Capítulo I, uso del tiempo: contiene 29 preguntas pretende establecer la distribución en términos de tiempo, de las actividades de trabajo no remunerado, así como las actividades personales realizadas por los miembros del hogar de 10 años y más.
Start | End | Cycle |
---|---|---|
2012-07-02 | 2013-08-31 | Bienal |
Name | Affiliation |
---|---|
Departamento Administrativo Nacional de Estadística | Gobierno Nacional |
Para el control del operativo se contó con una serie de formatos y reportes semanales que permitieron llevar un control de la información transmitida y la calidad de la misma.
El equipo de diseños muestrales definió los segmentos y el orden de recolección de los mismos para cada una de las ciudades. Para garantizar que esto se cumpliera, las sedes y subsedes enviaron a logística de DANE central un cronograma mensual con el inicio, orden y finalización de recolección de información de los segmentos, junto con el numero tentativo de viviendas a realizar por día. Se verifico que correspondiera a los parámetros establecidos por Diseños Muestrales y que el total de viviendas al finalizar el mes, fuera equitativo para cada día de la semana, sin presentar sesgos. En los casos que esto no se cumpliera se comunicó a la sede o subsede y ellos realizaron las correcciones respectivas.
A continuación, se describen los formatos que se usaron.
El principal usuario del formato fue el Coordinador de Campo, que debía consolidar la información de los supervisores que tenga a su cargo, para luego enviar semanalmente estos resúmenes al área de Logística en el DANE Central vía FTP. Al descargar los resúmenes de cobertura y consolidar esta información en el área de Logística DANE Central, se identificaron los errores que se pudieron cometer en el momento de diligenciar el formato, que, junto con las alarmas reportadas, (ejemplo: menos de 7 viviendas en un segmento) ayudaron a mejorar la calidad y completitud de la información, antes de realizar el cierre del periodo.
Alarmas e inconsistencias. Semanalmente todos los errores detectados en los resúmenes de cobertura fueron consolidados en un único archivo especificando la ciudad, semana, segmento y tipo de error. Posteriormente estos errores fueron notificados a los encargados de cada ciudad para que hagan las respectivas verificaciones, corrigieran el resumen de cobertura y lo transmitan nuevamente vía FTP.
Comparativo sistemas vs campo. Cada semana, luego de consolidar la totalidad de la información de cobertura de campo de las 24 ciudades, se hizo un cruce de variables con la base de sistemas a nivel de viviendas, hogares y personas. Se consolidó la información comparada por segmento y se envió a las ciudades para su respectiva revisión. De esta forma es posible que las ciudades detectaran información errónea en los resúmenes de cobertura, o la posible falta de información en la base de sistemas.
A partir de esto, las ciudades debían hacer los ajustes respectivos al resumen de cobertura y transmitirlo nuevamente vía FTP. Por otro lado, si la información de campo era correcta, debían verificar las inconsistencias en la base de sistemas y enviar nuevamente los archivos respectivos notificando al ingeniero encargado de descargar la información en DANE Central.
Al inicio del operativo (agosto 2012), todas las ciudades presentaron diferencias en cuanto a lo registrado en campo comparado con sistemas, pero a medida que avanzó el operativo estas diferencias fueron disminuyendo considerablemente.
a) PROCESO DE DISEÑO Y CAPTURA
El diseño de formularios para captura de datos a través de dispositivos móviles se realiza mediante la herramienta SysGold-SysSurvey.
Inicio. Inicio del proceso de solicitud de generación de formulario, encuesta o investigación
Registrar Solicitud de Creación de Formularios. Entrega de los documentos con los insumos para la encuesta por parte del componente temático de la investigación.
Análisis de Factibilidad con la Herramienta de Diseño. La interfaz gráfica de desarrollo utiliza el método Drag and Drop (Arrastrar y Pegar), el cual facilita el diseño y el flujo de las preguntas y validaciones de manera eficiente. Sysgold tiene una conexión personalizada a través de un bucle invertido, permitiendo invocar servicios internos de la aplicación de manera local, además cuenta con integración con bases de datos externas, ya que el diseño de un formulario además de guardarse en formato dbf también se almacena en formato mdb, es decir, de bases de datos Acces donde se guardan las preguntas, tipos de datos validaciones y demás anotaciones pertinentes al diseño de un formulario o encuesta. Sysgold ofrece mecanismos de replicación, es decir puede trabajar y compartir información de dos investigaciones bajo un mismo repositorio de manera transparente para el usuario y para los mismos repositorios.
Aprobar Solicitud de Generación de Formulario. Se realiza el análisis del formulario diseñado para la investigación enviado por el componente temático, evaluando la viabilidad de implementación en el diseñador de encuestas.
Decisión de Aprobación. Apruebe o Rechace la solicitud.
Configurar Dominios de Preguntas. Ofrece un dominio de preguntas de tipo Numérico, Texto, Fecha, Lista de valores (Única, Múltiple), Listas dinámicas o tablas prediseñadas en formato dbf de Visual Fox Pro que permita importar y exportar datos Excel.
Diseñar Flujo de Preguntas. El diseño del flujo de preguntas se organiza a través del objeto Group Option, que da una apariencia de organización en bloque o Capitulo y del objeto Cicle, que permite agrupar una cantidad determinada de preguntas que se harán dentro de un ciclo de acuerdo a la cantidad de personas en los hogares.
Asociar Reglas de Validación. Se implementan de acuerdo al documento de especificaciones validación y consistencia, que permiten validar entre otras, Rangos, Tipos de Datos, Flujo de datos, Operaciones Aritméticas.
Compilar Formulario. Una vez elaborado el formulario se puede realizar compilaciones de verificación de tipo de relación de objetos en la investigación y validación de consistencia de la misma. A su vez proporciona excepciones de manejo de Script programables en lenguaje VisualBasicScript, que dan lugar al cumplimiento de las especificaciones técnicas de la investigación.
Ejecutar Plan de Pruebas. Una vez diseñados y modelados los procesos para la captura de información se procede a realizar un plan de pruebas, que permita evaluar el formulario y determinar su salida a campo, mediante pruebas de escritorio y consistencia de datos.
Generar Instaladores. Para generar instaladores todas las instancias ofrecen métodos de sincronización para recibir y enviar información, y se establecen de acuerdo a las especificaciones diseñadas por el componente logístico de la investigación, Manejada a través de roles: encuestador, sensibilizador y supervisor.
Generar Tablas. La generación de tablas dinámicas incluye una serie de campos de diferentes tipos que son usadas por el diseñador como información de referencia para la validación (Segmento y Áreas Geográficas).
Distribución Cartográfica. Permite cargar las tablas con la información a recolectar en cada uno de los dominios definidos por el componente logístico de la investigación, esta información relaciona los datos cartográficos y geográficos de la muestra a trabajar.
Definir Reglas de Validación Cierre de Formulario. Las reglas de validación de cierre de encuestas involucran el ingreso de preguntas de control de flujo de la encuesta, a nivel de vivienda, hogar, personas y capítulos específicos, en donde a través de especificaciones se controla el acceso a determinados capítulos del formulario.
Generar Árbol de Usuarios. La definición de un árbol de usuarios y las condiciones de visibilidad del mismo permite definir criterios y reglas de asignación de cargas de trabajo. Todos los usuarios que se incluyen, cualquiera puede realizar un área específica de trabajo, ya que todos tienen la misma distribución de segmentos a recorrer en las jornadas definidas.
Descarga Aplicativos FTP. Los instaladores son descargados en formato comprimido (zip) por parte del apoyo de sistemas asignado para cada investigación, el cual tiene un nombre de usuario y una clave de autenticación para acceder a los buzones.
Verificación de Distribución de Cargas de Trabajo. El coordinador operativo es el encargado de verificar que la tabla de homologación dispuesta con el aplicativo corresponda a las cargas de trabajo a realizar en esa etapa.
Comprobación de Segmentos y Áreas Geográficas. El apoyo informático de las sedes realiza pruebas de escritorio, simulación en campo y se encarga de validar el formulario y la cartografía generada para cada una de las etapas de la encuesta.
Captura en Campo. Una vez digitados los datos en los dispositivos móviles de captura - DMC, a través del utilitario backup del aplicativo o copiando directamente las carpetas Survey1, Survey2 y Maps, se debe generar un backup de la información recolectada diariamente por cada encuestador, la tarjeta con dicha información debe ser entregada al supervisor y éste a su vez debe entregarla al apoyo operativo o de sistemas de cada sede o subsede.
Consolidación de Información. Consiste en ir almacenando en el computador personal del apoyo de sistema todos los puntos realizados y las novedades presentadas.
Registro de Novedades. Se presentan debido a la inclusión de nuevas áreas de trabajo por cambios en la muestra asignada para cada etapa.
Transmisión de Información vía FTP. Una vez capturada la información se comprime y se dispone en el buzón FTP creado para cada sede o subsede, para su posterior análisis y procesamiento.
Fin. Finalización del proceso.
b) CREACIÓN DE LA ENCUESTA (ORACLE)
Fue necesario contar con el motor de bases de datos ORACLE, en un esquema creado para la investigación que permite el cargue y almacenamiento general de los datos. La base de datos para la ENUT, fue una base de datos relacional en donde cada tabla corresponde a un capítulo de la encuesta. Existe un único registro por vivienda.
Se asignó el número de la encuesta asociado a la investigación y se definieron los tipos de datos, textos de las preguntas, listas de valores asociados, sub-preguntas, entre otros.
Se definieron los formularios y subformularios en relación con los tres niveles básicos de toma de información: Vivienda, Hogar y Personas. Cada uno de los niveles relacionados consta de uno o varios capítulos, de acuerdo. Adicional a lo anterior, se establecieron los flujos y validaciones de todas las preguntas del formulario.
c) DEFINICIÓN FORMULARIO DE CAPTURA - DMC
En la estructura del formulario SysSurvey se asoció a cada pregunta el código equivalente con el código de pregunta en Oracle en el campo "NOTA", incluyendo el número de formulario.
d) ENVÍO DE INFORMACIÓN
Diariamente se envió información de encuestas completas a DANE Central. Para este proceso se utilizó el aplicativo SWIN desarrollado en JAVA que permite generar el árbol jerárquico y el nombre de los archivos generados para ser enviados, donde se hace la consolidación de la información y realizar la transmisión de datos de las encuestas a través del FTP (File Transfer Protocol). Este es un protocolo de red para la transferencia de archivos entre sistemas conectados a una red, basado en la arquitectura cliente-servidor. Desde el equipo cliente (Territorial) las ciudades se conectaban a un servidor para descargar archivos desde él o para enviarlos.
A cada ciudad se le creó un buzón en el servidor FTP del DANE Central, en el cual se dispuso la información de las encuestas completas que se recolectaban diariamente y en cada fecha de cierre, aproximadamente cada 10 días, se colocó toda la información del segmento asignado para recolección (Encuestas completas e incompletas).
e) CONSOLIDACIÓN DE ARCHIVOS
Recibidos los archivos, la información fue almacenada en una estructura jerárquica de acuerdo a la procedencia, supervisor y encuestador. Y se ejecutó el proceso de detección y eliminación de archivos duplicados, utilizando el aplicativo CloneSpy, con el fin de no cargar encuestas repetidas en la base de datos, esta información permaneció encriptada para garantizar la seguridad. Se realizó un proceso de separación de encuestas completas, incompletas y archivos de geo-referenciación a través de aplicativos diseñados en Visual Foxpro con el fin de asegurar que la estructura de la información recibida correspondiera a la investigación asignada y al periodo de referencia. Una vez se seleccionan los archivos que se debían cargar en la base de datos, se realizó el proceso de carga utilizando un aplicativo hecho a la medida en el lenguaje de programación JAVA.
f) CARGUE DE INFORMACIÓN
Al iniciar el proceso de carga se realizó la desencripción de los archivos y verificación de la identificación única para cada encuesta, garantizando que no exista duplicidad en la información. Una vez cargados los datos, se generó un log que indicó el estado y/o posibles fallas presentadas durante el proceso y se procedió a hacer la transposición de toda la información para ser distribuida en las tablas creadas para cada capítulo de la investigación. De esta manera cada tabla está relacionada a cada uno de los niveles que se manejan dentro de la encuesta (vivienda - hogar - persona).
g) CONSISTENCIA DE INFORMACIÓN
A través del desarrollo de sentencias Oracle, se identificaron posibles inconsistencias por duplicidad a nivel de personas y problemas de georreferenciación en el momento de creación de encuestas y selección de segmentos a trabajar. Se generaron reportes de cobertura y frecuencias que permitieron realizar constantemente el monitoreo y control a la información que se recolectó y cargó en las bases de datos. Posteriormente en el esquema diseñado en ORACLE se crearon procedimientos para validar la información de la base de datos, los flujos, variables sin información, rangos y estructura, con el fin de realizar el proceso de adicionar los factores de expansión a las encuestas completas.
Cálculo de la precisión observada
Todas las estimaciones de las características de un universo de estudio, basadas en una muestra probabilística, son aproximadas, razón por la cual es importante establecer su nivel de precisión o margen de error; el indicador apropiado es el error estándar o error de muestreo, que mide la variabilidad del azar propia de las muestras probabilísticas. El error estándar relativo (ESrel) o coeficiente de variación del muestreo (CV) es la expresión del error estándar como proporción o porcentaje del valor del indicador. La formulación matemática para el cálculo del error estándar se realiza en función del tipo de muestra, de las etapas de la selección y de sus probabilidades.
Para el diseño descrito se está usando el Método de Linealización de Taylor, adaptado para este muestreo estratificado de conglomerados desiguales. Para efectos de la presentación de los resultados, es útil establecer los límites de confianza entre los cuales se pueden encontrar los verdaderos valores del universo de estudio, con un determinado nivel de seguridad (nivel de confianza). Lo usual es calcular tales límites con un 95% de confianza, para ello, se resta y se suma al indicador 1,96 veces el error estándar del mismo.
Se utilizan los siguientes estimadores (para las fórmulas ver la metodología):
Estimador de la varianza para un Total
Estimador de Razón
Estimador de la varianza de la Razón
Departamento Administrativo Nacional de Estadística
Departamento Administrativo Nacional de Estadística
http://formularios.dane.gov.co/Anda_4_1/index.php/catalog/214/get_microdata
Costo: Ninguno
Name | Affiliation | URL | |
---|---|---|---|
Departamento Administrativo Nacional de Estadística | Gobierno Nacional | www.dane.gov.co | dane@dane.gov.co |
Is signing of a confidentiality declaration required? | Confidentiality declaration text |
---|---|
yes | Ley 79 de 1993 Artículo 5: Los datos suministrados al Departamento Administrativo Nacional de Estadística DANE, en el desarrollo de los censos y encuestas, no podrán darse a conocer al público ni a las entidades u organismos oficiales, ni a las autoridades públicas, sino únicamente en resúmenes numéricos, que no hagan posible deducir de ellos información alguna de carácter individual que pudiera utilizarse para fines comerciales, de tributación fiscal, de investigación judicial o cualquier otro diferente del propiamente estadístico. |
El acceso a los microdatos anonimizados de uso público es de carácter gratuito y estará disponible en la página Web del DANE.
El acceso alosmicrodatos anonimizados por licencia, cuando requiera procesamientos adicionales, podrá tener un costo que será definido mediante acto administrativo.
El uso de estos datos debe ser reconocido mediante una citación que incluya:
La identificación del investigador principal
El título de la encuesta (incluyendo el país, el acrónimo y el año de aplicación)
El número de referencia de la encuesta
La fuente y la fecha de descarga
Ejemplo:
Departamento Administrativo Nacional de Estadística - DANE. Colombia, Encuesta Nacional de Uso del Tiempo (ENUT) 2012-2013, Ref. COL_2012_ENUT_v01_M. Dataset downloaded from [url] on [date]
El usuario de los datos reconoce que el recolector original de los datos, el distribuidor autorizado de los datos, y la entidad que apoya financieramente no son reponsables por el uso o interpretaciones realizadas por terceros.
Name | Affiliation | URL | |
---|---|---|---|
Jose Gabriel Tafur | DIMPE | jgtafur@dane.gov.co | |
Contacto DANE | DIMPE | contacto@dane.gov.co | http://www.dane.gov.co/index.php/contactenos |