Data Editing
PROCESAMIENTO DE LOS DATOS: CODIFICACIÓN Y VALIDACIÓN
La codificación es la primer etapa en la revisión de cuestionarios (archivos digitalizados) procedentes de la recolección de la información. En términos generales se da la codificación de variables previamente determinadas, como la actividad económica y la ocupación de las personas empleadas. Una vez que las preguntas de las entrevistas son codificadas, se realiza una validación de la información, es decir una limpieza de la información. Esta tarea se logra utilizando una serie de aplicaciones informáticas basadas en una tabla de inconsistencias que han sido diseñadas tanto para la captura de los datos como para la limpieza o validación de los mismos, estas aplicaciones se hicieron utilizando los lenguajes de programación C+, Visual Basic y SQL.
La codificación y validación se lleva a cabo en los meses de julio y agosto de 2018, se inició el 2 de julio y finalizó el 10 de agosto, contó con cuatro días de capacitación y se contó con 18 personas para esta labor de ellas, 8 personas para realizar la codificación de la información y 10 personas para la validación, en tanto dos funcionarios de oficina coordinaron dicho proceso.
A continuación, se detalla cada uno de estos procesos:
1. PROCEDIMIENTOS PARA REALIZAR LA CODIFICACIÓN ENAHO 2018
El proceso de Codificación se conforma por cuatro fases, en los que se revisa y codifica, ciertas variables de los cuestionarios; mismas que se muestran a continuación:
A. Asignación de las cargas de trabajo:
Esta etapa contempla la asignación de cargas de trabajo al personal codificador. Se dispondrá de una persona encargada de realizar la distribución del trabajo.
Para llevar a cabo dicha labor se cuenta con un sistema informático (Administrador) que permite controlar y administrar, tanto los cuestionarios transferidos desde campo para el Proceso de Codificación, como el mantenimiento de los usuarios en dicho proceso, controlando contraseñas de acceso, nombres de usuario, roles y cantidad de trabajo realizado y generación de reportes.
B. Codificación de Empresas de Cable e Internet, Geográfico y Educación:
C. Codificación de Sector Instituciones, Rama de Actividad y Ocupación:
Se trabajarán las siguientes preguntas:
- Apartado individual: preguntas C7a, C8 y C9a de la sección C. "Personas Ocupadas"; preguntas F1, F2 y F3a de la sección F. "Empleo Secundario", y preguntas G4a, G7, G8 y G9 de la sección G. "Personas Desempleadas".
D. Instrucciones generales para la codificación:
El proceso de codificación se realiza en 7 diferentes procedimientos y que se analizarán seguidamente; pero antes, es importante tener en cuenta:
a) En casos dudosos, no tome decisiones arbitrarias y consulte con la persona encargada del proceso; esto ayudará a utilizar siempre los mismos criterios.
b) Lea todas las observaciones que estén anotadas en las variables disponibles del cuestionario, así como las variables de apoyo a la codificación y que se adjuntan para facilitar el trabajo.
c) Apéguese estrictamente a los códigos existentes y no altere los manuales de códigos agregando nuevos valores según su criterio. Si una respuesta no puede ser "traducida" a un código existente, consulte con la persona encargada.
d) Siga las indicaciones que se le han especificado en este instructivo o cualquier otra que se hizo durante el proceso. No realice procedimientos que no le han sido autorizados o tareas que no le han sido asignadas.
e) Si las preguntas correspondientes de codificación están en blanco, no tiene que realizar ningún proceso de codificación, dado no se registró información en campo por la aplicación de los pases respectivos.
f) Las preguntas de codificación tienen asignado un "-1" de manera automática por el sistema, con el fin de visualizar que aún no se han codificado.
g) Lleve un orden estricto de su trabajo y de su escritorio. Además, haga las anotaciones que considere necesarias, para aquellos cuestionarios que marque como "pendientes" (en espera de ser resuelto por el personal encargado).
1.1. Codificación de Empresas de Cable e Internet, Geográfico y Educación
Este procedimiento consiste en codificar las empresas que brindan el servicio de cable e internet, características geográficas y de educación, para determinadas preguntas y para cada uno de los miembros del hogar.
1.1.1. Codificación de Empresas de Cable e Internet
Con la incorporación de las tabletas en la captura de datos, se agregaron catálogos de clasificación en algunas de las preguntas abiertas lo que permite que la codificación se realice de manera automática al seleccionar las opciones y desde el levantamiento en campo. El codificador será el responsable de codificar todas aquellas empresas de cable e internet que no hayan podido ser codificadas en campo.
1.1.2. Codificación de Geográfico
Esta es otra de las variables que, en tableta, incorpora un buscador de códigos, por lo que la mayoría de los casos van a venir completamente codificados. El codificador será responsable de codificar los cantones y países que no se hayan podido captar en campo.
1.1.3. Codificación de Educación
Por medio de estas preguntas se indaga por el nombre de la carrera, especialidad o curso de los estudiantes que además de la educación general básica y diversificada, están o estuvieron asistiendo a algún centro educativo de enseñanza formal o no formal que certifica mediante la entrega de un título.
1.2 Codificación de Sector Institucional, Rama de Actividad y Ocupación.
Este procedimiento consiste en codificar las preguntas C7a, F1, G7 (Sector Institucional), C8, F2, G8 (Rama de Actividad Económica) y C9a, F3a, G4a, G9 (Ocupación); además de la revisión de las preguntas de apoyo que se utilizan para analizar cada caso. En el diagrama 4, estas etapas corresponden a los pasos 4, 5, 6 y 7 respectivamente. Específicamente estas preguntas se agrupan por sección de la siguiente manera:
- Preguntas C7a, C8 y C9a de la Sección C. "Paso 4: Empleo Principal".
- Preguntas F1, F2 y F3a de la Sección F. "Paso 5: Empleo Secundario".
- Preguntas G4a, G7, G8 y G9 de la Sección G. "Paso 6: Personas Desempleadas"
1.2.1. Codificación de Sector
Preguntas: C7a, F1, G7. "Nombre del establecimiento del empleo principal, secundario y personas desempleadas"
El objetivo de estas preguntas es estimar el empleo público y privado. Para codificar estas preguntas el codificador utilizará el Clasificador de Sector Institucional, el cual es un catálogo propio del INEC que permite identificar de manera exhaustiva la pertenencia a uno u otro sector.
Tome en cuenta las siguientes pautas para codificar estas preguntas:
-Codifique la descripción anotada en las preguntas C7a, F1 o G7 en la casilla ubicada en la esquina superior derecha, en la que de forma automática el sistema asigna un "-1" cuando no se ha codificado la pregunta.
Analice detalladamente las preguntas relacionadas: C8 / F2 / G8 (Rama de actividad), C9a / F3a / G9(Grupo ocupacional) y C12 / F7/ G10 (Posición en el empleo); para asignar el código idóneo, ya que hay códigos de sector institucional que no son congruentes con la rama de actividad o la posición en el empleo.
1.2.2. Codificación de Rama
Preguntas C8, F2, G8. "Rama de actividad del empleo principal, secundario y personas desempleadas"
El objetivo de estas preguntas es conocer la actividad económica que realiza el establecimiento donde trabaja o trabajó la persona entrevistada. Para tal efecto, según el Sistema de Cuentas Nacionales el establecimiento se define como una empresa o parte de una empresa ubicada en un único sitio y en la que solo se realiza una actividad productiva (no auxiliar) o en la que la actividad productiva principal genera la mayor parte del valor añadido. Para llevar a cabo la codificación de estas preguntas se utilizará el Manual de Clasificación de Actividades Económicas (CIIU 4).
1.2.3. Codificación de Ocupación
Preguntas C9a, F3a, G9. "Ocupación en el empleo principal, secundario y personas desempleadas"
El objetivo de estas preguntas es conocer la ocupación que tiene o tuvo el trabajador(a), para identificar la distribución de la población ocupada en función de la especialización de la fuerza de trabajo.
La información sobre ocupación se indaga a través de las siguientes preguntas y según sea el caso:
- C9a, F3a, G4a: indagan el nombre de la ocupación que la persona tiene o tuvo.
- C9b describe las actividades o tareas que realiza o realizó en su trabajo.
- C9c especifica las herramientas, maquinaria o equipo que utiliza para realizar su trabajo.
Estas preguntas deben ser codificadas tanto para el empleo principal (pregunta C9a) como para el secundario (pregunta F3a) y antecedentes laborales o personas desempleadas (pregunta G4a y G9).
1.3. Sistema de Codificación Asistida
Para el desarrollo del trabajo de codificación de la Encuesta Nacional de Hogares 201, se utiliza un software informático que busca facilitar la asignación de códigos a las diferentes variables del cuestionario según corresponda.
Una vez que los datos son transferidos a oficina por el personal supervisor de Trabajo de Campo, estos se almacenan en un servidor manteniendo la identificación de cada uno de los cuestionarios aplicados. Con la información en el servidor del INEC, inicia el desarrollo de los demás procesos para el tratamiento de la información recolectada. El proceso de codificación es la fase inmediatamente posterior al Trabajo de campo, el encargado de la asignación del trabajo mediante un software asistido ingresa al servidor y distribuye el trabajo para cada miembro del equipo codificador.
Este sistema, se encuentra dividido en diferentes procesos que van de acuerdo a la composición de los espacios para completar la información de un hogar Enaho, y se presenta mediante una interfaz sencilla de manipular, convirtiéndose en una herramienta indispensable para el desarrollo del trabajo en codificación.
2. PROCEDIMIENTOS PARA REALIZAR LA VALIDACIÓN ENAHO 2018
El proceso de Validación se conforma por cinco procedimientos, en los que se revisa y depura la información capturada desde campo en los cuestionarios.
A. Asignación de las cargas de trabajo
Esta etapa contempla la asignación del trabajo al personal validador. Se dispondrá de una persona encargada de realizar dicha distribución.
Para llevar a cabo dicha labor se cuenta con un sistema informático que permite controlar y administrar, tanto los cuestionarios transferidos de la fase de codificación a la fase de validación, como el mantenimiento de los usuarios en dicho proceso, controlando contraseñas de acceso, nombres de usuario, roles y cantidad de trabajo realizado.
B. Verificación
Dado que los cuestionarios asignados ya han sido codificados, este procedimiento consiste en una revisión de la información codificada, utilizando la misma metodología y criterios empleados en la Unidad 2 de este instructivo, lo anterior con el fin de depurar mejor la información Enaho.
Deberá determinar si los códigos asignados en la codificación de Empresas de Cable e Internet, Geográfico y Educación o la Codificación de Sector Institucional, Rama de Actividad y Ocupación; están correctos. De lo contrario, deberá realizar los cambios y ajustes necesarios para la validación y la depuración de la información. No realice ningún cambio si tiene dudas del código asignado, consulte antes con el personal encargado.
Considere que todas las variables correspondientes han sido codificadas, por lo que no deben aparecer códigos asignados por el sistema con "-1" (ver unidad de codificación), de encontrar algún caso informe al personal encargado.
C. Depuración de la información: Inconsistencias
Este proceso consiste en la depuración de la información por medio de la revisión de inconsistencias, que son una guía para que el validador verifique la información anotada desde Trabajo de Campo en cada cuestionario, considerando el hogar, la personas miembros de ese hogar y las secciones aplicadas según los pases realizados; corrigiendo los casos que así se determinen.
Para realizar dicho procedimiento, es importante detallar que existen varios tipos de inconsistencias, algunas son sólo de revisión y validación, otras efectivamente son errores que deben ser corregidos. Sin embargo, antes de detallar los tipos de inconsistencias, se realizará una pequeña descripción de la estructura general del mensaje de una inconsistencia.
D. Depuración de la información: Revisión final
Este es el penúltimo proceso antes de enviar la carga asignada de validación hacia el siguiente proceso. Consiste en una última depuración de la información por parte del validador por medio de la revisión de inconsistencias finales.
E. Chequeo de inconsistencias por parte del personal encargado
Último proceso de validación realizado por parte del encargado del proceso como mecanismo de revisión del trabajo listo para enviar por el validador para determinar su desempeño en la depuración de la información asignada en cada carga.
2.1. Sistema de Validación Asistida
Al igual que para codificación, para la validación se utilizó un software informático que busca facilitar la depuración de la información Enaho 2018.
Este sistema se encuentra dividido en 5 procedimientos que van de acuerdo a la composición del sistema y de la recolección de los datos, y presenta una interfaz sencilla de manipular, lo que lo convierte en una herramienta indispensable para el desarrollo del trabajo en validador.
2.1.1. Inconsistencias
Este procedimiento se realiza hasta que se ha verificado la fase de codificación y luego ejecutando el botón de inconsistencias. Al darle "clic" en icono de inconsistencias, en la parte media de la pantalla se visualiza, tanto el total de inconsistencias en ese cuestionario, como el listado de inconsistencias a validar. Como se mencionó anteriormente algunas serán de revisión o validación, y de acuerdo a lo establecido en el mensaje, las mismas deberán ser validadas, depuradas o corregidas una por una.
2.1.2. Revisión final
Este proceso permite depurar aún más la información, verificando las inconstancias que se estarían pasando por alto en la primera revisión. Todas las inconsistencias que resulten al ejecutar del botón de revisión final, deben validarse correctamente y deberán estar justificadas por el validador en observaciones en el caso de no realizar la depuración correspondiente.
Dentro del panel de control, se encuentra el botón de "Borrar Sección", este botón deberá ser utilizado sólo en casos especiales en los que se desee borrar la información de TODA una sección, por lo que se uso debe ser cuidadoso y siempre con el visto bueno del personal encargado, dado que al borrar la información se pierde el acceso a la misma de forma definitiva. Cuanto utilice este botón asegúrese antes de:
- Tener el visto bueno del encargado del proceso.
- Estar en la Sección Correcta y en el número de la Línea Correcta.
2.1.3. Chequeo de Inconsistencias por parte del personal encargado de la Validación
Este procedimiento deberá ser realizado únicamente por el personal encargado, por lo que antes de enviar los cuestionarios identificados como listos, el validador deberá llamar al encargado del proceso para que proceda a revisar la validación realizada.
2.1.4. Envió de cuestionarios
Una vez que ha verificado y depurado cada cuestionario asignado, mismos que también han podido ser revisados por el encargado del proceso, y marcados los cuestionarios como listos, estos podrán ser enviados al darle "click" al botón de enviar cuestionarios para que continúen con el siguiente proceso.
En este punto el validador deberá informar al encargado del proceso para que le asigne cuestionarios para validación.
Other Processing
El trabajo de campo consiste en la recolección de la información en cada una de las viviendas seleccionadas según el diseño de muestra probabilística descrito anteriormente y se considera la segunda etapa en la realización de una encuesta.
Para la ejecución del trabajo de campo de la Encuesta Nacional de Hogares se ha planteado una organización con varios niveles de coordinación, según se muestra a continuación:
1. Coordinación de Área de Censos y Encuestas (ACE)
2. Coordinación Encuesta Nacional de Hogares
3. Encargado Proceso Trabajo de Campo
4. Supervisión de Campo- Supervisión General
5. Entrevistador(a)- Operador de equipo móvil
GENERALIDADES DE LOS PROCESOS
1. Reclutamiento y selección: se implementó el reclutamiento por competencias apegado al diccionario de competencias institucional y se mantuvo la organización en conjunto con la Unidad de Recursos Humanos, asimismo, se coordinan y establecen las fechas, espacio físico y todas las actividades relacionadas con la logística del reclutamiento, además se determinan las pruebas que se van a aplicar y se diseñan los flitros y criterios de selección, mediante Asessment Center.
2. Diseño, preparación de capacitaciones y cursos: se revisa en conjunto con la fase de diseño de la encuesta los cronogramas de capacitación y cursos, principalmente las del personal supervisor, y se gestionan los recursos para llevar a cabo cada proceso.
3. Diseño de cargas de trabajo: para el 2018 en la misma línea del año anterior, ante la búsqueda de diseñar las cargas de trabajo se ajustaron, con la ayuda de la Unidad de Cartografía.
4. Seguimiento al sistema integrado: velar por el cumplimiento del cronograma, y brindar aportes en cuanto al diseño de los productos del sistema, así como participar en las pruebas de los productos.
6. Seguimiento a transportes: se da seguimiento al cronograma previamente establecido y se analizan los instrumentos y matrices de control de préstamo de vehículos de otras instituciones.
7. Organización del operativo de campo: desde el reclutamiento se buscó una mejor distribución del personal en las zonas de trabajo, de modo que los equipos de trabajo residieran en la zona, esto colaboro con la optimización del trabajo.
DETERMINACIÓN DE LA CANTIDAD DE GRUPOS DE TRABAJO
Según el tamaño de muestra, el tamaño del instrumento, y el periodo de recolección se establece una relación, que brinda como resultados la cantidad de personal que se requiere para cumplir con los objetivos del proyecto.
Para la obtención de estos datos se construyó una matriz para determinar el tamaño de grupo y con esto conocer la cantidad de grupos que se requieren para cumplir con la carga de trabajo brindada por la muestra, en total se requirío 35 grupos.
DISEÑO DE LAS CARGAS DE TRABAJO
Consiste en al distribución proporcional de las 1120 UPM en grupos, mediante el programa Qgis. La carga de trabajo de campo promedio es de 24 viviendas (2 UPM) por grupo diaria en la zona urbana, y 16 viviendas en la zona rural (0.6 UPM).
- 35 Grupos en Área y Zona
- 20 UPM en promedio por grupo en Área.
- 14 UPM en promedio por grupo en Zona.
- 408 Entrevistas por grupo en promedio.
ELABORACIÓN DE LOS PLANES DE RECORRIDO
Se realiza con base en las cargas de trabajo y cada supervisor debe organizar su Área (Región Central, que abarca el Área Metropolitana de San José y zonas circunvecinas de la provincia de Alajuela, Cartago y Heredia (divididas para efectos del trabajo de campo) en 35 áreas) y Zona (abarca el resto del país, dividido en 35 zonas) de trabajo por día y hora en que va a visitar las UPM según la ubicación de las mismas y las características, los primeros días de capacitación se forma al personal para que puedan desarrollar un plan de recorrido lógico y eficiente. Los mismo equipos de trabajo deben realizar el rescate de entrevistas pendientes.
Estos planes son revisados por la supervisión general quien debe firmar la versión final, y son aprobados por el encargado de TC. Se considera además el monto de viáticos previamente establecido para cada lugar de trabajo. Se implementa el uso de la herramienta Orux Maps que ayuda con la ubicación de las UPM en el mapa.
Los grupos de trabajo de campo están compuestos por un(a) supervisor(a), tres entrevistadores(as) y un chofer. Este equipo tendrá un vehículo asignado durante el período de recolección de datos. El personal entrevistador y el chofer están bajo la responsabilidad del (la) supervisor (a), tanto en lo que concierne a los aspectos administrativos, como en lo que concierne a las labores técnicas.
CONTROL DEL TRABAJO
Para dirigir de manera directa la recolección de datos, se selecciona y capacita durante cuatro semanas y media a las personas que se desempeñarán como supervisoras de campo; posteriormente se le asigna el equipo de trabajo, tal como fue descrito anteriormente. Así, el personal supervisor controlará durante todo el período de trabajo de campo la labor que realiza el entrevistador o la entrevistadora, con el fin de obtener información adecuada. Si la supervisión considera que el desempeño de las personas entrevistadoras presenta deficiencias en cualquier aspecto, le hará la llamada de atención correspondiente. Si persiste en la falta después de una segunda llamada de atención, o si se trata de una falta grave (por ejemplo, falsear información), se le rescindirá el contrato inmediatamente, cancelándole sus servicios hasta ese momento.
Adicional a los equipos de trabajo de campo, se cuenta con encargados de supervisión general, quienes acompañarán el proceso para evacuar dudas, profundizar conceptos y valorar directamente cómo se desarrolla la recolección de información.
CAPACITACIÓN ENTREVISTADORES:
Se organizan 6 grupos de capacitación de 25 personas en cada uno de los grupos. En total se capacita a los aspirantes a entrevistadores(as) durante 10 días. La metodología para estudiar los temas del cuestionario y otros aspectos de la realización de la entrevistas es por medio de lecciones magistrales, prácticas, ejercicios y dinámicas. Con las prácticas se espera reafirmar conceptos y procedimientos de llenado de los cuestionarios, así como garantizar la transmisión del conocimiento adquirido por el personal que se encuentra capacitando.
MATERIALES
Para realizar el trabajo de campo se requiere cierto material que se entrega a la persona entrevistadora antes de iniciar su labor en el campo. Al finalizar la tarea devolverá todo el material al personal supervisor. El material que se le entregará es el siguiente:
- Carné de identificación. Es la credencial que el INEC extiende a cada funcionario para identificarlo como funcionario. Por tanto, el mismo es portado por cada funcionario durante el desarrollo de su trabajo.
- Indumentaria: Es un chaleco con el logo del INEC que permite la identificación clara del personal supervisor y entrevistador de la institución.
- Equipo electrónico y cuestionarios: Se entregará a cada equipo de trabajo de campo una computadora por supervisor(a) y una tableta por entrevistador(a). Además de un número adecuado de cuestionarios para ser usados en casos excepcionales.
- Instructivo para personal entrevistador: Contiene las reglas generales, las instrucciones sobre procedimientos y las definiciones necesarias para llenar el cuestionario. Debe ser portado por cada funcionario todo el tiempo y consultarlo para tomar decisiones en casos dudosos.
- Boletín informativo. Contiene aspectos básicos sobre características de la Encuesta Nacional de Hogares y algunos resultados de la encuesta del año previo.
- Carta de colaboración con la entrevista. Es una carta de la Gerencia del INEC dirigida a los hogares en la cual se solicita la colaboración para brindar la información solicitada en la Enaho.