Data Editing
En la ECE, al emplearse dispositivos móviles en la recolección de los datos (inicialmente PDA y actualmente Tablet), se elimina el proceso de digitación de las boletas. Además, al tener en esos dispositivos móviles controles para garantizar la consistencia de los datos desde que se está aplicando la entrevista, se suprime el proceso de crítica en oficina.
Por otro lado, como la ECE es una encuesta continua, los diferentes procesos que se realizan en oficina se ejecutan paralelamente al trabajo de campo, esto es así puesto que el operativo de trabajo de campo se realiza con una semana de diferencia de los procesos en oficina, de esta manera, mientras se está realizando entrevistas, en oficina ya se cuenta con las entrevistas realizadas la semana previa, las cuales han sido transferidas electrónicamente a oficina para proceder con los procesos respectivos que garantizan la integridad, validación y consistencia de la base de datos.
El procesamiento de los datos en oficina se realiza de la siguiente manera:
A. Integridad de la muestra
Una vez que las entrevistas son efectuadas y transferidas a operativo de campo en oficina, los datos son descargados con el Sistema Administrador de Segmentos (SASET), el cual de forma general y automática realiza una verificación y corrección de los datos, por ejemplo determina si la entrevista está incompleta, detecta errores en los cuestionarios, en el registro, estructuras, partes, entre otros; y de ser necesario se pide nuevamente la información a campo para velar por la integridad de la muestra. Este proceso se realiza semanalmente, después que los supervisores de zona hacen el cierre de entrevistas por semana.
B. Codificación y validación
Posterior a la revisión con el SASET, los datos se transfieren al proceso de codificación y validación, que consiste de modo general, en codificar o asignar códigos numéricos a ciertas variables de la encuesta y consecuentemente revisar de manera integral la consistencia de la información, esto mediante un sistema informático creado especialmente para este fin. La ECE utiliza para este proceso tres codificadores/validadores, que se encargan de la revisión de la información de todas las zonas conforme es transferida de campo, con una semana de rezago respecto al trabajo de campo. En promedio, la carga realizada es de seis a siete segmentos por día, por codificador/validador.
En lo que respecta propiamente a la codificación, el equipo de trabajo cuenta con un buscador electrónico de códigos, el cual contiene archivos de Excel con las descripciones y códigos de la ocupación, rama de actividad, sector institucional y educación, lo que permite realizar consultas rápidas para asignar el código correcto a las codificaciones de dichas variables. La codificación toma en cuenta lo siguiente:
1) Ocupación: Clasificación de Ocupaciones de Costa Rica del 2000 y 2011 (COCR-2000 y COCR-2011), que se basa en la Clasificación Internacional Uniforme de Ocupaciones CIUO 88 y 08 respectivamente, de la Organización Internacional del Trabajo (OIT).
2) Rama de actividad: Clasificación de Actividades Económicas de Costa Rica 2011(CAECR-2011), que se basa en la Clasificación Internacional Industrial Uniforme de todas las Actividades Económicas CIIU Revisión 4, de las Naciones Unidas.
3) Sector institucional: se armonizó con el Sistema de Cuentas Nacionales (SCN) de 1993, de las Naciones Unidas.
4) Campos de educación: Clasificación Internacional Normalizada de la Educación (CINE) de 1997 de la UNESCO, adaptada a Costa Rica, y próximo a actualizarse.
En cuanto al proceso de validación, una vez codificadas las variables mencionadas anteriormente, se valida o verifica la información, esto mediante un sistema informático programado que cuenta con aproximadamente 600 reglas de consistencia, permitiendo así detectar posibles errores. En caso de que se presente algún error, se procede a corregirse de acuerdo con las directrices y criterios previamente establecidos en oficina. En esta etapa, si se requiere, se realiza rescate de información vía telefónica.
Adicionalmente, se cuenta con una serie de controles, como por ejemplo identificación de inconsistencias en rama de actividad y panel a través del tiempo, cambios en la condición de actividad, entre otros; todos ellos con el fin de facilitar el trabajo de codificación y validación de datos, así como la calidad del trabajo de los codificadores-validadores.
Cuando la información ya está codificada y validada, teniendo un mes completado, se transfiere al servidor de la ECE para guardar los datos con los cambios realizados, y se pasa al siguiente proceso.
C. Consistencia final
Una vez que los datos están codificados y validados se genera una base de datos mensual en el programa SPSS, a la cual se le revisa la consistencia de manera más profunda. Este proceso lo desarrolla una persona de la ECE, diferente de los procesos anteriores, y consiste en un análisis agregado de los datos, realización de cruces entre variables, análisis del flujo de información, panel de datos y detección de posibles errores a nivel de la base de datos, así como su respectiva corrección en caso de ser necesario. Además se analizan cuadros y tabulados básicos.
Esta consistencia final se aplica tanto a las variables que propiamente tiene la encuesta, como a las variables que se crean por medio de una sintaxis de creación de variables especificada previamente en SPSS, esto con el objetivo de garantizar que toda la base de datos está lo más limpia posible. Este proceso tiene los siguientes subprocesos esenciales:
1) Revisión general de la base de datos y análisis respecto al plan de rutas de operativo de campo
2) Análisis de los residentes habituales y no habituales de la base de datos
3) Análisis de panel
4) Revisión preliminar de ciertas variables que se necesitan para el cálculo de los factores de expansión
5) Elaboración y envío de las bases de datos para la generación de los factores de expansión
6) Revisión de frecuencias y rangos de las preguntas
7) Revisión de cruces entre variables principales
8) Análisis de la variable de rama de actividad
9) Revisión de otros cruces de interes
Una vez que la consistencia de los datos del mes está revisada y lista, los datos se guardan en el servidor de la ECE y se prosigue con el siguiente proceso.
D. Análisis, preparación y divulgación de los resultados
Teniendo la base de datos del mes limpia y consistente, se genera una base de datos trimestral en SPSS (se hace tanto para trimestres calendario como móvil -unión de tres meses consecutivos, aparte de los trimestres calendario-, según corresponda). A esta base se le agrega el factor de expansión del trimestre respectivo (elaborado por la Unidad de Muestreo) y además se le crean una serie de variables necesarias para la elaboración de los tabulados (con la sintaxis de creación de variables).
Con la base de datos del trimestre lista, se generan los siguientes cuadros:
- Cuadros de la publicación trimestral: son 20 cuadros que se generan trimestralmente (tanto para trimestres calendario como móvil, pero se publican únicamente los referidos a los trimestres calendario), con los cuales se elabora la publicación trimestral de la ECE. Estos cuadros contienen datos de indicadores básicos, características de la población ocupada, calidad del ingreso e ingresos por trabajo, y se calculan a nivel de país, y por sexo y zona de residencia. Asimismo, estos tabulados muestran la evolución de las variables contenidas desde el III trimestre del 2010 hasta el trimestre más actual que se tenga generado.
- Cuadros de la publicación trimestral con los errores muestrales del trimestre.
- Cuadros de la publicación trimestral con la comparación interanual del trimestre.
- Cuadros personalizados para el Banco Central de Costa Rica.
- Cuadros referentes al empleo formal e informal.
- Cuadros con indicadores generales por región de planificación.
- Cuadros de control de ciertas variables de interés por regiones.
- Otros temas especiales.
Adicionalmente, se prepara la publicación trimestral que elabora la ECE, la cual se divulga en conjunto con los cuadros trimestrales, los de comparación interanual y los de errores de muestreo. Este año se inició la realización de análisis de temas especiales y actuales del mercado laboral, lo cual se va a seguir desarrollando en los próximos años.
Del mismo modo, se da atención a consultas y solicitudes de información por parte de la academia, instituciones públicas, organizaciones privadas, medios de comunicación, entre otros.
Cabe indicar que los datos que se divulgan de la ECE refieren a los trimestres calendario. En cuanto a los trimestres móviles, todavía no se ha publicado oficialmente debido a que se necesita la serie completa para realizar el análisis, se espera que próximamente se puedan publicar.
Other Processing
A. Diseño de la recolección de los datos
Para organizar la recolección de los datos de la ECE se estableció el proceso de operativo de campo. Con el fin de hacer este proceso lo más efectivo posible, el primer paso fue hacer un estudio de la distribución y ubicación de los segmentos de la encuesta para definir la estrategia a implementarse en el campo. Así, durante los meses de febrero a abril del año 2009 se realizó el levantamiento cartográfico de los segmentos de trabajo de campo de la encuesta, el cual consistió en identificar los lugares claves cercanos a los segmentos, además de las viviendas que existían en dicho momento en el área, con el objetivo de seleccionar las viviendas que debían entrevistarse según cada una de las 13 semanas establecidas en el diseño de la muestra de la encuesta.
Una vez que se realizó el levantamiento cartográfico, y considerando que la encuesta era continua, se consideró conveniente descentralizar el trabajo estableciendo puntos estratégicos o zonas geográficas con una subsede cada una, y contratar personal que residiera en cada una de esas zonas. Esto se pensó de esta manera para aprovechar el conocimiento y la facilidad de ubicación geográfica de estas personas en las zonas de trabajo, y adicionalmente minimizar los costos debido a que se reduce el pago de viáticos (pasajes, alimentación y hospedaje).
Establecidos esos puntos estratégicos se procedió a realizar el documento maestro del operativo de campo que se denominó "plan de rutas", el cual es una sistematización del plan de trabajo a seguir de acuerdo con cada zona. Aunado a esto está la carga de trabajo, que es la cantidad de entrevistas a realizar por zona de trabajo, definida de acuerdo a la distribución semanal de la muestra que aporta la Unidad de Muestreo según región. La distribución y contratación de personas por zona de trabajo se adecuó a las cargas de trabajo y asignación de segmentos, considerando el tiempo de desplazamiento promedio del punto estratégico para cada una de las zonas a las unidades de estudio, tiempos de alimentación y cantidad de entrevistas por día.
Además, para ser una encuesta innovadora se definió emplear un dispositivo móvil en la recolección de los datos, inicialmente PDA y a partir de abril del 2013 se migró a tablet.
Por otro lado, la ECE es una encuesta semipanel e implementa un sistema de panel de visita a las viviendas, que consiste en 4 visitas durante el año. Para la implementación del panel en la encuesta se dividió la muestra en cuatro réplicas y se asignó un réplica a cada trimestre para la rotación de viviendas. La encuesta rota el 25% de la muestra en cada trimestre, eso quiere decir que entre dos encuestas se conserva alrededor del 75% de las mismas viviendas, entre tres encuestas solo coincide el 50% de las viviendas y entre cuatro encuestas el 25%. Ya en la quinta encuesta se pierde por completo el panel.
Adicionalmente, se estableció que los grupos de trabajo de campo en las distintas zonas cumplieran con un horario de lunes a viernes de 9 a.m a 5 p.m o de 12 m.d a 8 p.m. El horario de 12 m.d a 8 p.m se definió para aquellos casos donde se dificulta la localización del informante adecuado durante el horario de 9 a.m a 5 p.m; el entrevistador debe tener total disponibilidad para realizar las visitas en estos dos horarios dependiendo de las zonas de trabajo. Asimismo, pueden trabajar 2 horas extras, como máximo, en caso de ser necesario con previa autorización de oficina. En el caso de no encontrar al informante, existe la posibilidad de visitarlo el día sábado, con la finalidad de rescatar entrevistas pendientes de la semana; sin embargo, se requiere previamente la autorización del personal de oficina o del supervisor general.
B. Organización de la recolección de los datos
Para la recolección de los datos de la ECE, el operativo de campo se organizó de la siguiente manera:
1) Grupos de trabajo
El país se dividió en nueve grandes zonas geográficas o de trabajo de campo. Estas zonas se eligieron por ser ciudades importantes en las regiones del país, por la cercanía con puntos adecuados para la transferencia de datos, y por aglomerar una parte importante de la muestra de la zona (concentración de la muestra igual o superior al 70% por cantón). Dichos puntos estratégicos son:
1. San José
2. Liberia
3. Cañas
4. Puntarenas
5. Guápiles
6. San Vito
7. Pérez Zeledón
8. San Carlos
9. Limón
El trabajo de campo se realiza con personal contratado en esas zonas geográficas, con el objetivo de agilizar la movilización de equipos de entrevistadores y la ubicación de los segmentos, así como aprovechar el conocimiento del entorno económico, geográfico, social y cultural. En cada zona se cuenta con un supervisor de zona, un equipo de entrevistadores (que depende de la carga de trabajo de la zona) y un operador de equipo móvil (chofer).
Actualmente el operativo de campo cuenta con 48 personas en la recolección de datos en las zonas, la mayoría de los grupos están conformados por 4 personas, a excepción de uno donde hay 6 personas (un supervisor, cuatros entrevistadores y un operador de equipo móvil). Cada zona cuenta con un vehículo que le sirve como oficina móvil. Además, se cuenta con un grupo de ocho personas móviles entre oficina y campo con disponibilidad completa para asistir al campo ante cualquier situación de control y seguimiento del trabajo de campo, o apoyo (suplencias por vacaciones, incapacidades, permisos generales y maternidad, renuncias, imprevistos, u otros). Asimismo, la ECE tiene personal en oficina que cubre las tareas administrativas que se desarrollan en la encuesta, principalmente relacionadas al operativo de campo, por ejemplo, trámite de horas extras, vacaciones, viáticos, entre otras más.
2) Plan de rutas
Una vez establecidas las zonas de trabajo de campo, se estableció el plan de rutas que es un documento con la programación anual de la carga de trabajo (cantidad de entrevistas por hacer) para cada zona de recolección, distribuido por trimestre, mes, semana y días; contiene los lugares donde debe ir el grupo de trabajo día con día, la cantidad de segmentos a visitar, cargas de trabajo por grupo, los kilómetros que deben recorrer y anotaciones importantes tales como si se debe pagar hospedaje, alimentación, ferris o lancha; dicho documento es de gran utilidad tanto para el personal de trabajo de campo como para el personal administrativo en oficina, puesto que permite tramitar con anticipación el pago de viáticos.
3) Situaciones especiales
Se requiere la planificación de estrategias especiales para la recolección de datos en casos como por ejemplo estratos altos seleccionados (se realizan visitas con anticipación para solicitar los permisos respectivos), lugares peligrosos o de difícil acceso, lugares donde la respuesta es baja, entre otros.
C. Organización e implementación de la capacitación
Se contaba con dos tipos de capacitaciones:
1) Nuevo ingreso
La capacitación de nuevo ingreso se dirigía a personal completamente nuevo que entraba a laborar en la encuesta; fuera como entrevistador, supervisor de zona o chofer, y los temas a tratar dependían de las funciones de la persona. Esta capacitación se podía realizar en las instalaciones del INEC o en algún lugar de la zona en la cual la persona perteneciera, además, se impartía cuando se necesitaba.
2) Retroalimentación o actualización de conocimientos
Esta capacitación estaba dirigida a personal que ya trabajaba en la encuesta y/o tenía cierto conocimiento sobre la ECE, principalmente a los supervisor de zona. Se realiza una vez al año, generalmente en el mes de diciembre, en San José.
3) Capacitación sobre el uso de la tablet
Con la migración de la PDA a la tablet se realizaron capacitaciones sobre su uso y manejo, dirigida tanto a los supervisores como a los entrevistadores; previo a empezar el segundo trimestre del 2013, que fue el trimestre en el cual se empezó a usar la tablet en la recolección de los datos de la ECE.
D. Preparación y distribución del material de campo
En la preparación y distribución del material de campo se consideran los siguientes aspectos:
1) Materiales
- Entrevistador: tablet con programas informáticos necesarios para realizar la labor, además de cuestionarios en papel por si son necesarias, camisetas de uniforme de la institución, carnet de identificación, maletín, materiales de trabajo como lapiceros, borradores, block de hojas, entre otros; y de protección como bloqueador, repelente, gorra para sol, sombrilla, entre otros.
- Supervisor de zona: tablet y computadora con los programas informáticos necesarios para desarrollar sus labores, data card, llave USB, carnet de identificación, maletín, materiales de trabajo (lapiceros, borradores, blocks de hojas, camisetas de uniforme de la institución, entre otros) y de protección (bloqueador, repelente, botiquín, sombrillas, gorras de sol, entre otros). Además del material para trámites administrativos como vacaciones, horas extras, etc.
- Operador de equipo móvil (chofer): vehículo de la institución, camisetas de uniforme de la institución, carnet de identificación, materiales para la limpieza y mantenimiento del vehículo, además de gasolina.
- Cartografía: elabora los mapas de los segmentos que se van a utilizar durante la recolección de los datos en campo, para cada zona. Estos mapas son entregados a operativo de campo en oficina, donde se revisan y se envían posteriormente, por medio de encomienda, a los supervisores de zona. Adicional a los mapas se adjunta un listado que contiene información sobre las estructuras del segmento. A estos dos archivos se les llama Registro de Estructuras y Viviendas (REV), y tienen la revisión de la Unidad de Muestreo.
- Informática: el equipo informático tiene asignadas múltiples funciones con el propósito de mantener en funcionamiento óptimo la plataforma informática de la ECE: administración de los datos de la encuesta, transferencia de la información, mantenimiento y reparación de las tabletas, computadoras, entre otras.
- Muestreo: determina la muestra a utilizar en la encuesta.
2) Distribución de la carga de trabajo
La carga de trabajo se determinaba según el plan de rutas y se asignaba por bisemana a cada supervisor de zona por medio de un FTP (File Transfer Protocol o Protocolo de Transferencia de Archivos), que es un protocolo de red para la transferencia de archivos entre sistemas conectados a una red TCP (Transmission Control Protocol) basado en la arquitectura cliente-servidor; desde un equipo cliente se puede conectar a un servidor para descargar archivos desde él o para enviarle archivos, independientemente del sistema operativo utilizado en cada equipo.
En este FTP cada supervisor de zona tiene una carpeta, en la cual se pega la carga de trabajo por bisemana, ordenada por día y con sus respectivos cuestionarios. Esta asignación la realiza un funcionario del proceso de operativo de campo en oficina, para lo cual utiliza el Sistema Administrador de Segmentos (SASET), que entre otras cosas permite crear el archivo de la carga de trabajo. Una vez que los supervisores de zona tienen la carga de trabajo a realizar para la bisemana, les corresponde hacer la repartición del trabajo entre sus entrevistadores.
Adicionalmente, operativo de campo en oficina envían a los supervisores de zona los archivos REV (mapas de segmentos/UPM y listado respectivo), por medio de encomienda a través de bus, previamente a iniciar la bisemana. Con estos archivos tanto los supervisores de zona como los entrevistadores se ubican en el campo y saben cuáles viviendas deben visitar específicamente dentro del segmento/UPM.
E. Recolección de la información
Los entrevistadores son las personas responsables de visitar las viviendas seleccionadas y obtener la información necesaria en el campo, a los cuales los supervisores de zona reparte la carga de trabajo que es asignada bisemanalmente, aunque deben hacer un cierre por semana. En la aplicación del cuestionario, el principal objetivo del entrevistador es obtener información completa y de calidad. Para lograr esto, es indispensable desarrollar una serie de destrezas en la realización de entrevistas, como por ejemplo: domino del tema y cuestionario, inspirar confianza, seguridad al entrevistar, percibir si la persona duda al responder y saber indagar bien.
La recolección de la información de la ECE a partir de abril 2013 se realizó por medio de tablet. Esta migración se debió a que las PDA agotaron su vida útil, se encontraban obsoletas y muy desgastadas por el uso diario que se les daba. No obstante, existen casos especiales en los que se usa el cuestionario en papel, que posteriormente el entrevistador debe transcribir al dispositivo.
La tablet contiene el cuestionario de la encuesta programado en el sistema Android, además el sistema de entrada de datos está diseñado para recoger la información de una forma automatizada y precisa, la cual permite tener un mínimo margen de error por parte de los entrevistadores, ya que la aplicación tiene programado internamente, una cantidad seleccionada de inconsistencias, mensajes de error y advertencias que buscan facilitar y maximizar el tiempo en la obtención de la información. Asimismo el dispositivo cuenta con una pantalla cuyo tamaño les hará mucha más fácil la visualización de las preguntas, además su memoria interna permite que la aplicación sea mucho más rápida y eficaz.
Los entrevistadores realizan las entrevistas diariamente, desde el momento en que reciben su carga de trabajo y como se indica en el plan de rutas establecido por el operativo de campo en oficina, teniendo presente que el supervisor de zona debe hacer un cierre de entrevistas al finalizar la semana. El entrevistador debe transferir las entrevistas que haga día a día a su supervisor de zona, el cual, consecuentemente las debe transferir al FTP de forma diaria también (es una transferencia preliminar a oficina que ayuda a dar seguimiento a la cobertura), y al final de la semana, una vez que el entrevistador indica el resultado final de las entrevistas, el supervisor de zona debe hacer un cierre de las entrevistas de la semana.
Los supervisores de zona cuentan con un sistema informático llamado "Sistema Administrador de Entrevistas para Supervisores (SAES)", que está diseñado para realizar las funciones necesarias para mantener el flujo del trabajo de la encuesta: a) revisión de inconsistencias de las entrevistas, b) manejo de los reportes de control y c) transferencia de la información. Con esta aplicación el supervisor hace una revisión del trabajo realizado por parte de los entrevistadores, previo al envío de la información a oficina. La aplicación tiene programado internamente, una cantidad seleccionada de inconsistencias, mensajes de error y advertencias que buscan corregir errores detectados en la zona de trabajo durante la obtención de la información.
Una vez que las entrevistas son efectuadas y cargadas al FTP por parte de los supervisores de zona, personal del operativo de campo en oficina descarga los datos por medio del "Sistema Administrador de Segmentos (SASET)", el cual de forma general y automática realiza la verificación y corrección de los datos, tales como el resultado de entrevista, determina si la entrevista está incompleta, detecta errores en los cuestionarios, de registro, estructuras, partes, entre otros; y dado el caso se pide nuevamente la información a campo para velar por la integridad de la muestra.
Por otro lado, al ser la ECE una encuesta semipanel, y una vivienda puede ser visitada 4 veces en un año, a partir de la segunda visita los entrevistadores llevarán cargada en la tablet la información sobre la lista de los miembros del hogar, el parentesco, la edad y el sexo al realizar la entrevista (esta información se la transfiere el supervisor de zona cuando reparte la carga de trabajo a realizar). De modo que, como la composición de un hogar en una vivienda (Panel) no siempre se mantiene constante a lo largo del tiempo, el entrevistador deberá modificar esto de ser necesario, según sea el caso, si llegó alguien al hogar o se fue alguien del hogar.