Data Editing
En la ECE, al emplearse dispositivos móviles en la recolección de los datos (inicialmente PDA y actualmente Tablet), se elimina el proceso de digitación de las boletas. Además, al tener en esos dispositivos móviles controles para garantizar la consistencia de los datos desde que se está aplicando la entrevista, se suprime el proceso de crítica en oficina.
Por otro lado, como la ECE es una encuesta continua, los diferentes procesos que se realizan en oficina se ejecutan paralelamente al trabajo de campo, esto es así puesto que el operativo de trabajo de campo se realiza con una semana de diferencia de los procesos en oficina, de esta manera, mientras se está realizando entrevistas, en oficina ya se cuenta con las entrevistas realizadas la semana previa, las cuales han sido transferidas electrónicamente a oficina para proceder con los procesos respectivos que garantizan la integridad, validación y consistencia de la base de datos.
El procesamiento de los datos en oficina se realiza de la siguiente manera:
A. Integridad de la muestra
Una vez que las entrevistas son efectuadas y transferidas a operativo de campo en oficina, los datos son descargados con el Sistema Administrador de Segmentos (SASET), el cual de forma general y automática realiza una verificación y corrección de los datos, por ejemplo determina si la entrevista está incompleta, detecta errores en los cuestionarios, en el registro, estructuras, partes, entre otros; y de ser necesario se pide nuevamente la información a campo para velar por la integridad de la muestra. Este proceso se realiza semanalmente, después que los supervisores de zona hacen el cierre de entrevistas por semana.
B. Codificación y validación
Posterior a la revisión con el SASET, los datos se transfieren al proceso de codificación y validación, que consiste de modo general, en codificar o asignar códigos numéricos a ciertas variables de la encuesta y consecuentemente revisar de manera integral la consistencia de la información, esto mediante un sistema informático creado especialmente para este fin. La ECE utiliza para este proceso tres codificadores/validadores, que se encargan de la revisión de la información de todas las zonas conforme es transferida de campo, con una semana de rezago respecto al trabajo de campo. En promedio, la carga realizada es de seis a siete segmentos por día, por codificador/validador.
En lo que respecta propiamente a la codificación, el equipo de trabajo cuenta con un buscador electrónico de códigos, el cual contiene archivos de Excel con las descripciones y códigos de la ocupación, rama de actividad, sector institucional y educación, lo que permite realizar consultas rápidas para asignar el código correcto a las codificaciones de dichas variables. La codificación toma en cuenta lo siguiente:
1) Ocupación: Clasificación de Ocupaciones de Costa Rica del 2000 y 2011 (COCR-2000 y COCR-2011), que se basa en la Clasificación Internacional Uniforme de Ocupaciones CIUO 88 y 08 respectivamente, de la Organización Internacional del Trabajo (OIT).
2) Rama de actividad: Clasificación de Actividades Económicas de Costa Rica 2011(CAECR-2011), que se basa en la Clasificación Internacional Industrial Uniforme de todas las Actividades Económicas CIIU Revisión 4, de las Naciones Unidas.
3) Sector institucional: se armonizó con el Sistema de Cuentas Nacionales (SCN) de 1993, de las Naciones Unidas.
4) Campos de educación: Clasificación Internacional Normalizada de la Educación (CINE) de 1997 de la UNESCO, adaptada a Costa Rica, y próximo a actualizarse.
En cuanto al proceso de validación, una vez codificadas las variables mencionadas anteriormente, se valida o verifica la información, esto mediante un sistema informático programado que cuenta con aproximadamente 600 reglas de consistencia, permitiendo así detectar posibles errores. En caso de que se presente algún error, se procede a corregirse de acuerdo con las directrices y criterios previamente establecidos en oficina. En esta etapa, si se requiere, se realiza rescate de información vía telefónica.
Adicionalmente, se cuenta con una serie de controles, como por ejemplo identificación de inconsistencias en rama de actividad y panel a través del tiempo, cambios en la condición de actividad, entre otros; todos ellos con el fin de facilitar el trabajo de codificación y validación de datos, así como la calidad del trabajo de los codificadores-validadores.
Cuando la información ya está codificada y validada, teniendo un mes completado, se transfiere al servidor de la ECE para guardar los datos con los cambios realizados, y se pasa al siguiente proceso.
C. Consistencia final
Una vez que los datos están codificados y validados se genera una base de datos mensual en el programa SPSS, a la cual se le revisa la consistencia de manera más profunda. Este proceso lo desarrolla una persona de la ECE, diferente de los procesos anteriores, y consiste en un análisis agregado de los datos, realización de cruces entre variables, análisis del flujo de información, panel de datos y detección de posibles errores a nivel de la base de datos, así como su respectiva corrección en caso de ser necesario. Además se analizan cuadros y tabulados básicos.
Esta consistencia final se aplica tanto a las variables que propiamente tiene la encuesta, como a las variables que se crean por medio de una sintaxis de creación de variables especificada previamente en SPSS, esto con el objetivo de garantizar que toda la base de datos está lo más limpia posible. Este proceso tiene los siguientes subprocesos esenciales:
1) Revisión general de la base de datos y análisis respecto al plan de rutas de operativo de campo
2) Análisis de los residentes habituales y no habituales de la base de datos
3) Análisis de panel
4) Revisión preliminar de ciertas variables que se necesitan para el cálculo de los factores de expansión
5) Elaboración y envío de las bases de datos para la generación de los factores de expansión
6) Revisión de frecuencias y rangos de las preguntas
7) Revisión de cruces entre variables principales
8) Análisis de la variable de rama de actividad
9) Revisión de otros cruces de interés
Una vez que la consistencia de los datos del mes está revisada y lista, los datos se guardan en el servidor de la ECE y se prosigue con el siguiente proceso.
D. Análisis, preparación y divulgación de los resultados
Teniendo la base de datos del mes limpia y consistente, se genera una base de datos trimestral en SPSS (se hace tanto para trimestres calendario como móvil -unión de tres meses consecutivos, aparte de los trimestres calendario-, según corresponda). A esta base se le agrega el factor de expansión del trimestre respectivo (elaborado por la Unidad de Muestreo) y además se le crean una serie de variables necesarias para la elaboración de los tabulados (con la sintaxis de creación de variables).
Con la base de datos del trimestre lista, se generan los siguientes cuadros:
- Cuadros de la publicación trimestral: son 20 cuadros que se generan trimestralmente (tanto para trimestres calendario como móvil, pero se publican únicamente los referidos a los trimestres calendario), con los cuales se elabora la publicación trimestral de la ECE. Estos cuadros contienen datos de indicadores básicos, características de la población ocupada, calidad del ingreso e ingresos por trabajo, y se calculan a nivel de país, y por sexo y zona de residencia. Asimismo, estos tabulados muestran la evolución de las variables contenidas desde el III trimestre del 2010 hasta el trimestre más actual que se tenga generado.
- Cuadros de la publicación trimestral con los errores muestrales del trimestre.
- Cuadros de la publicación trimestral con la comparación interanual del trimestre.
- Cuadros personalizados para el Banco Central de Costa Rica.
- Cuadros referentes al empleo formal e informal.
- Cuadros con indicadores generales por región de planificación.
- Cuadros de control de ciertas variables de interés por regiones.
- Otros temas especiales.
Adicionalmente, se prepara la publicación trimestral que elabora la ECE, la cual se divulga en conjunto con los cuadros trimestrales, los de comparación interanual y los de errores de muestreo. Este año se inició la realización de análisis de temas especiales y actuales del mercado laboral, lo cual se va a seguir desarrollando en los próximos años.
Del mismo modo, se da atención a consultas y solicitudes de información por parte de la academia, instituciones públicas, organizaciones privadas, medios de comunicación, entre otros.
Cabe indicar que los datos que se divulgan de la ECE refieren a los trimestres calendario. En cuanto a los trimestres móviles, todavía no se ha publicado oficialmente debido a que se necesita la serie completa para realizar el análisis, se espera que próximamente se puedan publicar.