Data Editing
El procesamiento de los datos en oficina se realiza de la siguiente manera:
A. Integridad de la muestra
Una vez que las entrevistas son efectuadas y transferidas a operativo de campo en oficina, los datos son descargados con el Sistema Administrador de Segmentos (SASET), el cual de forma general y automática realiza una verificación y corrección de los datos, por ejemplo determina si la entrevista está incompleta, detecta errores en los cuestionarios, en el registro, estructuras, partes, entre otros; y de ser necesario se pide nuevamente la información a campo para velar por la integridad de la muestra. Este proceso se realiza semanalmente, después que los supervisores de zona hacen el cierre de entrevistas por semana.
B. Codificación y validación
Posterior a la revisión con el SASET, los datos se transfieren al proceso de codificación y validación, que consiste de modo general, en codificar o asignar códigos numéricos a ciertas variables de la encuesta y consecuentemente revisar de manera integral la consistencia de la información, esto mediante archivos planos txt, con el programa informático CSPro. La ECE utiliza para este proceso tres codificadores/validadores, que se encargan de la revisión de la información de todas las zonas conforme es transferida de campo, con una semana de rezago respecto al trabajo de campo. En promedio, la carga realizada es de seis a siete segmentos por día, por codificador/validador.
En lo que respecta propiamente a la codificación, el equipo de trabajo cuenta con un buscador electrónico de códigos, el cual contiene archivos de Excel con las descripciones y códigos de la ocupación, rama de actividad, sector institucional y educación, lo que permite realizar consultas rápidas para asignar el código correcto a las codificaciones de dichas variables. La codificación toma en cuenta lo siguiente:
1) Ocupación: se inició codificando con la Clasificación de Ocupaciones (COC) del 2000, que era una adaptación de la Clasificación Internacional Uniforme de Ocupaciones CIUO-88, de la Organización Internacional del Trabajo (OIT). En el 2013 se migró al nuevo manual de Clasificación de Ocupaciones de Costa Rica (COCR) del 2011, basado en la CIUO-08.
2) Rama de actividad: se usa la Clasificación de Actividades Económicas de Costa Rica 2011 (CAECR-2011), que es una adaptación de la Clasificación Internacional Industrial Uniforme de todas las Actividades Económicas CIIU Revisión 4, de las Naciones Unidas. Sin embargo, se realizó una correspondencia con la CIIU Revisión 3 (a grandes grupos).
3) Sector institucional: se armonizó con el Sistema de Cuentas Nacionales (SCN) de 1993, de las Naciones Unidas.
4) Campos de educación: se usa la Clasificación Internacional Normalizada de la Educación (CINE) de 1997 y 2011 de la UNESCO, en lo relativo a logro educacional.
En cuanto al proceso de validación, una vez codificadas las variables mencionadas anteriormente, se valida o verifica la información, con el programa informático CSPro, que cuenta con aproximadamente 600 reglas de consistencia, permitiendo así detectar posibles errores. En caso de que se presente algún error, se procede a corregirse de acuerdo con las directrices y criterios previamente establecidos en oficina. En esta etapa, si se requiere, se realiza rescate de información vía telefónica.
Adicionalmente, se cuenta con una serie de controles, como por ejemplo identificación de inconsistencias en rama de actividad y panel a través del tiempo, cambios en la condición de actividad, entre otros; todos ellos con el fin de facilitar el trabajo de codificación y validación de datos, así como la calidad del trabajo de los codificadores-validadores.
Cuando la información ya está codificada y validada, teniendo un mes completado, se transfiere al servidor de la ECE para guardar los datos con los cambios realizados, y se pasa al siguiente proceso.
C. Consistencia final
Una vez que los datos están codificados y validados se genera una base de datos mensual en el software estadístico SPSS, a la cual se le revisa la consistencia de manera más profunda. Este proceso lo desarrolla una persona de la ECE, diferente de los procesos anteriores, y consiste en un análisis agregado de los datos, realización de cruces entre variables, análisis del flujo de información, panel de datos y detección de posibles errores a nivel de la base de datos, así como su respectiva corrección en caso de ser necesario. Además se analizan cuadros y tabulados básicos.
Esta consistencia final se aplica tanto a las variables que propiamente tiene la encuesta, como a las variables que se crean por medio de una sintaxis de creación de variables especificada previamente en SPSS, esto con el objetivo de garantizar que toda la base de datos está lo más limpia posible.
Este proceso tiene los siguientes subprocesos esenciales:
1) Revisión general de la base de datos y análisis respecto al plan de rutas de operativo de campo
2) Análisis de los residentes habituales y no habituales de la base de datos
3) Análisis de panel
4) Revisión preliminar de ciertas variables que se necesitan para el cálculo de los factores de expansión
5) Elaboración y envío de las bases de datos para la generación de los factores de expansión
6) Revisión de frecuencias y rangos de las preguntas
7) Revisión de cruces entre variables principales
8) Análisis de la variable de rama de actividad
9) Revisión de otros cruces de interes
Una vez que la consistencia de los datos del mes está revisada y lista, los datos se guardan en el servidor de la ECE y se prosigue con el siguiente proceso.
D. Análisis, preparación y divulgación de los resultados
Teniendo la base de datos del mes limpia y consistente, se genera una base de datos trimestral en el programa informático SPSS (se hace tanto para trimestres calendario como móvil -unión de tres meses consecutivos, aparte de los trimestres calendario-, según corresponda). A esta base se le agrega el factor de expansión del trimestre respectivo (elaborado por la Unidad de Muestreo) y además se le crean una serie de variables necesarias para la elaboración de los tabulados (con la sintaxis de creación de variables).
Con la base de datos del trimestre lista, se generan una serie de cuadros, dentro de los que se pueden mencionar:
1) Cuadros de la publicación trimestral: son 20 cuadros que se generan trimestralmente (tanto para trimestres calendario como móvil, pero se publican únicamente los referidos a los trimestres calendario), con los cuales se elabora la publicación trimestral de la ECE. Estos cuadros contienen datos de indicadores básicos, características de la población ocupada, calidad del ingreso e ingresos por trabajo, y se calculan a nivel de país, y por sexo y zona de residencia. Asimismo, estos tabulados muestran la evolución de las variables contenidas desde el III trimestre del 2010 hasta el trimestre más actual que se tenga generado.
2) Cuadros de la publicación trimestral con los errores muestrales del trimestre.
3) Cuadros de la publicación trimestral con la comparación interanual del trimestre.
4) Cuadros personalizados para el Banco Central de Costa Rica.
5) Cuadros referentes al empleo formal e informal.
6) Cuadros con indicadores generales por región de planificación.
7) Cuadros de control de ciertas variables de interés por regiones.
8) Cuadros referentes al empleo juvenil.
9) Otros temas especiales.
Adicionalmente, se prepara la publicación trimestral que elabora la ECE, la cual se divulga en conjunto con los cuadros trimestrales, los de comparación interanual y los de errores de muestreo.
Del mismo modo, se da atención a consultas y solicitudes de información por parte de la academia, instituciones públicas, organizaciones privadas, medios de comunicación, entre otros.
Cabe indicar que los datos que se divulgan de la ECE refieren a los trimestres calendario. En cuanto a los trimestres móviles, todavía no se ha publicado oficialmente debido a que se necesita la serie completa para realizar el análisis, se espera que próximamente se puedan publicar.
Adicionalmente, se están generando una serie de cuadros solicitados por la Organización para la Cooperación y el Desarrollo Económico (OCDE), debido al proceso de adhesión de Costa Rica a esta organización. Propiamente de la ECE, desde el año 2014 se ha estado entregando datos relacionados con empleo, desempleo, educación, ingresos, entre otros.