Estimates of Sampling Error
Como la investigación presentada es una encuesta por muestreo, los resultados que en ella se incluyen son estimaciones que están afectadas por dos tipos de errores: los que se producen durante las labores de recolección y procesamiento de la información (que se denomina usualmente errores no de muestreo) y los llamados errores de muestreo, que resultan del hecho de haberse entrevistado sólo una muestra y no la población total.
El primer tipo de error incluye la falta de cobertura de todas las mujeres seleccionadas, errores en la formulación de las preguntas y en la anotación de las respuestas, confusión o incapacidad de las mujeres para dar la información, errores de codificación o de procesamiento. Como es propio efectuar en cada una de las investigaciones, también en este estudio se trató de reducir a un mínimo este tipo de errores a través de una serie de procedimientos que se emplean en toda encuesta bien diseñada y ejecutada, como son: diseño cuidadoso y numerosas pruebas del cuestionario, adiestramiento de buena calidad a las entrevistadoras, supervisión estrecha y permanente del trabajo de campo, supervisión apropiada en la etapa de codificación y procesamiento de los datos y depuración cuidadosa del archivo magnético. Los elementos de juicio disponibles señalan que este tipo de errores se mantuvo dentro de los márgenes razonables en la ENDEMAIN-89. En este Anexo no se hará más referencia a los errores ajenos al muestreo sino únicamente a los llamados errores de muestreo.
La muestra de mujeres estudiadas en la ENDEMAIN-89 no es sino una de la gran cantidad de muestras del mismo tamaño que sería posible seleccionar de la población de interés utilizando el diseño empleado. Cada una de ellas habría dado resultados en alguna medida diferentes de los obtenidos con la muestra utilizada. La variabilidad que se observaría entre todas las muestras posibles constituye el error de muestreo, el cual no se conoce pero puede ser estimado a partir de los datos suministrados por la muestra realmente seleccionada. El error de muestreo se mide por medio del error estándar. El error estándar de un promedio, porcentaje, diferencia o cualquier otra estadística calculada con los datos de la muestra se define como la raíz cuadrada de la varianza de la estadística y es una medida de su variación en todas las muestras posibles. En consecuencia, el error estándar mide el grado de precisión con que el promedio, porcentaje, o estadística basado en la muestra, se aproxima al resultado que se habría obtenido si se hubiera entrevistado a todas las mujeres de la población bajo las mismas condiciones.
El error estándar puede ser usado para calcular intervalos dentro de los cuales hay una determinada confianza de que se encuentra el valor poblacional. Así, si se toma una cierta estadística calculada de la muestra (un porcentaje, por ejemplo) y se le suma y resta dos veces su error estándar, se obtiene un intervalo al cual se le asigna una confianza de 95 por ciento de que contiene, en este caso, el porcentaje poblacional.
Si las mujeres incluidas en la muestra hubieran sido seleccionadas en forma simple al azar, podrían utilizarse directamente las fórmulas muy conocidas que aparecen en los textos de estadística para el cálculo de los errores estándar, límites de confianza y para la realización de pruebas de hipótesis. Sin embargo, como se ha señalado, el diseño empleado es complejo, por lo cual se requiere utilizar las fórmulas que corresponden al diseño, las cuales consideran los efectos de la estratificación y la conglomeración.
Ha sido posible realizar estos cálculos para un cierto grupo de variables de interés especial, empleando CLUSTERS (Computation and Listing of Useful Statistics on Errors of Sampling), que además del error estándar, permite calcular el efecto del diseño, DEFT, el cual se define como la razón entre el error estándar correspondiente al diseño empleado (ES) y el error estándar que se obtiene tratando la muestra como si hubiera sido simple al azar (ESmas):
DEFT = ES / ESmas
Un valor de DEFT igual a 1.0 indicaría que el diseño utilizado es tan eficiente como uno simple al azar del mismo tamaño, mientras que un valor superior a 1.0 indicaría que el uso de conglomerados produjo una varianza superior a la que se habría obtenido con una muestra simple al azar del mismo tamaño.
En anexo del Informe Final se presenta una lista de las 34 variables consideradas de mayor interés en la encuesta. Para cada una se especifica el tipo de indicador y el grupo de mujeres para las cuales está definida la variable. En el cuadro II.1 del Informe Final se incluye, para cada variable, el correspondiente valor de r (sea un promedio o un porcentaje), el error estándar y el número de casos en la muestra del total del país. Además del error estándar, en los cuadros aparecen también DEFT, y el intervalo con 95 por ciento de confianza.
El cuadro indica que, en general, los errores estándar son pequeños y que por ello la muestra puede calificarse como bastante precisa; esto es especialmente claro en la quinta columna donde aparecen los errores estándar relativos. Para ilustrar el uso de las cifras en este cuadro considérese la variable EDAD101 (Promedio de edad de la MEF) que tiene un valor medio de 28.4 con un error estándar de 0.075. Si se desea un intervalo de confianza del 95 por ciento, se suma y resta al promedio dos veces al error estándar: 28.4 "2*(0.075), lo que produce el intervalo de 28.25 a 28.55, dentro del cual se tiene una confianza de 95 por ciento de que se encuentra el valor de la población. Los resultados básicos (SE y DEFT) por área y región de residencia de las mujeres se presentan en los cuadros II.1 a II.7 del Informe Final.