Estimates of Sampling Error
Las estimaciones de toda encuesta realizada por muestreo vienen afectadas por dos tipos de errores:
a) Errores de muestreo: los datos de una muestra están sujetos a los errores de muestreo, los cuales se presentan debido a que la investigación estadística se hace sólo en una parte de la población, para estimar características de todo el conjunto poblacional. En general, a medida que aumenta el tamaño de la muestra disminuye el error de muestreo, aunque también influyen en él las características del diseño y la naturaleza de la variable investigada.
b) Errores ajenos al muestreo: incluyen toda una serie de errores, que se producen en las distintas fases de realización de una encuesta, desde el diseño del cuestionario hasta la publicación de los resultados finales (definiciones deficientes, errores en el marco, falta de respuesta en las unidades informantes, errores de codificación y grabación etc.).
ERRORES DE MUESTREO
Los errores de muestreo no se conocen directamente, pero sí es posible estimarlos a partir de los datos de la propia muestra. En tal sentido, mediante el software SPSS utilizado actualmente se obtiene, (ver anexo), las estimaciones del error de muestreo, error relativo o, coeficiente de variación, intervalos de confianza, de las variables más importantes de la Encuesta Permanente de Hogares, del Módulo de Empleo, como son: Tasa de actividad, Tasa de ocupación, Tasa de desempleo y Tasa de inactividad, tanto a nivel nacional como por algunos dominios de estudio.
A fin de interpretar de una manera sencilla estos resultados, seguidamente se presenta el concepto de cada columna de los cuadros.
1. Estimación. Para valores absolutos, son datos muéstrales multiplicados por el factor de expansión, para proporción o tasa son valores porcentuales obtenidos mediante las fórmulas arriba explicadas para cada variable en estudio.
2. Error muestral de la estimación. Es el valor absoluto de la raíz cuadrada de la varianza del estimador. Al error de muestreo se le denomina también error estándar y es una medida de la precisión con que una estimación de la muestra se aproxima al promedio de todas las muestras posibles.
La varianza es una medida estadística que permite determinar el grado de dispersión de la variable o el grado de heterogeneidad u homogeneidad de los elementos de un conjunto de elementos en función de los valores que la variable toma en cada uno de los elementos del conjunto.
Una manera sencilla de interpretar el error estándar (e.e.) es en término de intervalo de confianza.
3. Coeficiente de Variación (C.V.). El coeficiente de variación (CV) es definido como el error estándar de la estimación dividido por el valor estimado. Se lo conoce como error relativo.
El coeficiente de variación indica más claramente el nivel de precisión de una estimación; en efecto, en las encuestas de hogares la experiencia ha demostrado que estimaciones con un coeficiente de variación de hasta un 5% son muy precisas; si el coeficiente de variación llega hasta un 10%, las estimaciones siguen siendo precisas; un coeficiente de variación con un valor de hasta 20% es aceptable; y por último, más allá de un 20% indica que la estimación es poco confiable y, por tanto, se debe utilizar con precaución.
4. Intervalo de Confianza al 95%. Es el intervalo estimado que incluye el promedio de las estimaciones de todas las muestras posibles con una asignada probabilidad de confianza. Este intervalo tiene un límite inferior y un límite superior, dentro de los cuales se espera que se encuentre el valor real o poblacional con el nivel de confianza determinado.
Para cualquier estimador "y" de la encuesta, se puede obtener los intervalos de confianza de la manera siguiente:
La expresión z*e.e. recibe el nombre de margen de error del estimador y viene dado por el producto entre t y el error estándar de la estimación.
El valor z, es la abscisa de la distribución normal para una determinada probabilidad. Para un nivel de confianza del 90%, el valor de z = 1,645; para el 95%, z = 1,96, y para 99%, z = 2,58.
El nivel de confianza que va a ser usado en el análisis puede ser determinado por el usuario de la información. Habitualmente se toma el 95%.
La amplitud del intervalo de confianza depende principalmente del error estándar; es decir, a mayor valor del error estándar mayor amplitud del intervalo de confianza y, por tanto, menor precisión del valor estimado. Lo esperable es tener una menor amplitud del intervalo de confianza, por tanto, mayor precisión del valor estimado.