Estimates of Sampling Error
O principal objetivo da PSFNe 1991 é fomecer estimativas para um número de variáveis demo- gráficas, de planejamento familiar e de saúde, através de entrevistas domiciliares, usando-se uma amostra cientificamente selecionada de uma população definida: a população de mulheres em idade reprodutiva (15-49 anos). As estimativas para estas variáveis, entretanto, estão sujeitas a dois tipos de erros: erros relacionados à amostra e erros não-relacionados à amostra. O erro total é o erro resultante destes dois tipos de erros mencionados acima, e é a diferença entre a estimativa da variável e o valor real.
Os erros que não são provenientes da amostragem são aqueles que persistiriam mesmo se toda a população fosse coberta. Estes erros são devidos a erros nas atividades do trabalho de campo durante a pesquisa. Como exemplo, podemos citar a não-localização e visita ao domicilio selecionado, problema no preenchimento do questionário pela entrevistadora, erros de codificação e digitação etc. Infelizmente, não é possIvel medir a extensão destes erros que não estão relacionados à amostragem e que, certamente, afetarão os resultados da pesquisa.
Os erros de amostragem são aqueles que resultam da seleção da amostra da população em estudo através de um desenho de amostra especffico. Estes erros fomecem uma estimativa de como se obter resultados do comportamento de uma variável especffica repetindo a pesquisa por amostragem com o mesmo desenho. Como o erro de amostragem é uma função do desenho da amostra, ao contrário dos erros não-relacionados à amostra, ele pode ser medido.
Os erros de amostragem foram computados para a PSFNe 1991 usando o "software" CLUSTERS, elaborado para ser usado na World Fertility Survey (WFS). Este programa leva em consideração a estrutura vigente da amostra e, em particular, seu desenho, que é estratificado em estágios múltiplos e em conglomerados. Os resultados gerados pelo "software" CLUSTERS fornecem somente uma estimativa total tios erros de amostragem. O programa não identifica em qual dos estágios do desenho da amostra ocorreu O erro, O programa CLUSTERS trata qualquer porcentagem ou média como uma razão estatística r = y/x onde, y representa o valor total da amostra para a variável y, e x representa o número total de casos no grupo ou subgrupo em consideração. O cálculo da variancia r é computado utilizando-se a fórmula a seguir, sendo
o erro padrão a raiz quadrada da variancia:
var(r) : l_f H [__mh ( mh-,.V, zhi2 z2~1 x z h---I mh-I i:l ~-hlJ
onde:
zra = y~ - r.xra, e
zh = Yh - r.Xh
h representa o estrato e varia de 1 a h,
m h é o número total de setores censitários selecionados no estrato h ~,
Y~a é a soma dos valores da variável y no setor censitário i do estrato h t~
xra é a soma do número de casos (mulheres no setor censitário i do estrato hth), e
f é a fração total da amostra cujo valor é tão pequeno que 6 ignorado pelo programa CLUSTERS.
Além do erro padrão, o programa CLUSTERS calcula o efeito do desenho para cada estimativa, DEF~, que se define como a razíto entre o erro padrão usando um determinado desenho de amostra e o erro padrão que resultaria se o desenho da amostragem implementado fosse a amostragem aleatória simples. Um valor de DEFI igual a 1.0 indica que o desenho utilizado é tão eficiente quanto uma amostragem aleatória simples, enquanto que um valor superior a 1.0 indica um aumento no erro de amostragem em decorrência do uso de um desenho mais complexo e estatisticamente menos eficiente. O programa CLUSTERS computa também o erro relativo e os limites de confiança para as estimativas.
Os erros de amostragem para a PSFNe foram calculados para algumas variáveis selecionadas, consideradas de maior interesse. Os resultados são apresentados neste anexo para o total da Região Nordeste, para as áreas urbanas e rurais, para cada estado da região, para cada nível específico de instrução e para cada grupo quinqüenal de idade.
A Tabela B. 1 do Relatorio Final, apresenta para cada variável selecionada o tipo de estatística calculada (proporção ou média) e a população base.
Nas tabelas B.2 a B.25 s~o apresentadas para cada variável selecionada a media ou valor proporcional da estimativa (R), o erro padrão (SE), o número de casos não-ponderados (N) e ponderados (WN) no qual a estimativa é baseada, o valor do efeito estimado do desenho (DEFF), o erro padrão relativo (SE/R) e o intervalo de 95% de confiança (R + 2SE).
Em geral, os erros padrOes relativos da maioria das estimativas para a região como um todo são pequenos, exceto para estimativas com proporções pequenas.
Para estimativas de subpopulações como áreas geográficas existem alguns diferenciais em relação ao erro padrão relativo.
Para a variável EVBORN (filhos nascidos vivos de mulheres de 15-49 anos de idade), por exemplo, o erro padrão relativo como uma porcentagem de média estimada para a região como um todo, para as áreas urbanas e para o Estado do Ceará é de 2,4%, 2,4% e 4,5%, respectivamente. O intervalo de confiança (calculado para a variável EVBORN) pode ser interpretado do seguinte modo: a media para a amostra total é 2,637 e o erro padrão é de 0,063. Assim, para se obter um intervalo de 95 % de confiança deve-se subtrair duas vezes o valor do erro padrão para a amostra estimada, por exemplo 2,637 + 0,126. Existe uma grande probabilidade (95 %) de que o valor real do número médio de filhos nascidos vivos de mulheres de 15-49 anos estar entre 2,511 e 2,764.