Survey ID Number
MOZ_2003_DHS_v01_M
Title
Inquérito Demográfico e de Saúde 2003
Sampling Procedure
A amostra utilizada para o Inquérito Demográfico e de Saúde de 2003 (IDS 2003) é uma amostra probabilística seleccionada em três etapas: a primeira consistiu na selecção de Unidades Primárias deAmostragem (UPA), a segunda foi a selecção das Áreas de Enumeração (AE) em cada UPA e, a terceira, a selecção de agregados familiares em cada AE. A amostra permite obter estimativas sólidas (com um erro padrão relativo inferior a 10 por cento), de certas variáveis a nível de cada uma das 11 províncias inclusive a Cidade de Maputo.
O universo da amostra extraída pode ser expandida para toda a população do país. Foram excluídas da amostra certas áreas, como as minadas, os centros prisionais ou hospitalares, os quais representam uma fracção muito pequena do território nacional.
Para as entrevistas individuais deste inquérito, foram seleccionadas mulheres de 15 - 49 anos e homens de 15-64, residentes em 12,280 agregados familiares no território de Moçambique. Esperava-se entrevistar com sucesso 11,493 mulheres e 3,266 homens (considerando as diferentes taxas de cobertura e de resposta do INJAD-2001 para mulheres e homens, respectivamente).
Excluíram-se mulheres e homens residentes em estabelecimentos colectivos, quartéis, lares de estudantes, estabelecimentos prisionais, os quais com outros residentes naquelas condições, representam cerca de 0.35 por cento do total da população, de acordo com os resultados do Censo 1997.
MARCO AMOSTRAL
Em 2000, o Instituto Nacional de Estatística em colaboração com US Bureau of Census, desenhou a Amostra Mãe usando os resultados do Censo 1997. A actualização geográfica de cada Unidade Primária de Amostragem inclusa na Amostra Mãe foi realizada no ano 2000. Portanto, a amostra do IDS 2003 foi desenhada com base nas metodologias aplicadas para o desenho da Amostra Mãe.
De acordo com o Manual do DSH-1996, Inquéritos Demográficos e de Saúde são mais fáceis de implementar quando existir uma base de amostragem actualizada, nomeadamente de algum inquérito prévio ou Amostra Mãe desenhada na base dos resultados do censo populacional. Assim, o IDS 2003 é uma sub-amostra do IAF-2002/03. A amostra do IAF-02/03 é composta por 858 UPAs e igual número de AEs, ambas unidades elaboradas a partir do Recenseamento Geral da População e Habitação de 1997. As UPAs foram seleccionadas com probabilidades iguais (PI) da Amostra Mãe, enquanto que as AEs dentro de cada UPA amostral foram seleccionadas com probabilidade proporcional ao tamanho (PPT) de agregados familiares.
COMPOSIÇÃO DA AMOSTRA
Quando se realiza um inquérito por amostragem, a escolha da dimensão da amostra depende, entre outros factores, do nível de confiança e da precisão pretendidos. Assim, para determinar a dimensão da amostra foi necessário pré-fixar o nível de confiança de 95 por cento e erro absoluto máximo das estimativas de 10 por cento.
As amostras dos Inquéritos Demográficos e de Saúde são desenhadas para um mínimo de 1,000 mulheres elegíveis, isto é, dos 15 a 49 anos de idade por domínio de estimação. Factores como a subcobertura na listagem de agregados familiares ou as não respostas na fase da recolha, concorrem na redução da população alvo na amostra em pelo menos 10 por cento. O tamanho da amostra a seleccionar deverá ser ajustada adequadamente de modo a compensar as não respostas e a subcobertura da listagem.
Os principais factores que foram tomados em consideração na determinação do tamanho da amostra do IDS 2003 são:
- Os domínios de estimação: 10 províncias, a Cidade de Maputo e área de residência;
- Mínimo de 1,000 entrevistas completas com mulheres dos 15-49 anos em cada domínio, com vista a fazer uma distinção na tabulação das variáveis mais importantes como as taxas global de fecundidade, mortalidade infantil e outras;
- Proporção de mulheres actualmente unidas (formal e informal). De acordo com dados do IDS-1997, a proporção de mulheres unidas é de 85 por cento em Nampula e 84 por cento em Cabo Delgado e, o resto dos domínios a proporção varia entre 70 e 79 por cento (com excepção da Província de Maputo e a Cidade de Maputo com 53 por cento e 56 por cento dos casos respectivamente).
- Tamanho da população em cada domínio: as províncias mais populosas do País ? Nampula e Zambézia (20 por cento e 19 por cento do total da população, respectivamente), seguidas as de Sofala (9 por cento) e Cabo Delgado (8 por cento), segundo resultados do Recenseamento Geral da População e Habitação de 1997.
- Variabilidade interna das variáveis mais importantes, exemplo, nível de fecundidade vs nível educacional; fecundidade vs nível sócio-económico; mortalidade infantil vs nível sócio-económico. Esta variabilidade interna (com desvios elevados) implicam um tamanho da amostra maior para captar a variabilidade ou representar os vários subestratos populacionais na amostra. Esta variabilidade é de extrema importância para a Cidade de Maputo.
SELECÇÃO DA AMOSTRA
A amostra do IDS 2003, com um total de 604 áreas de enumeração, foi desenhada para ser representativa a nível dos domínios Provincial, Nacional, área de residência (urbano e rural, somente a nível nacional) e, por último o domínio Regional (Norte, Centro, Sul). Isto quer dizer que, a amostra não é representativa ao nível urbano e rural de cada província.
Uma vez que o número de agregados familiares foi alocado por cada província em áreas urbanas e rurais, o número de conglomerados foi calculado com base na média amostral de 20 entrevistas completas (cerca de 19 agregados familiares) nas áreas urbanas, e, 25 entrevistas completas (24 agregados) nas áreas rurais. Finalmente, em cada AE amostral, tanto urbana, como rural, fixou-se em 24 agregados familiares seleccionados para as entrevistas.
A amostra está distribuída proporcionalmente nas áreas urbanas e rurais dentro de cada província sendo 229 áreas urbanas e 375 rurais. O Quadro A.1 mostra a distribuição da amostra por cada província e sua cobertura
Elaborou-se uma frequência acumulada do número de agregados familiares por domínio e seleccionaram-se UPAs para amostra aplicando sistematicamente o intervalo amostral a partir dum ponto de partida aleatório. Este procedimento de selecção é conhecido por selecção sistemática com probabilidade proporcional ao tamanho dos agregados familiares. Para obter uma selecção optimizada (com menor erro amostral) das UPAs, agrupou-se as áreas de enumeração por área de residência urbana e rural dentro de cada província. Em cada UPA, foi seleccionada uma única AE e, em cada AE seleccionada obteve-se uma lista de agregados familiares durante o processo de actualização cartográfica e de agregados familiares das UPAs seleccionadas (cada AE é composta por entre 80 e 150 agregados familiares). Na lista de agregados familiares fez-se a selecção aleatória e sistemática de 24 para as entrevistas.
Estimates of Sampling Error
Por tratar-se dum inquérito por amostragem, os resultados do IDS 2003 apresentados neste relatório estão afectados por dois tipos de erros: erros amostrais e erros não-amostrais. Os erros nãoamostrais produzem-se durante a fase de recolha e processamento de dados e os chamados erros amostrais resultam do facto de ter-se entrevistado só uma parte da população e não a sua totalidade.
O primeiro tipo de erro inclui a falta de cobertura de todas as mulheres seleccionadas, erros na formulação das perguntas e no registo das respostas, confusão ou incapacidade das mulheres em dar informação e erros de codificação ou de processamento. Neste estudo tentou-se reduzir no mínimo este tipo de erros através duma série de procedimentos que se usam em amostras bem desenhadas e executadas como por exemplo, o desenho cuidadoso, as numerosas provas do questionário, a intensa capacitação das entrevistadoras, a supervisão permanente do trabalho de campo e a revisão dos questionários no gabinete por parte do pessoal de crítica. A supervisão apropriada na etapa de codificação e processamento dos dados e limpeza cuidadosa dos arquivos, a retro alimentação aos supervisores, as críticas às entrevistadoras a partir dos quadros de controle de qualidade, também contribuiram para minimizar os erros. Os elementos de avaliação disponíveis assinalam que este tipo de erros manteve-se dentro das margens razoáveis no IDS 2003. A descrição que abaixo segue não faz referência aos erros alheios a amostra, senão unicamente os chamados erros amostrais.
A amostra alocada para este Inquérito é uma das demais amostras possíveis com o mesmo tamanho que poderiam ter sido seleccionadas na população a estudar, utilizando a mesma técnica de amostragem. Cada uma dessas amostras teria gerado resultados em certa medida diferentes daqueles obtidos pela efectivação da presente amostra. A variabilidade que se observaria entre todas as amostras possíveis constitui o erro amostral. Embora o grau de variabilidade não seja conhecido com exactidão, pode ser estimado a partir dos resultados proporcionados pela amostra efectivamente seleccionada.
O erro amostral mede-se por meio do erro padrão. O erro padrão duma média, percentagem, diferença ou qualquer outra estatística calculada com os dados da amostra define-se como a raiz quadrada da variância da estatística, e é uma medida de sua variação em todas as amostras possíveis. Em consequência, o erro padrão mede o grau de precisão com que a média, a percentagem, ou outra qualquer estatística baseada na amostra se aproxima do resultado que se obteria se todas as mulheres da população tivessem sido entrevistadas nas mesmas condições.
O erro padrão pode ser utilizado para calcular intervalos dentro dos quais supõe-se, com determinado grau de confiança, que o valor real para a população recairá. Para qualquer medida estatística calculada a partir da amostra (por exemplo, uma percentagem), o valor dessa medida cairá num intervalo de mais ou menos duas vezes o erro padrão dessa medida em 95 por cento de todas as amostras possíveis de igual desenho e tamanho.
Se as mulheres incluídas na amostra tivessem sido seleccionadas na forma aleatória simples, teria sido possível utilizar directamente as fórmulas muito conhecidas que aparecem nos textos de estatística para calcular erros padrão e limites de confiança e para a realização de testes de hipóteses. Entretanto, como foi mencionado, o desenho utilizado é complexo, para o qual se requerem fórmulas especiais que consideram os efeitos da estratificação e conglomeração.
As estimativas das taxas de fecundidade e de mortalidade e o erros padrão no apêndice do Relatorio Final foram calculadas com base no processo de estimação de Jackknife, que consiste em obter um número de réplicas igual ao número de áreas de enumeração. Uma réplica utiliza todas as 604 áreas de enumeração menos 1, quer dizer, 603 ao todo e cada vez que a réplica usa todas menos uma esta sendo diferente da usada nas réplicas anteriores.
Um valor de EDIS igual a 1.0 indica que o desenho utilizado é tão eficiente quanto uma amostragem aleatória simples, enquanto que um valor superior a 1.0 indica que o uso de conglomerados produziu uma variância superior a que obteria com uma amostragem aleatória simples do mesmo tamanho.
O Quadro B.1 do Relatorio Final apresenta as variáveis para as quais se calculou os erros de amostragem, mostrando-se o tipo de indicador utilizado e a população de referência. Os Quadros B.2.1 a B.2.14 apresentam os erros de amostragem para os indicadores das variáveis seleccionadas, para todo o país, por área de residência e as 10 províncias para as mulheres elegíveis e similarmente para os homens. Os demais Quadros (Quadros B.3 e B.4.1 a B.4.5) incluem erros de amostragem para as taxas de fecundidade (para os três anos anteriores ao inquérito) e taxas de mortalidade (para os dez anos anteriores ao inquérito), por área de residência urbano ou rural e província. Os erros de amostragem das taxas de mortalidade para o período de cinco anos são apresentados na Tabela B.5 para o total da população. O EDIS considera-se indefinido quando o erro padrão, considerando amostra aleatória simples, é zero (quando a estimativa está a volta de 0 ou de 1).
Para cada variá vel inclui-se o correspondente valor estimado V (em média ou em percentagem), o erro padrão e o número de casos (sem ponderar e os ponderados) para os quais se investigou a característica considerada. Além do erro padrão, nos quadros aparecem também o efeito do desenho (EDIS), o erro relativo (EE/V) e o intervalo de confiança de 95 por cento que contém o valor real.
O exame dos quadros revela que, em geral, os erros padrão são pequenos e que a amostra pode ser classificada de bastante precisa; isto é particularmente claro na antepenúltima coluna onde aparecem os erros relativos. Note-se que os efeitos de desenho tendem a aumentar para as classificações geográficas e a diminuir para aquelas que cruzam toda a amostra, como a idade.
Para ilustrar o uso das cifras deste Apêndice, considera-se a variável média de nascidos vivos de mulheres 40-49 anos, que tem um valor estimado de 6.104 com um erro padrão de 0.078 para a população total do país no Quadro B.2.1. Quando se deseja um intervalo de confiança de 95 por cento, deve-se somar ou subtrair à média duas vezes o erro padrão: 6.104±2×0.078, o que produz um intervalo de 5.948 a 6.261 das duas últimas colunas. Isto significa que para um intervalo de confiança de 95 por cento do valor da média de nascidos vivos de mulheres 40-49 anos, encontra-se entre esses valores que resultam da amostra.