Sampling Procedure
O PLANEJAMENTO DA AMOSTRA
O desenho amostral da PPV - Pesquisa sobre Padrões de Vida - foi discutido com os técnicos do Banco Mundial e a dimensão da amostra foi fixada em função do orçamento disponível para a realização da pesquisa.
Como pesquisa piloto optou-se por sua realização apenas nas Regiões Nordeste e Sudeste do País, considerando 10 estratos geográficos, a saber: Região Metropolitana de Fortaleza, Região Metropolitana de Recife, Região Metropolitana de Salvador, restante da área urbana do Nordeste, restante da área rural do Nordeste, Região Metropolitana de Belo Horizonte, Região Metropolitana do Rio de Janeiro, Região Metropolitana de São Paulo, restante da área urbana do Sudeste e restante da área rural do Sudeste.
Tal como em outras pesquisas domiciliares realizadas pelo IBGE, optou-se por um desenho com dois estágios de seleção, com estratificação das unidades primárias e seleção proporcional a uma medida de tamanho e seleção aleatória das unidades de segundo estágio. A unidade primária é o setor da base geográfica do Censo Demográfico de 1991 e a unidade de segundo estágio é o domicílio.
O tamanho da amostra para cada estrato geográfico foi fixado em 480 domicílios. Em cada estrato geográfico foi fixado em 60 o número de setores a serem selecionados e 8 domicílios em cada setor, com exceção para os estratos que correspondem ao restante da área rural de cada Região onde fixou-se em 30 o número de setores e em 16 o número de domicílios a serem selecionados por setor, em função da dificuldade de acesso a esses setores, o que implicaria em aumento de custo.
O tamanho da amostra fixado foi defendido pelos técnicos do Banco Mundial em função da experiência nos outros países onde a pesquisa foi ou está sendo conduzida, pela necessidade de produzir informações com a maior rapidez possível e por julgar que o objetivo da pesquisa não é produzir tabulações com cruzamentos de variáveis, tal como ocorre com as informações da Pesquisa Nacional por Amostra de Domicílios - PNAD, mas o de fornecer indicadores de tendência ou de variação em níveis bastante agregados.
A definição dos estratos estatísticos
Conforme descrito anteriormente, o setor é a unidade primária de amostragem, o domicílio é a unidade secundária e unidade de investigação. A estratificação das unidades primárias de amostragem foi definida em duas etapas: a primeira, considerando a divisão geográfica de interesse, que resultou na definição de 10 estratos geográficos; para cada um dos estratos geográficos, a segunda estratificação foi definida por critérios estatísticos, considerando as informações sobre a renda média mensal do chefe do domicílio, variável que foi investigada no Censo Demográfico de 1991 para todos os domicílios.
A alocação da amostra nos estratos de renda
Vale lembrar que o tamanho final da amostra de domicílios foi fixada em função do custo, mais especificamente dos recursos financeiros disponíveis. Em conseqüência, o tamanho da amostra de setores e o número de domicílios a serem selecionados por setor também foram fixados, a saber:
- 60 setores e 8 domicílios por setor, nos estratos geográficos urbanos e regiões metropolitanas (estratos geográficos 1,2,3,4,6,7,8 e 9);
- 30 setores e 16 domicílios por setor, nos estratos geográficos rurais (estratos geográficos 5 e 10).
Antes da alocação nos estratos de renda, a amostra total nos 10 estratos geográficos ficou com 540 setores e 4.800 domicílios. Foi utilizada a alocação proporcional, com base no número de domicílios particulares permanentes ocupados, obtidos pelo Censo 91.
Vale lembrar quem, durante o procedimento de alocação, os valores resultantes foram arredondados para o maior inteiro e em um único estrato, após o arredondamento, o valor resultante 1 foi alterado para 2 a fim de permitir o cálculo de variâncias. Como pode ser observado, em função da variabilidade da fração amostral, a amostra resultante não é a autoponderada.
A SELEÇÃO DA AMOSTRA
A seleção da amostra de setores
Para a seleção da amostra de setores, segundo o desenho adotado, qual seja, amostra estratificada com probabilidade proporcional ao tamanho, foi utilizado um programa em linguagem SAS, utilizando a macro de seleção PPTCOM (ver Silva (1989), que foi adaptada para considerar automaticamente os estratos geográficos e estratos de renda definidos. A medida de tamanho adotada foi o número de domicílios em cada setor, conforme definição de hi P mais adiante.
Após a seleção dos setores, foi realizada uma comparação desses setores com os setores pertencentes às amostras da PNAD - Pesquisa Nacional por Amostra de Domicílios, da PME - Pesquisa Mensal de Emprego e da amostra selecionada para a POF 96/96 - Pesquisa de Orçamentos Familiares. Como o esquema de seleção das amostras dessas pesquisas é o mesmo, qual seja, seleção com probabilidade proporcional ao tamanho, era de se esperar que houvesse coincidências de setores selecionados para duas ou mais pesquisas. Foram avaliados os procedimentos adotados nessas outras pesquisas para contornar o problema de setores (ou domicílios) serem investigados em mais de um pesquisa no mesmo período. Nenhuma das soluções adotadas em outras pesquisas foi considerada satisfatória, tendo sido decidido substituir os setores coincidentes com os de outras pesquisas, além daqueles que foram selecionados mais de uma vez na própria PPV, uma vez que a seleção foi com reposição.
Em função dessa decisão, foi selecionada uma segunda amostra, usando os mesmos procedimentos adotados quando da seleção da primeira amostra. Dessa segunda amostra foram extraídos todos os setores coincidentes com os das outras três pesquisas, todos os setores coincidentes com os selecionados na primeira amostra e, também, aqueles selecionados mais de uma vez nessa segunda
amostra da PPV. Os setores restantes foram analisados comparativamente àqueles a serem substituídos e, para a substituição propriamente dita, foram consideradas algumas variáveis de controle, a saber: estrato geográfico, estrato de renda, situação (urbana ou rural) e tipo de setor (normal ou de favela). Além disso, foi considerado o valor da probabilidade de seleção. Isto significa que um setor substituto tem as mesmas características nas variáveis de controle e tem uma probabilidade de seleção aproximadamente igual à de um setor qualquer dentre os que foram substituídos. Ao todo, foram substituídos 78 setores.
A operação de listagem e a seleção de domicílios
A operação de listagem de setores tem por objetivo construir um cadastro, o mais atualizado possível, dos domicílios existentes nos setores selecionados para a amostra, a fim de permitir a seleção dos domicílios a serem investigados. Em função disso, a operação de listagem foi realizada em quatro etapas, cada uma abrangendo os setores de um trimestre da pesquisa.
Uma vez terminada a listagem dos setores, foi realizada a seleção dos domicílios, que, como definido anteriormente, foi feita com eqüiprobabilidade, considerando os tamanhos de amostra fixados, quais sejam 8 domicílios em cada setor dos estratos metropolitanos e urbanos, e 16 nos dois estratos rurais. Para contornar as possíveis recusas, domicílios vagos ou fechados na hora da realização da entrevista, foi definido um procedimento para substituição de domicílios, que consistiu na seleção de uma amostra reserva de domicílios em cada setor da amostra. Essa amostra foi selecionada previamente, utilizando o mesmo método utilizado na seleção da amostra principal. Ao todo foram realizadas 4940 entrevistas entre as 4944 esperadas. Por problemas operacionais durante a coleta, em dois setores da amostra só foram realizadas 6 entrevistas.