Iremos considerar aqui apenas a técnica de amostrage alatatória simples. Nosso objetivo é dar a intuição do processo de amostragem e não ensinar a fazer design de pesquisa de campo. Existem disciplinas específicas para isso.
Duas medidas importantes a serem consideradas.
Distância Máxima tolerável entre a estimativa e o parâmetro real: \(d\)
A probabilidade de que \(d\) seja maior que o tolerável: \(\alpha\)
12.1.1 Tamanho da amostra com \(\sigma\) conhecido
onde n é o tamanho da amostra. Logo observa-se que o tamanho da amostra não tem relação com o tamanho da população. Se a população for altamente homogênea, a variância será pequena e o tamanho da amostra pequeno. Também depende do erro e da probabilidade de ficar acima do tolerável.
TipEXEMPLO
Uma pesquisa de satisfação foi feita com os funcionários de uma empresa. O índice vai de 0 a 100 e sabe-se que o desvio padrão é 30.
Qual o tamanho da amostra de entrevistados, considerando um nível de tolerância \(d=1,5\) unidades, com probabilidade \(1-\alpha=92,81\%\)?
Assim como temos já \(n_1\) elementos agora podemos complementar até chegar a a \(n\)
12.1.4 Proporção populacional
Agora queremos garantir que:
\[P(|\hat{p} - p|\leq d) = 1 - \alpha\]
O tamanho da amostra será tal que:
\[n=\frac{ Z_{c}^{2}}{d^{2}} p (1-p)\]
se não sabemos nada considerar \(p=0,5\), esse irá gerar a maior amostra para dado \(\alpha\) e \(d\)
O exemplo no R:
Vejamos como ficaria o tamanho amostral para uma pesquisa eleitoral onde consideramos que \(p=0.4\), \(1-p=0.6\), \(1-\alpha=0,95\) e iremos considerar varios \(d\), margem de erro. Ou seja, a primeira é dois pontos percentuais para mais ou menos, o segundo 1,5 pontos percentuais, o terceiro, 1 ponto e por fim 0,5 pontos percentuais. Vejamos o que essa mudança no que estamos ropensos a aceitar como margem de erro afeta o custo da pesquisa. Vimos que o valor por questionário era de R$53,00.
# Utilizando a tabela normal vimos que para alpha de 5% o #valor de Zc é 1,96, sendo p=0.4 e q=0.6# para uma margem de erro de 2 pontos para cima e para #baixo,tem-se 1.96^2*0.4*0.6/(0.02^2) # Tamanho amostral
[1] 2304.96
(1.96^2*0.4*0.6/(0.02^2))*53# Custo da pesquisa
[1] 122162.9
# para uma margem de erro de 1.5 pontos para cima e para #baixo,tem-se 1.96^2*0.4*0.6/(0.015^2) # Tamanho amostral
[1] 4097.707
(1.96^2*0.4*0.6/(0.015^2))*53# Custo da pesquisa
[1] 217178.5
# para uma margem de erro de 1 pontos para cima e para #baixo,tem-se 1.96^2*0.4*0.6/(0.01^2) # Tamanho amostral
[1] 9219.84
(1.96^2*0.4*0.6/(0.01^2))*53# Custo da pesquisa
[1] 488651.5
# para uma margem de erro de 1 pontos para cima e para #baixo,tem-se 1.96^2*0.4*0.6/(0.005^2) # Tamanho amostral
[1] 36879.36
(1.96^2*0.4*0.6/(0.005^2))*53# Custo da pesquisa
[1] 1954606
Notamos que para sairmos de uma margem de erro de 2 pontos para uma margem de erro de 0.5 pontos percentuais o custo sai de R$122 mil para quase R$ 2 milhões. O custo cresce de forma exponencial com o aumento da precisão.