12 Amostragem

Author

Alexandre Nicolella

Published

March 31, 2026

12.1 Determinação do tamanho da amostra

Iremos considerar aqui apenas a técnica de amostrage alatatória simples. Nosso objetivo é dar a intuição do processo de amostragem e não ensinar a fazer design de pesquisa de campo. Existem disciplinas específicas para isso.

Duas medidas importantes a serem consideradas.

Distância Máxima tolerável entre a estimativa e o parâmetro real: $d$
A probabilidade de que $d$ seja maior que o tolerável: $\alpha$

12.1.1 Tamanho da amostra com $\sigma$ conhecido

Considere a desigualdade de Tchebycheff:

\[P(|\overline{X} - \mu| \leq \varepsilon ) \geq 1-\frac{\sigma^{2}}{\varepsilon^{2} n}\]

Considerando $\varepsilon=d$, $\frac{\sigma^{2}}{\varepsilon^{2} n}=\alpha$ e trabalhando no limite inferior tolerável (na igualdade):

\[P(|\overline{X} - \mu|\leq d) = 1 - \alpha\]

\[P(-d \leq \overline{X} - \mu\leq d) = 1 - \alpha\]

\[P(-\frac{d}{\sigma/\sqrt{n} } \leq Z \leq \frac{d}{\sigma/\sqrt{n}}) = 1 - \alpha\]

\[P(-\frac{d\sqrt{n}}{\sigma } \leq Z \leq \frac{d\sqrt{n}}{\sigma}) = 1 - \alpha\]

\[P(-Z_c \leq Z \leq Z_c) = 1 - \alpha\]

\[Z_c=\frac{\sqrt{n}d}{\sigma} \rightarrow n=\frac{\sigma^{2}Z_c^{2}}{d^{2}}\]

onde n é o tamanho da amostra. Logo observa-se que o tamanho da amostra não tem relação com o tamanho da população. Se a população for altamente homogênea, a variância será pequena e o tamanho da amostra pequeno. Também depende do erro e da probabilidade de ficar acima do tolerável.

EXEMPLO

Uma pesquisa de satisfação foi feita com os funcionários de uma empresa. O índice vai de 0 a 100 e sabe-se que o desvio padrão é 30.

Qual o tamanho da amostra de entrevistados, considerando um nível de tolerância $d=1,5$ unidades, com probabilidade $1-\alpha=92,81\%$?

RESPOSTA

Na tabela da distribuição normal padrão:

\[1 -\alpha = 0,9281 \rightarrow Z_c=1,8\]

Como d=1,5 então:

\[n= \bigg(\frac{1,8 . 30}{1,5} \bigg)^{2}\cong 1.296\]

12.1.2 Tamanho da amostra com população finita

Se a população for finita a independência entre os elementos $X_i$ não é válida. Disto segue que:

\[Var(\overline{X}) = \frac{\sigma^{2}}{n}\]

é caso particular de:

\[Var(\overline{X}) = \sigma^{2} \bigg(\frac{1}{n}-\frac{1}{N} \bigg)\]

Onde N é o tamanho populacional. Assim, para N finito e conhecido basta utilizar:

\[n' = \frac{n}{1+ n/N}\]

Note que se $n$ for muito menor que $N$ então $n' \rightarrow n$ e

\[Var(\overline{X}) = \sigma^{2} \bigg(\frac{1}{n}-\frac{1}{N} \bigg) \rightarrow \frac{\sigma^{2}}{n}\]

Ou seja, converge para a amostragem anterior para população infinita.

12.1.3 Tamanho da amostra com $\sigma$ desconhecido: média amostral

Como não temos $\sigma$ temos que fazer uma amostra piloto com $n_1$ elementos e estimar o desvio padrão da seguinte maneira:

\[S_1=\sqrt{\frac{\sum (X_i - \overline{X})^{2}}{n-1}}\]

Assim pode-se calcular:

\[n=\frac{S_1 ^{2} Z_c^{2}}{d^{2}} \]

Assim como temos já $n_1$ elementos agora podemos complementar até chegar a a $n$

12.1.4 Proporção populacional

Agora queremos garantir que:

\[P(|\hat{p} - p|\leq d) = 1 - \alpha\]

O tamanho da amostra será tal que:

\[n=\frac{ Z_{c}^{2}}{d^{2}} p (1-p)\]

se não sabemos nada considerar $p=0,5$, esse irá gerar a maior amostra para dado $\alpha$ e $d$

O exemplo no R:

Vejamos como ficaria o tamanho amostral para uma pesquisa eleitoral onde consideramos que $p=0.4$, $1-p=0.6$, $1-\alpha=0,95$ e iremos considerar varios $d$, margem de erro. Ou seja, a primeira é dois pontos percentuais para mais ou menos, o segundo 1,5 pontos percentuais, o terceiro, 1 ponto e por fim 0,5 pontos percentuais. Vejamos o que essa mudança no que estamos ropensos a aceitar como margem de erro afeta o custo da pesquisa. Vimos que o valor por questionário era de R$53,00.

# Utilizando a tabela normal vimos que para alpha de 5% o 
  #valor de Zc é 1,96, sendo p=0.4 e q=0.6

# para uma margem de erro de 2 pontos para cima e para 
#baixo,tem-se 
1.96^2*0.4*0.6/(0.02^2)  # Tamanho amostral

[1] 2304.96

(1.96^2*0.4*0.6/(0.02^2))*53 # Custo da pesquisa

[1] 122162.9

# para uma margem de erro de 1.5 pontos para cima e para 
#baixo,tem-se 
1.96^2*0.4*0.6/(0.015^2)  # Tamanho amostral

[1] 4097.707

(1.96^2*0.4*0.6/(0.015^2))*53 # Custo da pesquisa

[1] 217178.5

# para uma margem de erro de 1 pontos para cima e para 
#baixo,tem-se 
1.96^2*0.4*0.6/(0.01^2)  # Tamanho amostral

[1] 9219.84

(1.96^2*0.4*0.6/(0.01^2))*53 # Custo da pesquisa

[1] 488651.5

# para uma margem de erro de 1 pontos para cima e para 
#baixo,tem-se 
1.96^2*0.4*0.6/(0.005^2)  # Tamanho amostral

[1] 36879.36

(1.96^2*0.4*0.6/(0.005^2))*53 # Custo da pesquisa

[1] 1954606

Notamos que para sairmos de uma margem de erro de 2 pontos para uma margem de erro de 0.5 pontos percentuais o custo sai de R$122 mil para quase R$ 2 milhões. O custo cresce de forma exponencial com o aumento da precisão.

12 Amostragem

12.1 Determinação do tamanho da amostra

12.1.1 Tamanho da amostra com \(\sigma\) conhecido

12.1.2 Tamanho da amostra com população finita

12.1.3 Tamanho da amostra com \(\sigma\) desconhecido: média amostral

12.1.4 Proporção populacional