quinta-feira, 21 de março de 2013

Estatística: População e Amostra

Essa matéria até o momento demonstra como devemos definir a quantidade de pessoas ou objetos que estamos pesquisando, já que em algumas situações é impossível, ou mesmo que seja possível, as vezes é muito oneroso pesquisar todo o universo. Por exemplo, queremos saber quantos alunos do ensino médio no Brasil residem na área urbana ou rural. É possível perguntar para cada aluno se ele mora na área urbana ou rural, porém é muito oneroso ou muito trabalhoso, sem dizer no custo financeiro e pessoal. Assim sendo, é interessante que tomemos uma pequena parte desses alunos e aplicamos o questionamento, e baseado no resultado dessa pequena porção, atribuímos como verdadeiro para todo o grupo de estudantes do Brasil.
Agora, dentro do universo de estudantes do ensino médio do Brasil inteiro, para quantos alunos devemos  aplicar o questionamento? dez alunos? vinte alunos? oitenta alunos? Quantos? Depois de sabermos quantos, ainda temos que saber quais? É aí que entra a essência da matéria de estatística dada até o momento.
Nesse contexto é importante começar a entender o conceito de POPULAÇÃO e AMOSTRA. População é todo o universo possível a ser pesquisada. Amostra é uma pequena porção da população total. Isto posto,  é importante dizer que uma população pode ser FINITA ou INFINITA.
Uma população finita é quando temos definido a quantidade de pessoas ou objetos que pertencem a esta população. Um exemplo claro é uma pesquisa para saber o peso médio dos alunos de uma sala de aula de 50 alunos. Nesse caso o pesquisador sabe que a população total é de 50 pessoas, logo é uma população finita. Uma população infinita é quando não temos a informação de quantas pessoas ou objetos compõem a população. Um exemplo é uma pesquisa num pedágio para saber a cor de automóvel que mais passa por ali. Nesse caso o pesquisador não faz ideia e não tem como saber quantos carros passarão pelo pedágio, logo, temos uma população infinita.
Outro ponto importante é que a variável que se está pesquisando pode possuir características diferentes uma das outras. Quando pesquisamos pessoas, não é possível pesquisar duas pessoas e meia, só conseguimos pesquisar 1 ou 2 ou 3 ou 4 e assim por diante, ou seja, só números inteiros. Por outro lado se for pesquisar litros de água é possível pesquisar 2,5 litros, 3,75 litros e assim por diante.
Então fica assim: Se a resposta obtida for do tipo "sim", "não", "talvez", então dizemos que a variável é NOMINAL; se a resposta obtida for algo por ordem de importância, como 1 para mais importante e 5 para menos importante, então temos uma variável ORDINAL; se a resposta for medidas de peso, moedas ou sempre com medidas decimais, então temos uma variável INTERVALAR.


Definições:

  • Z = Nível de Confiança, onde por convenção:
    • Se Z = 95%, então Z = 1,96
    • Se Z = 95,5% então Z = 2
    • Se Z = 99% então Z = 2,57
  • S = Desvio Padrão
  • d = Percentual de Erro
  • n = Amostra a encontrar
Fórmulas no formato excel:
Se a variável for INTERVALAR e a população for FINITA, então usa-se

n = (Z^2*S^2*N)/(d^2*(N-1)+Z^2*S^2)

Se a variável for INTERVALAR e a população for INFINITA, então usa-se

n=((Z*S)/d)^2

Se a variável for NOMINAL ou ORDINAL e a população for FINITA, então usa-se

n=(Z^2*p*q*N)/(d^2*(N-1)+Z^2*p*q)

Se a variável for NOMINAL ou ORDINAL e a população for INFINITA, então usa-se

n=(Z^2*p*q)/d^2

O que não se pode esquecer é que tudo isso é utilizado para sabermos ao final: quantos elementos vamos pesquisar?

Nenhum comentário:

Postar um comentário