terça-feira, 23 de abril de 2013

Estatística: Variância e Desvio-Padrão


Medidas de Dispersão: Variância x Desvio-Padrão


A dispersão é o quanto os números de um mesmo intervalo estão longe do centro (média). Por exemplo: um intervalo de números pode me exibir uma média “20”, porém, esse intervalo possui números como “600”, “3”, “1.000”, isso é uma grande dispersão. Outro exemplo com a mesma média “20” é um intervalo com exatamente os números “19”, “20” e “21”, nesse caso quase não houve dispersão, pois os números estão todos próximos da média.

Intervalos de amostragem:


Coluna 1
Coluna 2
Coluna 3

1
2
110

2
1
115

50
2
120

60
1
125

70
704
125

537
10
125
Médias:
120
120
120

A Variância é utilizada para analisar dois ou mais intervalos de números que obtém o mesmo valor de média. É como um termômetro para medir se aqueles intervalos possuem mais ou menos dispersão. Na tabela acima observe que apesar dos valores das três colunas serem diferentes, a média aritmética é exatamente igual.
Resumindo, a variância serve para responder a seguinte pergunta: Qual das colunas do exemplo acima os números mais se aproximam do valor da média? (apesar de que eu fiz um exemplo que só olhando já é possível responder).
Vamos ao cálculo da variância da coluna1:
Passo1: Para cada número da coluna faça o seguinte:
=(nr – média)^2    - número menos o valor da média, e eleva ao quadrado
=(1 – 120)^2   - o resultado é: 14.161
Faça isso com todos os números da coluna.
Passo 2: Some todos os números obtidos e divida pela quantidade de números que aparece na coluna:
=(14.161 + 13.924 + 4.900 + 3.600 + 2.500 + 173.889)/6
O resultado é: 35.495,67    é o resultado final do cálculo, ou seja, essa é a variância da coluna1.
Para calcular a variância das outras duas colunas siga o mesmo procedimento usado na coluna 1. Os resultados das três variâncias são:
              Coluna1:      35.495,67
              Coluna2:      68.221,00
              Coluna3:            33,33
Um detalhe que eu concluo é que os valores obtidos com a variância se estiverem isolados não tem utilidade alguma e também que o valor em si não significa nada, é apenas para efeito de comparação. Supondo que alguém me mostre apenas a “coluna 3” e me diga: “Olha, essa tem variância 33,33”, isso não me dá informação alguma. Agora se me apresentar ao menos duas colunas e me disser: “Olha, a coluna um tem variância 35.495,67 e a coluna três tem variância de apenas 33,33”, aí sim é possível se fazer uma comparação. E repito, ambos os números não representam nada, ou seja, é apenas para saber qual número é maior que o outro.
Agora na prática como eu usaria essa informação? Vamos supor que as três colunas representassem a rentabilidade de três tipos de investimentos diferentes num prazo de seis meses. Nesse caso, qual é o investimento mais volátil (maior risco) e qual é o investimento mais estável (menor risco)? Com certeza o investimento com maior variância, ex.: coluna 2, é o mais arriscado e o investimento com menor variância, ex.: coluna 3, é o menos arriscado, pois apesar de ter suas altas e baixas não existe muita dispersão.

O Desvio-padrão, ao contrário da variância, tenta encontrar essa mesma dispersão, porém com mais realidade. Eu frisei duas vezes no texto acima que os números da variância encontrados não significavam nada e que serviam apenas para comparação sobre qual número é maior que o outro, que como resultado temos que um intervalo varia mais que o outro. Já o desvio-padrão tenta trazer esses números para a realidade, ou melhor dizendo, “quanto, em números reais, é essa dispersão?”.
Vamos a uma definição: O DESVIO-PADRÃO É CALCULADO A PARTIR DO VALOR DA VARIÂNCIA. O que isso quer dizer? Quer dizer que não existe um cálculo para a variância, como vimos antes, e outro cálculo para o valor-padrão. Se for melhor para entender, podemos dizer que para calcular o valor padrão, primeiro é necessário calcular a variância, ponto final!!
No cálculo da variância observe que nós elevamos ao quadrado a diferença do número com sua média, certo? (=(1 – 120)^2   - o resultado é: 14.161)
Para calcular o desvio-padrão basta extrairmos a raiz quadrada da variância. Simples assim.
Utilizando as variâncias das colunas temos:
Coluna1:        35.495,67            desvio-padrão: =raiz(35.495,67)          resultado: 188,40
Coluna2:        68.221,00            desvio-padrão: =raiz(68.221,00)          resultado: 261,19
Coluna3:               33,33            desvio-padrão: =raiz(33,33)                resultado: 5,77
Mas como eu interpreto esses novos números obtidos? Ou melhorando a pergunta, como eu interpreto o valor padrão?
Esses números nos diz o quanto os números da coluna estão dispersos em relação a média aritmética. Não entendeu nada? Vou explicar: Vamos utilizar a coluna 3.
Média da coluna 3 é igual a: 120
Desvio-Padrão é igual a: 5,77
Calculo1:  =120 + 5,77     resultado: 125,77
Cálculo2:  =120 – 5,77     resultado: 114,23
A interpretação fica da seguinte forma: “Na coluna 3 os valores variam, em média, entre 114,23 e 125,77”.
Eu falei “em média” por que não podemos afirmar que o maior número é 125,77 e o menor número é 114,23, aliás, isso é notável só de olhar para a coluna 3 lá em cima.
O desvio-padrão é usado para encontrar em qual faixa está centralizada a maioria dos números.



VARIÂNCIA
Se tivermos duas séries de números, podemos comparar qual delas possui mais variação em relação à média aritmética.
Supondo que esses números dessas séries sejam rentabilidade de dois investimentos diferentes. Podemos concluir que a série que tem maior variância também tem maior risco de mercado, pois oscila muito mais em relação à outra série.

DESVIO PADRÃO
Supondo que temos uma série de números representando as idades dos alunos de uma sala de aula.
O desvio padrão encontra a variação dessa série em relação a média aritmética, similar ao que acontece com a variância, porém com mais exatidão.
Exemplo:
Média aritmética da série: 20 anos
Desvio Padrão: -5 e +5  (isso significa que existem alunos com 15 anos (20 - 5) e também alunos com 25 anos (20 + 5).


Edvaldo Justo



12 comentários:

  1. Ótima explicação!!! Parabéns!

    ResponderExcluir
  2. Este comentário foi removido pelo autor.

    ResponderExcluir
  3. Este comentário foi removido pelo autor.

    ResponderExcluir
  4. Parabéns pela forma clara de se expressar!!!

    ResponderExcluir
  5. Muito bom! Explicou e exemplificou com clareza.

    ResponderExcluir
  6. Eu tentei entender isso em vários outros sites e cheguei a pensar que o problema era comigo kkkkk. Você exemplificou tão perfeitamente que, de fato, posso afirmar que compreendi tudo que foi ensinado. Meus parabéns!

    ResponderExcluir
  7. Nossa,belo texto! Entendi cada palavra! Parabéns!!!

    ResponderExcluir
  8. Parabéns pela explicação. Exemplos muito bons.

    ResponderExcluir