Medidas de Dispersão: Variância x Desvio-Padrão
A dispersão é o quanto os números de um mesmo
intervalo estão longe do centro (média). Por exemplo: um intervalo de números
pode me exibir uma média “20”, porém, esse intervalo possui números como “600”,
“3”, “1.000”, isso é uma grande dispersão. Outro exemplo com a mesma média “20”
é um intervalo com exatamente os números “19”, “20” e “21”, nesse caso quase
não houve dispersão, pois os números estão todos próximos da média.
Intervalos de amostragem:
|
|||
|
Coluna 1
|
Coluna 2
|
Coluna 3
|
|
1
|
2
|
110
|
|
2
|
1
|
115
|
|
50
|
2
|
120
|
|
60
|
1
|
125
|
|
70
|
704
|
125
|
|
537
|
10
|
125
|
Médias:
|
120
|
120
|
120
|
A Variância
é utilizada para analisar dois ou mais intervalos de números que obtém o mesmo
valor de média. É como um termômetro para medir se aqueles intervalos possuem
mais ou menos dispersão. Na tabela acima observe que apesar dos valores das
três colunas serem diferentes, a média aritmética é exatamente igual.
Resumindo, a variância serve para responder a seguinte
pergunta: Qual das colunas do exemplo acima os números mais se aproximam do
valor da média? (apesar de que eu fiz um
exemplo que só olhando já é possível responder).
Vamos ao cálculo da variância da coluna1:
Passo1: Para cada número da coluna faça o seguinte:
=(nr – média)^2
- número menos o valor da média, e eleva ao quadrado
=(1 – 120)^2 -
o resultado é: 14.161
Faça isso com todos os números da coluna.
Passo 2: Some todos os números obtidos e divida pela
quantidade de números que aparece na coluna:
=(14.161 + 13.924 + 4.900 + 3.600 + 2.500 + 173.889)/6
O
resultado é: 35.495,67 é o resultado final do cálculo, ou seja,
essa é a variância da coluna1.
Para calcular a variância das outras duas colunas siga
o mesmo procedimento usado na coluna 1. Os resultados das três variâncias são:
Coluna1: 35.495,67
Coluna2: 68.221,00
Coluna3: 33,33
Um detalhe que eu concluo é que os valores obtidos com
a variância se estiverem isolados não tem utilidade alguma e também que o valor
em si não significa nada, é apenas para efeito de comparação. Supondo que
alguém me mostre apenas a “coluna 3” e me diga: “Olha, essa tem variância
33,33”, isso não me dá informação alguma. Agora se me apresentar ao menos duas
colunas e me disser: “Olha, a coluna um tem variância 35.495,67 e a coluna três
tem variância de apenas 33,33”, aí sim é possível se fazer uma comparação. E
repito, ambos os números não representam nada, ou seja, é apenas para saber
qual número é maior que o outro.
Agora na prática como eu usaria essa informação? Vamos
supor que as três colunas representassem a rentabilidade de três tipos de
investimentos diferentes num prazo de seis meses. Nesse caso, qual é o investimento
mais volátil (maior risco) e qual é o investimento mais estável (menor risco)?
Com certeza o investimento com maior variância, ex.: coluna 2, é o mais
arriscado e o investimento com menor variância, ex.: coluna 3, é o menos
arriscado, pois apesar de ter suas altas e baixas não existe muita dispersão.
O Desvio-padrão,
ao contrário da variância, tenta encontrar essa mesma dispersão, porém com mais
realidade. Eu frisei duas vezes no texto acima que os números da variância
encontrados não significavam nada e que serviam apenas para comparação sobre
qual número é maior que o outro, que como resultado temos que um intervalo
varia mais que o outro. Já o desvio-padrão tenta trazer esses números para a
realidade, ou melhor dizendo, “quanto, em números reais, é essa dispersão?”.
Vamos a uma definição: O DESVIO-PADRÃO É CALCULADO A
PARTIR DO VALOR DA VARIÂNCIA. O que isso quer dizer? Quer dizer que não existe
um cálculo para a variância, como vimos antes, e outro cálculo para o
valor-padrão. Se for melhor para entender, podemos dizer que para calcular o
valor padrão, primeiro é necessário calcular a variância, ponto final!!
No cálculo da variância observe que nós elevamos ao
quadrado a diferença do número com sua média, certo? (=(1 – 120)^2 - o resultado é:
14.161)
Para calcular o desvio-padrão basta extrairmos a raiz
quadrada da variância. Simples assim.
Utilizando as variâncias das colunas temos:
Coluna1: 35.495,67 desvio-padrão: =raiz(35.495,67) resultado: 188,40
Coluna2: 68.221,00 desvio-padrão: =raiz(68.221,00) resultado: 261,19
Coluna3: 33,33 desvio-padrão: =raiz(33,33) resultado: 5,77
Mas como eu interpreto esses novos números obtidos? Ou
melhorando a pergunta, como eu interpreto o valor padrão?
Esses números nos diz o quanto os números da coluna
estão dispersos em relação a média aritmética. Não entendeu nada? Vou explicar:
Vamos utilizar a coluna 3.
Média da coluna 3 é igual a: 120
Desvio-Padrão é igual a: 5,77
Calculo1: =120
+ 5,77 resultado: 125,77
Cálculo2: =120
– 5,77 resultado: 114,23
A interpretação fica da seguinte forma: “Na coluna 3
os valores variam, em média, entre 114,23 e 125,77”.
Eu falei “em média” por que não podemos afirmar que o
maior número é 125,77 e o menor número é 114,23, aliás, isso é notável só de
olhar para a coluna 3 lá em cima.
O desvio-padrão é usado para encontrar em qual faixa
está centralizada a maioria dos números.
VARIÂNCIA
Se tivermos duas séries de números, podemos comparar
qual delas possui mais variação em relação à média aritmética.
Supondo que esses números dessas séries sejam
rentabilidade de dois investimentos diferentes. Podemos concluir que a série
que tem maior variância também tem maior risco de mercado, pois oscila muito
mais em relação à outra série.
DESVIO PADRÃO
Supondo que temos uma série de números representando
as idades dos alunos de uma sala de aula.
O desvio padrão encontra a variação dessa série em
relação a média aritmética, similar ao que acontece com a variância, porém com
mais exatidão.
Exemplo:
Média aritmética da série: 20 anos
Desvio Padrão: -5 e +5
(isso significa que existem alunos com 15 anos (20 - 5) e também alunos
com 25 anos (20 + 5).
Edvaldo Justo
Parabéns, bem explicado
ResponderExcluirÓtima explicação!!! Parabéns!
ResponderExcluirEste comentário foi removido pelo autor.
ResponderExcluirEste comentário foi removido pelo autor.
ResponderExcluirParabéns pela forma clara de se expressar!!!
ResponderExcluirParabéns, simples e claro
ResponderExcluirParabéns pela Explicação!
ResponderExcluirgrato!!!
ResponderExcluirMuito bom! Explicou e exemplificou com clareza.
ResponderExcluirEu tentei entender isso em vários outros sites e cheguei a pensar que o problema era comigo kkkkk. Você exemplificou tão perfeitamente que, de fato, posso afirmar que compreendi tudo que foi ensinado. Meus parabéns!
ResponderExcluirNossa,belo texto! Entendi cada palavra! Parabéns!!!
ResponderExcluirParabéns pela explicação. Exemplos muito bons.
ResponderExcluir