Média, desvio padrão e variância - Noções de estatística
Carlos Alberto Campagner, Especial para a Página 3 Pedagogia & Comunicação
(Atualizado em 13/01/2014, às 12h41)
Quanto foi a sua média de matemática no último bimestre? Um dos conceitos mais básicos e cotidianos da estatística, a média nada mais é que um valor que "representa" vários outros. Com os exemplos a seguir, você vai ver que é fácil.
Imagine que, no bimestre, João fez cinco atividades que valiam nota nas aulas de matemática. Ele começou bem, mas terminou o bimestre mal. Tirou as seguintes notas: 9, 7, 5, 3, 2.
Qual será a sua média no fim do bimestre?
Para facilitar os cálculos, vamos adotar o seguinte padrão: S é a soma das notas, e n é o número de notas que ele teve.
A média (M) será:
Note que a sua média não é igual a nenhuma das notas que ele tirou. É um número que mostra, mais ou menos, como João foi no bimestre.
Medidas de dispersão
Muitas vezes, a média não é suficiente para avaliar um conjunto de dados. Por exemplo, quando se fala em um grupo de mulheres com idade média de 18 anos. Esse dado, sozinho, não significa muito: pode ser que no grupo, muitas mulheres tenham 38 anos, e outras tantas sejam menininhas de dois!
É importante, então, conhecer outra medida, a de que diferença (dispersão) existe entre a média e os valores do conjunto.
Voltando ao exemplo das notas de João, podemos calcular o desvio, que é a diferença de cada nota em relação à média:
Notas | Média | Desvio |
9 | 5,2 | 3,8 |
7 | 5,2 | 1,8 |
5 | 5,2 | - 0,2 |
3 | 5,2 | - 2,2 |
2 | 5,2 | - 3,2 |
Outro dado importante em estatística é obtido pela soma dos desvios ao quadrado. Cada desvio é elevado ao quadrado e, em seguida, somados:
Valores | Média | Desvio | Quadrado dos desvios |
9 | 5,2 | 3,8 | 14,44 |
7 | 5,2 | 1,8 | 3,24 |
5 | 5,2 | - 0,2 | 0,04 |
3 | 5,2 | - 2,2 | 4,84 |
2 | 5,2 | - 3,2 | 10,24 |
Soma dos quadrados dos desvios | 32,8 |
A soma dos quadrados dos desvios dividida pelo número de ocorrências é chamada de variância.
Logo:
Outro valor que pode ser obtido a partir da média e da variância é o desvio padrão. Como os desvios foram elevados ao quadrado, deve-se tirar a raiz quadrada da variância e achar o desvio padrão:
Só para se ter uma ideia melhor do que significa o desvio padrão veja o seguinte exemplo:
Notas: (9, 9, 9, 1, 1, 1)
A média será:
E o desvio padrão será Dp = 4 (tente calculá-lo por conta própria).
Note que, apesar de esse aluno ter tido média 5, seu desempenho foi muito irregular (variou de 4 pontos! 5+4 =9 e 5-4 = 1), o que não é tão bom assim.
No exemplo anterior pode-se interpretar que as notas, no geral, variaram entre (5,2 + 2,56) = 7,76 e (5,2 - 2,56) = 2,64 , ou seja, Joãozinho teve desempenho mais regular que esse outro aluno.
Nota: As fórmulas utilizadas pressupõem os dados como população, sendo portanto:
desvio padrão com base na população |
No caso de amostras, seria:
desvio padrão a partir de uma amostra, também chamado de desvio padrão amostral |