Estatística (2) - Variância e desvio-padrão
Michele Viana Debus de França, Especial para a Página 3 Pedagogia & Comunicação
A variância e o desvio-padrão são medidas de dispersão. Há situações em que as medidas de tendência central, como a média, a moda e a mediana, não são as mais adequadas para a análise de uma amostra de valores. Nesses casos, é necessário utilizar as medidas de dispersão.
Em um vestibular onde o critério de aprovação para a próxima fase é ficar acima da média de acertos dos candidatos, um determinado candidato só precisa comparar seu número de acertos com essa média para saber se passou para a próxima fase.
Para se ter uma ideia do tempo de viagem de uma determinada linha de ônibus, pode-se ter por base o tempo mais frequentemente observado, que seria a moda. Provavelmente, os resultados acima e abaixo desse valor mais frequente podem ter sido obtidos em dias mais atípicos, com mais congestionamento nas ruas, em finais de semana ou em um feriado.
Agora, considere uma escola que deseja ajudar alunos de uma turma com dificuldade em uma determinada matéria, por meio de um projeto específico de acompanhamento desses alunos. Sabendo somente que a média dos alunos dessa turma na referida matéria foi por volta de 6,0, ela não terá informações suficientes para fazer um projeto que atenda adequadamente os alunos com dificuldades. Nesse caso, interessa saber mais sobre os alunos que ficaram abaixo dessa média.
Como calcular
Para situações como essa, as medidas de dispersão são muito úteis. Vamos nos basear nesse último exemplo para mostrar como se calcula a variância e o desvio-padrão.
Considere que um grupo de alunos tenha tirado as seguintes notas em uma determinada matéria: 2,0; 3,0; 3,0; 4,0; 5,0; 6,0; 7,0; 8,0; 9,0; 10,0.
Para calcular essas medidas de dispersão, é útil conhecer a média desses valores:
Agora, calculamos os desvios de todas essas notas em relação à média:
Nota | Desvio |
2 | (2-5,7) = -3,7 |
3 | (3-5,7)= -2,7 |
3 | (3-5,7)= -2,7 |
4 | (4-5,7)= -1,7 |
5 | (5-5,7)= -0,7 |
6 | (6-5,7)= 0,3 |
7 | (7-5,7)= 1,3 |
8 | (8-5,7)= 2,3 |
9 | (9-5,7)= 3,3 |
10 | (10-5,7)= 4,3 |
Se calcularmos a média desses desvios, somando-os e dividindo o resultado por 10, ela será nula, pois a soma de todos esses desvios será zero, pelo próprio significado da média como medida de tendência central.
Assim, elevamos ao quadrado esses desvios e, aí sim, tiramos a média dos resultados. É a variância.
Nota | Desvio | Quadrodo do desvio |
2 | (2-5,7) = -3,7 | (-3,7)²= 13,69 |
3 | (3-5,7)= -2,7 | (-2,7)²= 7,29 |
3 | (3-5,7)= -2,7 | (-2,7)²= 7,29 |
4 | (4-5,7)= -1,7 | (-1,7)²= 2,89 |
5 | (5-5,7)= -0,7 | (-0,7)²= 0,49 |
6 | (6-5,7)= 0,3 | 0,3² = 0,09 |
7 | (7-5,7)= 1,3 | 1,3² = 1,69 |
8 | (8-5,7)= 2,3 | 2,3² = 5,29 |
9 | (9-5,7)= 3,3 | 3,3² = 10,89 |
10 | (10-5,7)= 4,3 | 4,3² = 18,49 |
Podemos concluir que a dispersão das notas em relação à média é de 6,81.
No entanto, a variância não está na mesma unidade que as nossas notas, pois os desvios foram elevados ao quadrado. Para conservarmos as unidades do desvio e dos dados, calculamos o desvio-padrão, o qual nada mais é do que extrair a raiz quadrada da variância.
Logo, o desvio das notas em relação à média é de 2,61 pontos.
No nosso exemplo, com essa informação, é possível à escola ter uma ideia melhor da situação da turma e dos alunos que estão abaixo da média.