-> PESQUISAS E ESTATÍSTICAS/Conceitos Estatísticos/Análise descritiva

Estatística é um ramo do conhecimento científico que consta de um conjunto de processos que têm por objetivo a observação, a classificação formal e a análise dos fenômenos coletivos ou de massa (finalidade descritiva) e, por fim, investigar a possibilidade de fazer inferências indutivas válidas a partir dos dados observados e buscar métodos capazes de permitir esta inferência (finalidade indutiva).

 

Berquó, Souza, Gotlieb – Bioestatística

 

Medidas de tendência central visam determinar o centro da distribuição. Essa determinação depende de como os dados estão distribuídos. As medidas de tendência central mais usadas são a média, a mediana e a moda.

 

Média: A média aritmética é o valor que todas as observações teriam se fossem todas iguais entre si. Ela é sensível a valores extremos. Sendo n o número total de observações, temos que a média é dada por:

 

 

Mediana: Quando as observações são diferentes umas das outras, a mediana é tal que o número de observações com valores maiores do que o dela é igual ao número de observações com valores menores do que ela. Ela é mais usada quando há valores extremos. Para calculá-la, coloca-se os valores em ordem crescente ou decrescente.

  • Se  a variável discreta em estudo é ímpar, a mediana é dada pelo valor que ocupa o posto

 

  • Se a variável discreta em estudo é par, calcula-se a média dos valores que ocupam os postos

 

 

  • Se a variável em estudo é contínua, calcula-se o valor que divide a freqüência total n em duas partes, não se levando em conta se é par ou ímpar.

 

Moda: A moda representa o valor mais freqüente, daí o seu nome. Porém, ela nem sempre existe e nem sempre é única.

 

 

As medidas de dispersão indicam como os dados variam entre si. As medidas mais usadas para expressar essa variabilidade são a variância e o desvio padrão.

 

Variância: ela parte do fato de que, se não houvesse variação, todos os valores seriam iguais entre si (seriam iguais à média) e, portanto, a diferença entre eles seria nula. Assim, qualquer diferença não nula representa um fator de variação. A diferença de cada observação para a média aritmética representa o quanto as observações variam com relação à média. Para calculá-la, fazemos:

 

 

 

Quando se pretende calcular a variância de uma amostra, dividimos a amostra por n-1 em vez de n:

 

 

 

Desvio padrão: desvio padrão é simplesmente a raiz da variância:

 

 

Analogamente, quando se calcula o desvio padrão de uma amostra, dividimos por n-1 ao em vez de n:

 

 

 

Coeficiente de variação: o desvio padrão é da mesma natureza da variável X e depende também de sua magnitude. Então, quando se quer comparar duas distribuições quanto a variabilidade, deve-se lançar mão de medidas de variabilidade relativa, tais como o coeficiente de variação de Pearson, que indica o quanto o desvio padrão vale em relação à média:

 

 

Medidas de Assimetria: Diz-se que uma distribuição de freqüência é simétrica em torno de um valor A se os pontos simétricos em relação a A tiverem a mesma freqüência. Numa distribuição simétrica, a média aritmética, a mediana e a moda coincidem.

           

Berquó, Souza, Gotlieb – Bioestatística