Tendência central Origem: Wikipédia, a enciclopédia livre.
Em estatística estatística,, uma tendência central (ou, normalmente, uma medida de tendência central) é um valor central ou valor típico para uma distribuição de probabilidade .[1] É chamada ocasionalmente como média ou apenas centro da distribuição. As medidas de tendência central mais comuns são a média aritmética, aritmética , a mediana e moda moda.. Tendências centrais podem ser calculadas tanto para um número finito de valores quanto para uma distribuição teórica, a exemplo da distribuição normal. normal . Ocasionalmente autores usam tendência central (ou centralidade), significando "a tendência de dados quantitativo quantitativoss de se [2][3] agruparem agrupare m ao redor de um valor central." central. " Tal significado pode ser esperado da definição usual das palavras tendência e centralidade no dicionário. Autores podem julgar se dados têm tendência central forte ou fraca f raca se baseando na dispersão estatística, estatística, medida pelo desvio padrão ou algo similar. O termo "tendência central" data do final de 1920 .[3] Índice
[esconder]
1Medidas de tendência central 2Soluções para problemas variacionais 3Relações entre média, mediana e moda 4Referências
Medidas de tendência central [editar editar || editar código-fonte] código-fonte] As seguintes medidas podem podem ser aplicadas aplicadas para dados unidimensio unidimensionais. nais. Dependendo Dependendo das circunstâncias, pode ser apropriado transformar os dados antes de calcular a tendência central. Exemplos são tirar quadrados de valores ou calculando logaritmos. Uma transformação ser apropriada e o que deveria ser depende muito nos dados sendo analisados.
Média aritmética (ou simplesmente, média) - a soma de todas as medições divididas pelo número de observações no conjunto de dados. Mediana - o valor do meio que separa a metade maior da metade menor no conjunto de dados. A mediana e a moda são as únicas medidas de tendência central que podem ser usadas para nível de medição, medição , onde valores recebem ranks relativos aos outros mas não são medidos absolutamente. absolutamente. Moda - O valor que aparece com mais frequência no conjunto de dados. Essa é a única medida de tendência central que pode ser usada com dados nominais, nominais , os quais tem atribuições de categoria puramente qualitativa. Média geométrica - A raiz enésima(n) do produto dos valores dos dados, onde existem n valores. Essa medida é válida apenas para dados que foram medidos absolutamente em uma escala estritamente positiva. Média harmônica - É o recíproco da média aritmética do recíproco dos valores dos dados. Essa medida também só é válida para dados que foram medidos absolutamente em uma escala estritamente positiva. Média ponderada - Uma média aritmética que incorpora peso para os elementos. Média truncada - A média aritmética dos valores dos dados depois de que um certo número ou proporção dos maiores e menores valores tenham sido descartados. Média interquartíli interquartílica ca - um tipo de média truncada. Alcance médio médio - A média aritmética dos valores máximo e mínimo do conjunto de dados. Articulação média - a média aritmética dos dois quartis quartis.. Média tripla - A média ponderada da mediana e dois quartis.
Média winsorizada - Uma média aritmética na qual valores extremos são substituídos por valores mais próximos da mediana.
Qualquer uma das medidas acima podem ser aplicadas para cada uma das dimensões de dados multidimensionais, multidimensionais, mas os resultados podem não ser invariantes a rotações do espaço multidimensional. multidimensional. Em adição, existe a
Mediana geométrica - que minimiza a soma de distâncias para os pontos de dados. Isso se assemelha à mediana quando aplicada a dados unidimensionais, mas não é o mesmo que tirar a mediana de cada dimensão independentemente. Ela não é invariante a diferentes mudanças de escala das diferentes dimensões.
A Média quadrática (também conhecida como média da raíz quadrada) é útil na engenharia,, mas não é muito usada em estatística. Isso se dá porque ela não é um bom engenharia indicador do centro de distribuição quando quando a distribuição incluí valores negativos.
Soluções para problemas variacionais[editar editar || editar código-fonte] código-fonte] Várias medidas de tendência central podem ser caracterizadas como a solução de um problema variacional. variacional. No sentido do cálculo das variações, variações , visa minimizar a variação a partir do centro. Ou seja, dada uma medida de dispersão estatística, estatística, alguém pede uma medida de tendência central, que minimiza a variação: de tal forma que a variação do centro é mínima entre todas as opções de centro. Em resumo, "dispersão precede localização". No sentido em L p espaços espaços,, a correspondência é: L p
dispersão
tendência central
L1
desvio médio absoluto mediana
L2
desvio padrão
média
L
desvio máximo
alcance médio
∞
Assim, o desvio padrão padrão sobre a média é menor menor do que o desvio padrão padrão sobre qualquer qualquer outro ponto, e o desvio máximo sobre o alcance médio é menor do que o desvio máximo sobre qualquer outro ponto. A singularidade desta caracterização da média decorre da otimização convexa. convexa. Na verdade, para um dado conjunto de dados (fixo) x , a função:
representa a dispersão sobre um valor constante c em em relação à normal L 2. Como a função ƒ 2 é uma função coercitiva estritamente convexa convexa,, o minimizador existe e é único. Note que a mediana neste sentido não é geralmente única, e na verdade qualquer ponto entre os dois pontos centrais de uma distribuição discreta minimiza minimiza o desvio médio absoluto. A dispersão na norma L1, dada por
não é estritamente convexa, onde convexivida convexividade de estrita é necessária para garantir singularidade do minimzador. Apesar disso, o minimizador é singular para a norma L∞.
Relações entre média, mediana e moda [editar editar || editar código-fonte]] código-fonte Para distribuições unimodais os seguintes limites são conhecidos e nídidos: nídidos :[4]
onde μ é é a média, ν é é a mediana, θ é é a moda, e σ é é o desvio padrão. Para qualquer distribuição, distribuição ,[5][6].
Referências 1. 2. 3. 4. 5. 6.
Ir para cima↑ Weisberg H.F (1992) Central Tendency and Variability , Sage University Paper Series on Quantitative Applications in the Social Sciences, ISBN 0-8039-4007-6 p.2 Ir para cima↑ Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms , OUP for International for International Statistical Institute. Institute. ISBN 0-19-920613-9 (entry for "central tendency") ↑ Ir para:a b Upton, G.; Cook, I. (2008) Oxford Dictionary of Statistics , OUP ISBN 978-0-19-954145-4 (entry for "central tendency") Ir para cima↑ Johnson NL, Rogers CA (1951) "The moment problem for unimodal distributions". Annals of Mathematical Mathematical Statistics Statistics, 22 (3) 433 –439 Ir para cima↑ Hotelling H, Solomons LM (1932) The limits of a measure of skewness. Annals Math Stat 3, 141 –114 Ir para cima↑ Garver (1932) Concerning the limits of a mesuare of skewness. Ann Math Stats 3(4) 141 –142
Medidas de tendência central As mais importantes medidas de tendência central são a média aritmética, média aritmética para dados agrupados, média aritmética ponderada, mediana, moda, média geométrica, média harmônica, quartis. Quando se estuda variabilidade, as medidas mais importantes são: amplitude, desvio padrão e variância.
Medidas
Fórmula
Média aritmética Média aritmética para dados agrupados Média aritmética ponderada Mediana Moda Média geométrica
1) Se n é impar, o valor é central, 2) se n é par, o valor é a média dos dois valores centrais Valor que ocorre com mais frequência.
Média harmônica Quartil Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados. Pode-se mostrar que, quando a distribuição dos dados é "normal", então a melhor medida de localização do centro é a média. A distribuição normal é uma das mais importantes e que surge com mais frequência nas aplicações (esse fato justifica a grande utilização da média). A média possui uma particularidade bastante interessante, que consiste no seguinte: se calcularmos os desvios de todas as observações relativamente à média e somarmos esses desvios, o resultado obtido é igual a zero. A média tem uma outra característica, que torna a sua utilização vantajosa em certas aplicações: quando o que se pretende representar é a quantidade total expressa pelos dados, utiliza-se a média. Na realidade, ao multiplicar a média pelo número total de elementos, obtemos a quantidade pretendida.
Medidas de tendência central: média, moda e mediana Romirys Cavalcante Cavalcante 22.8.12 Medida de Tendência Central
Quando alguém afirma que a temperatura média, ontem, de sua cidade, foi de 20°C, todo o conjunto de temperaturas de ontem foi representado por um único valor que, nesse caso, foi a média aritmética dessas temperaturas. A média aritmética é uma das medidas de tendência central que abordaremos nessa publicação.
As medidas de tendência central são utilizadas para caracterizar um conjunto de valores, representando-o adequadamente. A denominação “medida de tendência central”, central ”, que você viu no título dessa postagem, se deve ao fato de que, por ser uma medida que caracteriza um conjunto, tenderá a estar no meio dos valores. Além da média aritmética,
iremos
aprender,
nessa
publicação,
também
sobre
a mediana e
a moda.
Média Aritmética Dada a sequência 1,2,3,4,51,2,3,4,5, como determinar a sua média aritmética? A média aritmética é obtida somando-se todos os números dessa sequência e dividindo pela quantidade de números que a sequência possui, que são 5 números, ou seja:
m.a.=1+2+3+4+55m.a.=155m.a.=3m.a.=1+2+3+4+55m.a.=155m.a.=3 Se considerarmos um conjunto de valores x1,x2,x3,x4,…,xnx1,x2,x3,x4,…,xn . A média aritmética dos valores desse conjunto é dada por:
m.a.=x1+x2+x3+x4+ +xnnm.a.=x1+x2+x3+x4+ ⋯
Moda
+xnn
⋯
O termo “moda moda”” foi utilizado pela primeira vez em 1895 por Karl Pearson (1857-1936), possivelmente em referência ao seu significado usual. Embora a palavra “moda moda”” possa estar relacionada a desfiles e roupas em geral, em um sentido mais amplo, significa uma ação, uma atitude ou um pensamento que é mais praticado ou frequente. Para ilustrar esse amplo conceito, iremos supor um exemplo, onde foi feita uma pesquisa sobre a preferência de um grupo de alunos em relação ao curso superior que desejariam cursar ao passar no vestibular, veja:
Pergunta: Nessa pesquisa existe algum curso superior que foi mais citado?
A resposta é sim, existe um curso mais citado. Esse curso mais citado foi o de Engenharia (citado duas vezes), os demais foram citados apenas uma vez. Por isso, a opção “Engenharia” é a moda desse conjunto, o valor dominante ou valor típico nesse grupo. De acordo com o conceito podemos deduzir que a moda é sempre o valor mais frequente em
um
conjunto
de
dados.
Observe alguns exemplos: Considere um conjunto P={3,6,8,5,3,4,7}P={3,6,8,5,3,4,7}. Nesse exemplo é fácil perceber que a moda é igual a 33, pois este valor é o mais frequente neste conjunto, ou seja, o número 33 foi o único que apareceu mais vezes dentre
os
demais
números
do
conjunto PP.
Considere um conjunto Q={1,2,4,5,7,8,9,3}Q={1,2,4,5,7,8,9,3}. Note que nesse exemplo nenhum número se repete mais de uma vez no conjunto QQ, portanto dizemos que esse conjunto não possui moda ou, em outras palavras, chamamos ele de Amodal .
Classificações da moda: É importante que você saiba que a moda, em um conjunto, pode assumir quatro classificações possíveis. A seguir irei apresentar
# Exemplo:
# Exemplo:
#
essas
classificações
Amodal,
e
suas
quando
não
características:
existe
moda.
A={7,5,4,8,3}A={7,5,4,8,3} Unimodal,
quando
há
apenas
uma
única
moda.
B={8,6,8,5,1,4,7,8}B={8,6,8,5,1,4,7,8} Bimodal,
quando
há
Exemplo:
C={8,6,4,5,1,15,4,7,8}C={8,6,4,5,1,15,4,7,8}
#
Multimodal,
Exemplo:
principais
quando
há
exatamente
três
duas
ou
mais
modas.
modas.
D={9,1,8,5,1,4,8,5,7,12}D={9,1,8,5,1,4,8,5,7,12}
Importante: A moda pode ser utilizada para representar tanto um conjunto de dados numéricos como um conjunto de dados nominais. Por exemplo, quando eu comecei a falar sobre a moda, nessa publicação, perguntei qual curso tinha se destacado entre os demais naquela pesquisa e foi até o curso de engenharia que mais se destacou certo? Pois bem, aquele conjunto formado pelos nomes dos cursos é um exemplo de conjunto nominal, ou seja, um conjunto formado apenas
por
nomes.
Mediana Mediana é uma medida de tendência central que tem a característica de dividir um conjunto ao meio. Isto é, a
mediana de um conjunto o separa em duas partes de modo que 50% dos valores sejam menores que ela e 50% dos valores sejam maiores que ela, ou seja, em um conjunto onde seus elementos estão dispostos em ordem crescente ou decrescente a mediana é o termo central desse conjunto ou o elemento que está bem no meio.
Por exemplo: Considere um conjunto A, tal que: A={6,4,2,7,8,4}A={6,4,2,7,8,4}. Em primeiro lugar colocamos
esse conjunto em ordem crescente ou decrescente , tanto faz. Geralmente costumo colocar sempre na ordem crescente para melhor entendimento do assunto. Logo o conjunto AA ficará da seguinte maneira:
A={2,4,4,6,7,8}A={2,4,4,6,7,8}
Note que essa sequencia é formada por um número par de termos, ou seja, por seis termos. Portanto existem dois d ois termos centrais: os que ocupam a 3ª e 4ª posições. Logo qualquer valor que se encontre entre esses dois termos, no caso, o 44 e o 66, pode dividir o conjunto em duas partes com a mesma quantidade de elementos. Porém, de acordo com a própria definição, nesses casos em que o conjunto apresenta dois termos centrais, consideramos a média aritmética entre esses dois termos para ser o termo central, ou seja, no nosso caso devemos somar os dois termos
centrais 4+6=10 4+6=10 e dividir o resultado por 22, assim obteremos o valor 55como resposta para o termo central
do
conjunto AA.
Lembre-se:
Quando há um número ímpar de termos em um conjunto, existirá um único termo central. Nesses casos a me medi diana ana será o próprio termo central, sem dificuldades. Exemplo: Considerando
um
conjunto B={5,7,9,1,2,2,6}B={5,7,9,1,2,2,6} determinar
a mediana desse
conjunto. Primeiro devemos organizar esse conjunto conju nto em ordem crescente ou decrescente, conforme a sua preferência. Em ordem crescente o conjunto ficaria assim:
B={1,2,2,5,6,7,9}B={1,2,2,5,6,7,9} Nesse caso o termo central é o que se encontra na 4ª posição, ou seja, o número 55. Dizemos então que o número 55 é a mediana desse conjunto pois é ele que se encontra bem no centro dele.
Importante: Para obter a mediana de um conjunto de dados, devemos sempre ordenar esse conjunto. A ordem pode ser crescente ou decrescente, como eu já disse, tanto faz. Se o conjunto tiver um número ímpar de termos, a mediana é o próprio termo central. Caso o conjunto tenha um número par de termos, a mediana será a média aritmética dos dois termos centrais.
Conclusão: Estamos chegando ao fim de mais um artigo aqui no Vivendo entre Símbolos, espero ter esclarecido suas dúvidas sobre as medidas de tendencia centrais e suas principais características. Não pense que essas três são as únicas medidas de tendencia centrais que existem. Em breve estarei publicando artigos que irão focar nas demais medidas de tendência central que não foram mencionadas nesse artigo. Um grande abraço, obrigado pela leitura, bons estudos e até a próxima.