Medidas de tendência central: média, mediana e moda

Transcrição

Medidas de tendência central: média, mediana e moda
2ª Edição
D I S C I P L I N A
Matemática e Realidade
Medidas de tendência central:
média, mediana e moda
Autores
Ivone da Silva Salsa
Jeanete Alves Moreira
Marcelo Gomes Pereira
aula
08
Revisoras de Língua Portuguesa
Janaina Tomaz Capistrano
Sandra Cristinne Xavier da Câmara
Governo Federal
Presidente da República
Luiz Inácio Lula da Silva
Ministro da Educação
Fernando Haddad
Ilustradora
Carolina Costa
Secretário de Educação a Distância – SEED
Ronaldo Motta
Editoração de Imagens
Adauto Harley
Carolina Costa
Universidade Federal do Rio Grande do Norte
Diagramadores
Bruno Cruz de Oliveira
Maurício da Silva Oliveira Júnior
Mariana Araújo Brito
Thaisa Maria Simplício Lemos
Reitor
José Ivonildo do Rêgo
Vice-Reitor
Nilsen Carvalho Fernandes de Oliveira Filho
Secretária de Educação a Distância
Vera Lúcia do Amaral
Secretaria de Educação a Distância- SEDIS
Coordenadora da Produção dos Materiais
Célia Maria de Araújo
Projeto Gráfico
Ivana Lima
Revisores de Estrutura e Linguagem
Eugenio Tavares Borges
Marcos Aurélio Felipe
Pedro Daniel Meirelles Ferreira
Tatyana Mabel Nobre Barbosa
Imagens Utilizadas
Banco de Imagens Sedis (Secretaria de Educação a Distância) - UFRN
MasterClips IMSI MasterClips Collection, 1895 Francisco Blvd,
East, San Rafael, CA 94901,USA.
MasterFile – www.masterfile.cpom
MorgueFile – www.morguefile.com
Pixel Perfect Digital – www.pixelperfectdigital.com
FreeImages – www.freeimages.co.uk
FreeFoto.com – www.freefoto.com
Free Pictures Photos – www.fre-pictures-photos.com
BigFoto – www.bigfoto.com
FreeStockPhotos.com – www.freestockphotos.com
OneOddDude.net – www.oneodddude.net
Divisão de Serviços Técnicos
Catalogação da publicação na Fonte. UFRN/Biblioteca Central “Zila Mamede”
Salsa, Ivone da Silva.
Matemática e realidade: interdisciplinar / Ivone da Silva Salsa, Jeanete Alves Moreira, Marcelo Gomes
Pereira. – Natal, RN: EDUFRN Editora da UFRN, 2005.
292 p.
1. Métodos estatísticos. 2. Análise estatística. 3. Proporção e porcentagem. 4. Dados estaísticos. 5.
Medidas de dispersão. I. Moreira, Jeanete Alves. II. Pereira, Marcelo Gomes. III. Título.
ISBN 85-7273-287-X
RN/UF/BCZM
2005/47
CDD 519.5
CDU 519.22
27/06/2007
Copyright © 2007
Todos os direitos reservados. Nenhuma parte deste material pode ser utilizada ou reproduzida sem a autorização
expressa da UFRN - Universidade Federal do Rio Grande do Norte.
Apresentação
J
á vimos como é indispensável condensar adequadamente dados estatísticos para
termos uma compreensão maior das informações sobre o fato ou fenômeno estudado.
Agora, aprenderemos uma nova forma de resumi-los ainda mais através de medidas
estatísticas conhecidas como medidas de tendência central, as quais são usadas para
representar a série pesquisada. Elas nos informam sobre o comportamento da variável que a
originou, isto é, nos dão uma idéia da tendência de todo um conjunto de dados. Nesta aula,
você aprenderá a calculá-las e interpretá-las. Estudaremos a média aritmética, a mediana
e a moda, que são muito importantes na fundamentação de análises e interpretações de
observações estatísticas.
Objetivos
Nosso propósito é que você aprenda a calcular, interpretar e
compreender a utilização das medidas de tendência central na
análise exploratória de um conjunto de dados. Esperamos também
que seja capaz de saber escolher, dependendo da situação, qual
dessas medidas deve ser usada.
2ª Edição
Aula 08 Matemática e Realidade
1
Média, mediana e moda:
conceitos e cálculos
s medidas de tendência central são valores que, de certa forma, e de maneira
condensada, trazem consigo informações contidas nos dados estatísticos –
sejam eles, populacionais ou amostrais. Elas funcionam como uma espécie
de “medidas-resumo”, pois nos passam a idéia, digamos, do comportamento geral
das observações estudadas. Podemos dizer ainda que elas são como valores de
referência, em torno dos quais, os outros se distribuem. Quando estão associadas aos
dados populacionais, são chamadas de parâmetros; quando são calculadas a partir de
amostras, são denominadas estatísticas. Essa diferença ocorre porque os parâmetros
são valores constantes (fixos), pois são calculados a partir de todos os dados de um
certo conjunto, isto é, a população de interesse. Porém, se trabalhamos com amostras,
as medidas estatísticas obtidas variarão de acordo com as observações que foram
selecionadas. Por isso, elas não são valores fixos, pois dependem dos elementos da
amostra particular que foi escolhida.
A
Veremos, agora, os conceitos e os cálculos de cada uma delas.
Média Aritmética, ou simplesmente média, é uma medida que funciona como o ponto
de “equilíbrio” de um conjunto de dados, é representada pela letra grega (devemos ler
“mi”), quando seu cálculo é feito a partir de todos os valores de uma população. Se
usamos dados amostrais para obtê-la, é referida como (lemos “Xis barra”). É a medida
de tendência central mais popular (desde o início de nossa vida escolar, já nos habituamos
com seu cálculo) e pelas suas propriedades matemáticas é bastante usada na Estatística
Inferencial.
Média Aritmética
Há dois casos a serem considerados no cálculo da média.
1º Caso – Quando tratamos com dados isolados ou não tabelados.
Por exemplo: suponha que suas notas em uma seleção para um curso de aperfeiçoamento
foram 5,6; 4,8; 8,0; 8,6; 6,8; 9,4. Então, se todas têm o mesmo peso, sua média será:
Portanto, sua média foi 7,2, concorda? Formalizando o que fizemos, definiremos a
média da seguinte forma:
2
Aula 08
Matemática e Realidade
2ª Edição
se representam as observações de uma amostra da variável X, então, sua
média aritmética simples é definida como:
Podemos escrever essa expressão de forma simplificada, utilizando a letra grega
maiúscula sigma , devemos ler “sigma”, que é a notação usada para somatório. Ou
seja,
representa a soma de todos os valores assumidos pela variável X, desde até
. Isso significa que o primeiro índice de é 1 e segue até o , este se encontra na parte
superior do . Assim, podemos escrever a fórmula da média como:
(equação 1)
OBS.: preste atenção à sutileza:
Quando nos referimos à variável de interesse, a notação utilizada é X (maiúsculo).
Quando são valores assumidos por ela, denotamos por x (minúsculo).
2º Caso – Quando os dados estão organizados em
uma tabela de freqüências.
Começaremos com um exemplo, no qual as observações estatísticas são tabeladas,
porém não agrupadas em intervalos. Retome a seguinte tabela, apresentada na aula 5.
Tabela 1 – Pontuação no teste objetivo de Matemática, na amostra das turmas da 8a série/manhã, na
E. E. Nair Burégio, município de Carapeba, em abril de 2004.
Pontuação (Xi)
Nº de alunos
(fi) (Freqüência
observada)
xi fi
4
2
4.2=8
5
8
5.8=40
6
10
60
7
15
105
8
12
96
9
7
63
Total
54
372
Fonte: Dados fictícios.
Vimos que para calcular a média aritmética de um conjunto devemos somar todos os
valores deste e dividir o resultado dessa adição pelo número de observações/valores.
2ª Edição
Aula 08 Matemática e Realidade
3
Observe nessa tabela que a pontuação 4 (formalmente, temos, ) apareceu duas
vezes . Assim, temos (isso é exibido na 3a coluna). Em
relação à pontuação 5 (ou seja, ), observamos 8 ocorrências ( ). Daí, de modo
similar, obtemos (confira na 3a coluna). Dessa forma, sucessivamente,
calculamos todos os produtos . Isso é necessário porque a soma desses produtos
representa a soma de todos os valores da distribuição, sendo, assim, indispensável para
obtermos a média.
Portanto, nesse caso, para essa amostra a pontuação média, é dada por:
logo, pontos ou, arredondando, temos pontos.
Para facilitar o cálculo da média, criamos, nessa tabela, uma coluna na qual
registramos o produto de cada um dos valores assumidos pela variável X por suas
respectivas freqüências. Quando somarmos esses produtos , o total representa a
soma de todos os valores da distribuição (nesse exemplo, o resultado foi 372). A média será obtida dividindo-se esse total pelo número de observações da amostra, n , ou seja, pelo
.
somatório das freqüências,
Formalizando esse processo de cálculo da média, quando os dados estão tabelados,
mas não agrupados, teremos:
sejam valores assumidos pela variável X e suas respectivas
freqüências. Nesse caso, a média é dada por:
De forma mais simplificada, podemos escrever:
sendo
(equação 2)
4
Aula 08
Matemática e Realidade
2ª Edição
Atividade 1
Vamos ver o que aprendemos? Calcule a pontuação média no teste objetivo para
a amostra das turmas da noite, cujos dados se encontram na aula 5, quando
estudamos distribuição de freqüências.
Agora, exploraremos o cálculo da média para dados tabelados e agrupados em
intervalos de classe.
Como não temos mais os valores originais, pois estes estão diluídos nas respectivas
classes, usamos os pontos médios dos intervalos de classe, (xi’s,) para substituí-los. Nesse
caso, o cálculo da média é basicamente o mesmo para dados tabelados e não agrupados que
acabamos de expor. A única diferença é que os xi’s não são os valores originais, uma vez que
quando agrupamos em intervalos, perdemos essa informação.
Então, como fazemos para encontrar a média? Nós calculamos o ponto médio (xi) e o
consideramos como representante de todos os valores da classe correspondente i. A partir
daí, teremos, pois, como calcular a média: tomamos os valores teóricos da variável, xi’s, e
suas respectivas freqüências e aplicamos a mesma fórmula utilizada para dados tabelados
não agrupados em classes.
Para ilustrar esse cálculo, considere a Tabela 2 a seguir, referente às médias trimestrais
de Matemática da amostra das turmas da 8a série da manhã.
Tabela 2 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8a série/
manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004.
Notas (médias)
Nº de alunos (fi)
Ponto médio Xi
xi fi
3 ` 4
2
3,5
7,0
4 ` 5
3
4,5
13,5
5 ` 6
7
5,5
38,5
6 ` 7
8
6,5
52,0
7 ` 8
14
7,5
105,0
8 ` 9
12
8,5
102,0
9 ` 10
8
9,5
76,0
Total
54
394,0
Fonte: Dados fictícios.
2ª Edição
Aula 08 Matemática e Realidade
5
Assim, nesse exemplo, teremos:
.
Daí:
Atividade 2
Calcule a média das notas trimestrais para a amostra das turmas da 8a série/
manhã, na E. E. Nair Burégio, município de Carapeba cujos dados estão na
tabela a seguir. Compare esse resultado com o que calculamos para a turma da
manhã. O que você pode concluir sobre o desempenho dessas turmas?
Tabela 3 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da
8a série/noite, na E. E. Nair Burégio, município de Carapeba, em abril de 2004.
Notas (médias)
Nº de alunos (fi)
3 ` 4
6
4 ` 5
12
5 ` 6
14
6 ` 7
8
7 ` 8
5
8 ` 9
4
9 ` 10
3
Total
52
Fonte: Dados fictícios.
Atenção!
A média, apesar de ser uma medida bastante utilizada para representar um conjunto de
dados, tem uma desvantagem: ela é afetada por valores extremos. O que isso significa?
Para calcular a média , é necessário somarmos todos os dados da série, ou seja, essa
medida leva em conta todas as observações. Por isso, quando temos uma situação em que
aparecem alguns valores, ou muito baixos, ou muito altos, se comparados com os demais
elementos da série (esses são os que chamamos de “extremos”), a média é influenciada
por eles.
6
Aula 08
Matemática e Realidade
2ª Edição
Atividade 3
Considere os conjuntos que se seguem: A={2,3,5,6} e B={2,3,5,26}. Calcule a
média para cada um deles e observe como o valor 26, no conjunto B, “puxou”
a média para cima.
Mediana (Md)
Mediana (Md) é definida como o valor que ocupa a posição central em um conjunto
de dados ordenados. Conseqüentemente, ela tem a propriedade de dividir um conjunto de
observações em duas partes iguais quanto ao número de seus elementos: o número de dados
que são menores ou iguais à mediana é o mesmo que o número de dados que são maiores
ou iguais a ela. Dessa maneira, afirmamos que 50% das observações que compõem um
conjunto qualquer de dados estatísticos são menores ou iguais à observação correspondente
à sua mediana, e, conseqüentemente os 50% restantes, são observações maiores ou iguais
a essa medida. Ao contrário da média, a mediana não é influenciada por valores extremos,
visto que ela é uma medida essencialmente vinculada à posição que ocupa no conjunto
ordenado. Assim, se algum valor for demasiado grande ou pequeno – valores extremos –,
estes não afetarão o cálculo da mediana, já que não alterarão a ordem. Por exemplo, sejam
os conjuntos A e B: A = { 1, 2, 1000 } e B = { 1, 2, 10 }. Em ambos, a mediana é 2, ou seja,
ao se trocar o 10 por 1000, ela não sofreu alteração. Por isso, quando trabalhamos com
observações que apresentam valores extremos, optamos por usar a mediana ao invés da
média, pois ela representará melhor dados que têm essa característica.
Para encontrar a mediana em um conjunto qualquer de dados estatísticos, precisamos
conhecer a posição que ela ocupa em relação aos n elementos ordenados desse conjunto.
Para tal, devemos considerar duas situações para as quais adotaremos distintos
procedimentos:
1o Caso – Quando os dados se apresentam isolados ou então
quando estão tabelados, porém não agrupados em
intervalos de classes.
Em tais circunstâncias, estamos diante de dados discretos, ou pelo menos, tratados
como tal, e, para encontrar a mediana, precisamos primeiramente construir o rol. Em
seguida, devemos calcular o elemento mediano ( ). O que é isso? É a posição que
a mediana ocupa no conjunto ordenado. Para obtê-la, é indispensável verificar se n (o
número de observações do conjunto de dados) é par ou ímpar, pois, dependendo dessa
informação, procederemos de maneira distinta.
2ª Edição
Aula 08 Matemática e Realidade
7
Veremos cada caso:
• se n for ímpar
Quando n é ímpar haverá apenas um valor central no conjunto ordenado, cuja posição
é calculada pela fórmula:
A mediana que representamos por Md será exatamente o valor que está nessa posição,
considerando-se os n valores ordenados.
Escrevemos assim:
(equação 03)
.
Desse modo, para encontrá-la, deveremos apenas localizar a observação que, na série
ordenada, ocupa essa posição. Não há, portanto, nenhum cálculo a mais a ser feito.
Essa expressão nos diz que a mediana é o valor x que se encontra na posição
Acompanhe agora os seguintes exemplos:
Exemplo 1 – Para dados isolados
Suponha que estivéssemos interessados em calcular a mediana em relação ao resultado
de um teste objetivo de conhecimentos gerais aplicado a um grupo de 7 alunos da 8a série/
noite da E. E. Nair Burégio, município de Carapeba, em abril de 2004, cujas pontuações
foram: 5, 8, 6, 3, 7, 5, 9. Começamos ordenando os valores. Eis o rol: 3, 5, 5, 6, 7, 8, 9.
Em seguida, calculamos a posição da mediana neste conjunto, ou seja, o elemento
mediano (EMd). Nesse caso, n=7 (há sete observações portanto n é ímpar); então teremos:
Atenção: esse número 4 não é a mediana, ele significa que a pontuação mediana desse
grupo de alunos será exatamente o 4o elemento no conjunto de dados ordenados, isto é:
1o, 2o, 3o, 4o
Concluímos então que nesse conjunto, a mediana será: . Observe, ainda, que
esse valor divide o conjunto, de modo que há tantos valores menores (ou iguais) quanto
maiores (ou iguais) do que ele.
8
Aula 08
Matemática e Realidade
2ª Edição
Exemplo 2 – Veremos agora como obter a mediana para dados tabelados, não
agrupados em intervalos de classe.
Vamos encontrar a idade mediana dos 75 alunos que a Tabela 4, logo a seguir, exibe.
Tabela 4 – Distribuição das idades de uma amostra de alunos do Ensino Fundamental II do turno
matutino da E. E. Nair Burégio, município de Carapeba, em abril de 2004.
Idades (Xi)
Nº de alunos (fi)
F#
10
5
5
do 1º até o 5º
11
15
20
do 6º até o 20º
12
20
40
do 20º até o 40º
13
14
54
14
18
72
15
3
75
Total
75
Fonte: Dados fictícios.
Temos um conjunto com as idades de 75 crianças (n = 75, logo, n é ímpar). OBS.:
A variável idade é contínua. Porém, ela está sendo tratada como discreta, supondo-se
que houve muitas repetições nos valores relacionados. O procedimento para calcular o
elemento mediano (a posição da mediana) é o mesmo utilizado no exemplo 1. No entanto,
como os dados estão tabelados, localizamos a mediana por meio das freqüências
acumuladas (3a coluna dessa tabela), uma vez que, ao acumularmos as freqüências,
estamos ordenando os dados.
Para n = 75 (n ímpar), o elemento mediano é:
Esse resultado significa que, nessa série, a idade que ocupa a 38a posição é a mediana.
Como localizamos o 38o valor? Analise a coluna das freqüências acumuladas “abaixo de”
. Você observará que a menor idade “10 anos" se repetiu 5 vezes, logo, o valor 10
ocupou da 1a até a 5a posição nessa série ; além disso, 11 anos se repetiu 15
vezes, dado que se encontra do 6o ao 20o lugar ; o número de alunos com
12 anos foi 20 e sua freqüência acumulada foi , significando que essa idade
aparece desde a 21a até a 40a colocação. Portanto, a mediana, o valor que se encontra na
38a posição é 12 anos. Escrevemos anos.
Atenção!
O elemento mediano, EMd , nos informa apenas sobre a posição da mediana na
série ordenada. Ele não é o valor dessa medida. Assim, somente após calculá-lo,
podemos localizar tal posição no conjunto de dados ordenados.
2ª Edição
Aula 08 Matemática e Realidade
9
„
se n for par
Nesse caso, haverá dois valores centrais, os quais se encontram nas posições:
e
A mediana em tais situações é definida como a média aritmética desses dois valores
centrais. Portanto, quando n é par, devemos calcular essas duas posições e depois encontrar,
na série ordenada, os dados a elas correspondentes, isto é,
e ;
com esses dois valores, calculamos a média e obtemos a mediana:
(equação 4)
ATENÇÃO! O cálculo dessa medida é feito tomando-se as duas observações centrais da série
ordenada de dados. Não se confunda: você não deve calculá-la com os valores obtidos
pelas expressões e , pois os resultados fornecidos por essas fórmulas representam
apenas as posições centrais e não os valores que buscamos.
Para um melhor entendimento, acompanhe os exemplos a seguir:
Exemplo 3
Suponha a mesma situação do exemplo 1, acrescentando mais um dado: 5, 8, 6, 3, 7,
5, 9, 10. Portanto, agora temos um número par de observações (n = 8), logo, teremos dois
elementos centrais nesse conjunto.
Como antes, primeiro ordenamos os dados:
3, 5, 5, 6, 7, 8, 9, 10
Depois, calculamos as duas posições centrais. Teremos então:
e
Para tanto, precisamos localizar o 4o e o 5o elemento. Nesse conjunto ordenado, a
posição 4 corresponde ao valor 6 e em relação ao 5o elemento encontramos o valor 7.
Conhecendo esses dois valores centrais, finalmente, calculamos a pontuação mediana:
10
Aula 08
Matemática e Realidade
pontos.
2ª Edição
Exemplo 4
Consideraremos novamente a pontuação no teste objetivo de Matemática na amostra
das turmas da manhã, exibida na Tabela 5 a seguir:
Tabela 5 - Pontuação no teste objetivo de Matemática, na amostra das turmas da 8a série/manhã, na
E. E. Nair Burégio, município de Carapeba, em abril de 2004.
Idades (Xi)
Nº de alunos (fi)
F#
4
2
2
5
8
10
6
10
20
7
15
35
8
12
47
9
7
54
Total
54
Fonte: Dados fictícios.
Sendo n par , precisaremos calcular as duas posições centrais. Em seguida,
identificaremos quais valores correspondem a elas. Isso é feito a partir das freqüências
acumuladas (3a coluna).
Essas posições são:
27a e
28a .
Com essas informações, examinamos na tabela, as freqüências acumuladas para
localizar essas posições (faremos isso de maneira análoga ao que fizemos no exemplo 2).
A Tabela 5 nos informa que 4 (o menor valor observado) se repetiu 2 vezes, assim, ele
está associado aos dois primeiros lugares: 1o e 2o . Em seguida, aparece 5, que ocorreu
8 vezes e, portanto, ficou da 3a até a 10a posição (a freqüência acumulada desse dado,
, quer dizer “até o 10o lugar”). Prosseguindo, temos o 6 que apareceu 10 vezes,
ficando da 11a a 20a posição. Veja que . Depois, observamos que o 7 teve
freqüência 15 e ocupou todas as posições desde a 21a até a 35a . Isto é: 21a ,
22a , 23a . . . 35a . Portanto, nessa série, a pontuação 7 é tanto o 27o , como o 28o elemento.
Assim,
2ª Edição
pontos.
Aula 08 Matemática e Realidade
11
2º Caso – Dados tabelados agrupados em intervalos de classes.
Para este caso, não importa se n é par ou ímpar, pois estamos considerando a variável
estudada como sendo contínua. Nessa condição, a distribuição terá um único valor central
).
que será a mediana, cuja posição é dada por (lembre-se de que Após calcular esse elemento mediano ( ), podemos, então, localizar na tabela,
através das freqüências acumuladas , a classe na qual se encontra a referida
medida de tendência central. Esse procedimento é fundamental para o cálculo da
mediana, pois é exatamente essa classe (intervalo) que devemos ter como referência para
obter as informações numéricas necessárias, usadas na fórmula da mediana, que tem a
seguinte expressão:
equação 5
O que significam essas notações? Preste bem atenção:
é o limite inferior dessa classe;
é a freqüência acumulada anterior a esse intervalo;
é a freqüência simples dessa classe;
é a amplitude desse intervalo.
Conhecendo todos esses valores e ainda sabendo quanto vale o , já calculado,
podemos finalmente encontrar a mediana.
A seguir, com o exemplo 5, mostraremos o que acabamos de expor e calcularemos a
mediana, para esses casos.
12
Aula 08
Matemática e Realidade
2ª Edição
Exemplo 5
Considere os dados da Tabela 6, apresentada a seguir.
Tabela 6 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8a série/
manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004.
Classe Mediana
Idades (Xi)
Nº de alunos (fi)
F#
3 ` 4
2
2
4 ` 5
3
5
5 ` 6
7
12
6 ` 7
8
20
7 ` 8
14
8 ` 9
12
46
9 ` 10
8
54
Total
54
FMd
Fant
34
Fonte: Dados fictícios.
Para determinar a nota mediana desses alunos, devemos inicialmente, de modo
análogo ao que fizemos antes, encontrar a posição dessa medida, isto é, calcular o .
Teremos que , independentemente de n ser par ou ímpar. Portanto, encontramos:
. (Não esqueça, n é o tamanho da amostra, logo )
Como os dados estão distribuídos por intervalos, esse resultado nos informa que a
mediana é o valor que, nessa distribuição, está situado no 27o lugar. Com essa
indispensável informação, procuramos localizar a classe em que está a mediana (a que
contém a mediana) por intermédio das freqüências acumuladas . Analisando a terceira
coluna dessa tabela, descobrimos que a mediana está no intervalo . Como chegamos
a essa conclusão? Porque, de acordo com as freqüências acumuladas, há 20 alunos com
notas abaixo de 7, ou seja, o vigésimo valor está no intervalo e depois vêm os 14
elementos da classe que ocupam, portanto, as posições seguintes; isto é, desde a 21a
até a 34a posição. Logo, a 27a (que é a da mediana) faz parte do intervalo de .
Agora que já sabemos desse fato (o intervalo onde está a mediana), voltamos à Tabela
6 e, em relação a esse intervalo, encontramos os valores:
, limite inferior da classe (onde está a mediana);
, freqüência acumulada da classe (essa é a classe anterior à que contém a
mediana);
, freqüência simples do intervalo ;
, tamanho do intervalo de classe.
Substituindo todos esses valores, e também aquele referente ao , na fórmula ,
teremos que a nota mediana em Matemática na amostra das turmas da manhã é
2ª Edição
Aula 08 Matemática e Realidade
13
Concluímos, portanto, que metade da turma (50%) obteve uma média igual ou inferior
a 7,5 e o restante (os outros 50%) apresentou nota igual ou superior a 7,5 pontos.
Atividade 4
Calcule a nota mediana para a amostra da turma da noite (Tabela 3) e compare
o resultado com a turma da manhã.
Moda (Mo)
Por definição, a moda de um conjunto de dados é o valor que aparece mais vezes, ou
seja, é aquele que apresenta a maior freqüência observada. Há situações nas quais ela não
é única, pois pode acontecer de se ter, em uma série estatística, duas ou mais observações
que tenham se destacado de forma idêntica, isto é, que tenham ocorrido com a mesma
freqüência máxima. Então, conforme o caso, teremos distribuições bimodais (duas modas),
trimodais ou multimodais. Também é possível acontecer que todos os elementos tenham
apresentado exatamente o mesmo número de ocorrências. Isso significa que não há moda,
pois nenhum dado se destacou; o conjunto é, então, chamado amodal.
Dentre as três medidas de tendência central, a moda é a única que pode ser usada
quando as variáveis são qualitativas nominais (vimos isto na aula 2, lembra?). Por exemplo,
se distribuíssemos os alunos da amostra da turma da manhã (do exemplo que estamos
trabalhando) por sexo e obtivéssemos que 70% são meninas, poderíamos dizer que a moda
é o sexo feminino, pois essa categoria apresentou a maior freqüência.
Da mesma forma que a mediana e a média, para se obter a moda, devemos considerar
dois casos que a seguir especificamos.
1o Caso – Dados isolados não tabelados ou tabelados, porém
não agrupados em intervalos de classes.
Nesses casos, a moda é obtida apenas por uma simples inspeção em relação às
repetições dos valores. No caso das tabelas, observaremos as freqüências absolutas
simples ( ). Procuramos, então, qual(is) o(s) valor(es) que apresenta(m) o maior número
de ocorrências (repetições). Este(s) valor(es) é (são) denominado(s) moda.
14
Aula 08
Matemática e Realidade
2ª Edição
Exemplo 7
Vamos considerar os seguintes conjuntos e verificar se em cada um existe moda,
especificando o seu valor:
A = {2, 2, 2, 3, 3, 4, 5, 5, 6, 6, 7, 7, 7, 7, 7, 8, 8, 9, 9, 9}
B = {1, 3, 4, 5, 7, 8}
C = {2, 2, 2, 2, 4, 4, 5, 5, 5, 5, 7, 8, 8, 9, 9}
D = {2, 2, 4, 4, 5, 5, 6, 6, 7, 7}
Observe que em A, o dado que mais se repetiu foi 7 (ele apareceu mais vezes). Assim,
7 é a moda. Escrevemos .
Em B e em D, nenhum valor se destacou, pois em cada um deles seus respectivos elementos
se apresentaram com a mesma freqüência (em B, todos têm apenas uma ocorrência e em D,
todos se repetem duas vezes). Logo, B e D não têm moda; são chamados de amodais.
Em C, há dois valores que apareceram com a (mesma) maior freqüência: o 2 e o 5
(cada um deles se repetiu 4 vezes). Portanto, o conjunto é bimodal com modas: e
Exemplo 8
Retornaremos agora à Tabela 5, apresentada nesta aula. Qual a pontuação
modal dos alunos?
Para responder a essa pergunta, basta apenas você examinar a coluna das freqüências
absolutas simples, e verificar qual foi a maior delas. Observe que a freqüência máxima
observada ( ) foi 15. Esse valor (15) não é a moda, ele apenas indica que a moda é igual
a 7,0 ( ). Isso quer dizer que a nota 7,0 foi a que mais ocorreu no conjunto de
dados, ou seja, foi a mais repetida entre as notas obtidas pelos alunos no teste objetivo de
Matemática.
2º Caso – Dados tabelados agrupados em intervalos de classes
Nesse caso, tem sentido falar em
Classe Modal – É aquela que apresenta a maior freqüência em uma distribuição.
Moda Bruta ( ) – É definida como o ponto médio da classe modal. Essa é
a maneira mais simples para se encontrar a moda e, em geral, nos dá um valor
aproximado dela.
Moda calculada pelo método de Czuber – Esse método considera, além da freqüência
simples da classe modal ( ), as freqüências dos intervalos adjacentes ao modal
(anterior e posterior). A fórmula proposta por Czuber para obter a moda é:
2ª Edição
Aula 08 Matemática e Realidade
15
(equação 6)
O símbolo é a letra grega chamada delta. Temos aí (lemos: “delta um”) e (“delta dois”). Vamos ver o que eles significam, nessa equação?
Tomando-se o intervalo que contém a moda, como referência, temos:
é o limite inferior dessa classe;
é a diferença entre a freqüência simples desse intervalo e a freqüência simples do
intervalo anterior à da classe modal . Isto é: ;
é a diferença entre a freqüência simples da classe modal e a freqüência simples do
intervalo posterior à da classe modal . Ou seja: ;
é o tamanho desse intervalo.
Vamos encontrar a moda pelos dois métodos, bruta e Czuber, a partir dos dados da
Tabela 6. Ela exibe as notas de Matemática da amostra da 8a série/manhã. Para ambos os
métodos, o primeiro passo é identificar a classe modal. Não esqueça que a classe modal
é aquela na qual está registrada a maior freqüência simples. Faça agora uma inspeção na
coluna dessas freqüências e verifique qual é a máxima. Confira: o resultado foi 14, você
concorda? Concluímos que a classe modal é , pois esse intervalo apresenta essa
maior ocorrência. Tomando-o como referência, temos todos os elementos necessários
para obtermos a moda pelos dois processos, ou seja,
Moda Bruta (o método mais simples) é o ponto médio da classe .
Temos que: (limite inferior) e (limite superior). Logo, o ponto médio
desse intervalo será:
.
Conseqüentemente, a pontos;
Moda por Czuber (o mais elaborado)
Sabendo que é o intervalo modal (de referência), então, o anterior é e o
posterior é . Consultando a tabela, temos as freqüências de cada uma dessas classes,
as quais são:
.
16
Aula 08
Matemática e Realidade
2ª Edição
Daí,
é o limite inferior da classe ;
é o tamanho do intervalo.
Aplicando-se a fórmula, temos que a moda nessa amostra é:
Teoricamente, a interpretação que damos é que 7,75 foi a nota que mais se repetiu
nessa amostra.
Atividade 5
Calcule a nota modal para a amostra da turma da noite (Tabela 3) e compare o
resultado com a da manhã. O que você pode concluir sobre o desempenho dos
alunos, a partir desses dois resultados?
Qual medida de tendência central devemos usar?
Acabamos de explicar três medidas estatísticas conhecidas como Medidas de Tendência
Central ou Medidas de Posição. Elas têm a finalidade, como já comentamos no início desta
aula, de sintetizar as informações de um conjunto de dados resumindo-as em um único
valor. Uma vez que o objetivo das três é semelhante, talvez você agora esteja se perguntando:
quando devo usar a média? E a moda? E a mediana?
Se estamos diante de uma situação na qual essas três medidas apresentam o mesmo
valor, tal fato nos informa que a distribuição dos dados é simétrica; quando resultam em valores
diferentes, porém muito próximos, indica que a forma dessa distribuição é aproximadamente
simétrica. Nesses casos, optaremos por qualquer uma das três: média, moda ou mediana.
Nos demais casos, devemos analisar as especificidades da situação estudada e escolher
entre elas a mais adequada. A seguir, apresentamos um quadro de resumo que irá ajudá-lo a
optar por uma das três, embora nada o impeça de calcular todas elas.
2ª Edição
Aula 08 Matemática e Realidade
17
Média
Mediana
Moda
• Quando a distribuição dos
• Quando há valores
• Quando trabalhamos
dados é aproximadamente
discrepantes no
com variáveis qualitativas
simétrica e não apresenta
conjunto de dados,
nominais, a moda é a única
valores extremos, devemos
devemos preferir a
medida de tendência central
escolher a média, pois essa
mediana, pois ela é
que podemos obter. Além
medida possui propriedades
uma medida que não
disso, quando queremos
matemáticas mais fortes e é
é afetada por valores
evidenciar o valor que mais
muito usada para estimar a
extremos.Podendo
apareceu (se repetiu) em um
média da população quando se
assim representar
conjunto de dados, também
faz inferências. Além disso, é
bem esses valores.
usamos a Moda.
fácil de ser calculada e a mais
popular dentre essas medidas
Resumo
Nesta aula, conhecemos as medidas de tendência central: média aritmética,
mediana e moda. Vimos que elas servem para resumir informações sobre
um conjunto de dados ajudando-nos a descrevê-los. Estudamos seu cálculo,
considerando valores isolados e também quando estão organizados em tabelas
de freqüências (agrupados ou não). Além disso, enfatizamos a interpretação de
tais medidas, explicando, inclusive, as peculiaridades de cada uma e orientando a
escolha adequada, de acordo com as especificidades da situação pesquisada.
Auto-avaliação
18
Aula 08
1
Pergunte a vinte pessoas entre seus familiares e/ou vizinhos, a idade de cada um e
forme uma amostra (de tamanho n = 20). Organize esses dados em uma tabela e
calcule a idade média, a mediana e a idade modal dessa amostra.
2
Procure saber a temperatura mensal do seu município durante todos os meses do
ano de 2004. Com esses 12 dados, determine as temperaturas média, mediana e
modal do referido ano.
Matemática e Realidade
2ª Edição
3
Responda, justificando com seus argumentos, às questões seguintes:
a)
quando você não deve escolher a média para representar seu conjunto de
observações estatísticas?
b) toda distribuição tem moda e mediana?
c) quando seus dados forem qualitativos nominais, podemos usar como medida
de tendência central:
„
a média?
„
a mediana?
„
a moda?
d) em que situação acontece de se ter a média, a moda e a mediana iguais? Dê
um exemplo.
Referências
BARBETTA, P. A. Estatística aplicada às ciências sociais. Florianópolis: Ed. da UFSC, 2002.
BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 4.ed. São Paulo: Atual, 1987. (Métodos
quantitativos).
LARSON, R.; FARBER, B. Estatística aplicada. Tradução de Cyro de C. Patarra. São Paulo:
Prentice Hall, 2004.
TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2.ed. São Paulo: Atlas, 1986.
TRIOLA, M. F. Introdução à estatística. Tradução Alfredo Alves de Farias. 7.ed. Rio de
Janeiro: LTC, 1999.
VIEIRA, S. Introdução à bioestatística. 3.ed. Rio de Janeiro: Campus, 1980.
2ª Edição
Aula 08 Matemática e Realidade
19