Exercícios Resolvidos - jesuegraciliano

Transcrição

Exercícios Resolvidos - jesuegraciliano
Agradeço à minha família pelo apoio incondicional. Aos estudantes do IFSC, em
especial do Curso de Engenharia em Telecomunicações pelas sugestões: Ernani, Jean, Tiago
Teixeira, Lucas, Matuzalem, Roicenir, Thiago Bonotto, Thiago Werner, Flávia, Tamara,
Letícia, Leonan, Gustavo, Elton, Marcus, Danilo pelo apoio e incentivo. Ao prof. Armando
Albertazzi (UFSC), prof. Elisa Flemming Luz e Marcos Moecke pelo apoio na organização
desse trabalho.
Dúvidas e sugestões serão bem vindas: [email protected]
Apresentação
Prezados estudantes, este texto tem por objetivo facilitar o aprendizado da disciplina
de Estatística e Probabilidades.
Basta uma pesquisa nos sites de busca para perceber que há centenas de livros e
apostilas sobre o assunto. Por isso não temos por objetivo apresentar mais um livro-texto
convencional. Optamos por apresentar um resumo de cada assunto mostrando na sequência
diversos exercícios resolvidos.
A Estatística é uma disciplina universal, aprendida na maioria dos cursos superiores
em todas as grandes universidades. Há diversas motivações para seu estudo: possibilita uma
compreensão mais precisa do mundo e por isso é uma ferramenta poderosa para engenheiros,
pesquisadores, cientistas, gestores públicos e executivos; possibilita o desenvolvimento de
uma capacidade crítica para leitura das informações divulgadas na imprensa e nas revistas
científicas; possibilita a construção de gráficos e de correlações matemáticas entre outras.
Há diferença entre o método estatístico (ou estatística), e estatísticas. A palavra estatística
se origina de “status”, ou estado, em Latim. O primeiro uso da palavra está ligado aos
interesses de governantes em busca de otimização dos meios de coleta de impostos. Mas
apenas no início do século XX que o verdadeiro método estatístico nasce na Inglaterra, a
partir dos trabalhos de K. Pearson e A. Fisher, sobre problemas agronômicos. Essa verdadeira
revolução no modo de pensar afetou todas as áreas do conhecimento.
O profissional que domina os princípios estatísticos tem uma poderosa ferramenta que
poderá ser utilizada ao longo de sua carreira.
As aplicações são diversas. Na engenharia destacamos a aplicação no controle
estatístico de processos, que utilizam modernas técnicas de amostragem. A partir de amostras
selecionadas aleatoriamente é possível fazer inferência a todo um lote de produção e melhorar
os procedimentos e controle da qualidade.
Didaticamente dividimos o assunto em cinco partes: estatística descritiva,
probabilidade básica, distribuições de probabilidades, inferência estatística e técnicas de
amostragem.
Apresentamos a solução de quase uma centena de exercícios resolvidos e
selecionamos diversos vídeos didáticos, que foram disponibilizados no blog:
http://segredosdaestatistica.wordpress.com. Cada questão resolvida nesse texto está relacionada
com
dezenas
de
vídeos
disponibilizados
no
Portal
Educreations:
http://www.educreations.com/profile/18702675/.
Com essa metodologia, esperamos contribuir com o desenvolvimento dos estudantes
dessa área. Caso você tenha alguma dúvida ou queira enviar sugestões para a melhoria desse
texto entre em contato pelo email: [email protected].
Atenciosamente,
Prof. Jesué Graciliano da Silva
PARTE I
RESUMO DE
ESTATÍSTICA E
PROBABILIDADES
1- Introdução
Encontramos na literatura diversas definições para ESTATÍSTICA. Podemos
simplificar dizendo que “estatística é o estudo da coleta, organização, análise,
interpretação e apresentação de dados”. Dados são valores coletados da variável em
estudo. Na Figura 1.1 mostramos como o estudo da estatística é normalmente realizado.
Figura 1.1 – Organização do estudo da estatística.
A definição pode parecer complexa, mas a humanidade já aplicava os rudimentos da
estatística desde a antigüidade. Vários povos já registravam o número de habitantes, de
nascimentos, de óbitos; faziam estimativas das riquezas individuais e social; distribuíam terras
ao povo; cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje,
chamamos de “Estatística.
Na época do imperador Otávio Augusto, que governou Roma por 41 anos, já se fazia
gestão pública e se tomava decisões por meio de indicadores. Roma chegou a abrigar 1
milhão de pessoas no início da era Cristã. E a diversão com jogos de azar também vem de
longa data.
A estatística se consolidou como ciência a partir do século XVII com Bernoulli, Pascal
(Figura 1.2), Gauss, Galton, Gosset entre outros grandes nomes. Veja no site mais
informações: http://segredosdaestatistica.wordpress.com/grandes-nomes/
Figura 1.2– Ilustração do matemático Blaise Pascal
Todos os dias tomamos diversas decisões. E fazemos isso sem perceber, na maioria
das vezes de forma intuitiva. Mas podemos se desejamos intervir na realidade de forma não
acidental, precisamos conhecê-la. Se não podemos avaliar um fenômeno com precisão não
podemos tomar as decisões mais acertadas.
Para ilustrar a importância da estatística na engenharia vamos imaginar um exemplo
simples. Vamos construir a estrutura de 200 torres de telecomunicações. Cada uma delas é
composta por 50 barras de perfil em “I”. Qual deve ser a tensão de projeto nesse caso se
sabemos que nem todas as barras da treliça têm a mesma resistência? Um procedimento
normalmente realizado é a medição da resistência de 5 peças escolhidas aleatoriamente. Os
resultados obtidos poderiam ser descritos como segue para a tensão máxima admissível:
2050N, 2020N, 1920N, 2220N e 1800N. Nesse caso, a amostra é adequada? Qual deveria ser
a amostra mínima para se fazer uma afirmação da resistência à tração com intervalo de
confiança de 95%?
Como exemplo na área da educação sabemos que temos dificuldades em combater a
evasão. Se você fosse nomeado(a) secretário(a) da educação do seu município o que faria
inicialmente? Sabemos que a resposta depende do estilo de cada gestor. Mas é possível que o
primeiro passo a ser feito seja um bom diagnóstico da situação presente (avaliação
diagnóstica). Temos que conhecer quais são os índices de evasão de cada escola do
município. Temos que conhecer o IDEB? O que as escolas com melhores IDEBs fazem de
diferente? Os resultados do diagnóstico podem ser apresentados na forma gráfica e também
podem ser utilizados para construção de correlações estatísticas. Por exemplo, será que é
possível relacionar o IDEB da escola com o índice de qualificação dos professores? Será que
a correlação está relacionado ao salário dos docentes? Será que está relacionado com o grau
de escolaridade dos pais? As correlações são importantes para a tomada de decisões. Na
Figura 1.3 mostramos uma correlação entre consumo de energia per capita e IDH.
Figura 1.3 – Correlação entre consumo de energia per capita em TEP/ano versus IDH
http://www.proceedings.scielo.br/scielo.php?pid=MSC0000000022002000200048&script=sci
_arttext
Existe relação entre democracia e desenvolvimento? E entre educação e riqueza das
nações? Quantos bilhões de pessoas seremos em 2040? A seguridade social brasileira será
capaz de garantir aposentadorias dignas dentro de 20 anos? Uma nova vacina é capaz de
conter uma epidemia? O nível de consumo das classes D e E terá crescimento na próxima
década? A realidade é complexa e exige aplicação de técnicas da estatística para intervenção.
O “BIG DATA” já é uma realidade concreta para compreensão do mundo (Figura 1.4).
Figura 1.4- Infográfico explicativo sobre BIG DATA
http://www.ibm.com/midmarket/br/pt/infografico_bigdata.html
Você já viu o filme: “O homem que virou o jogo” - Moneyball” ou já ouviu falar de
Nate Silver? Nate Silver escreveu um livro chamado: “O sinal e o ruído – por que tantas
previsões falham e outras não?” Ele trabalha no New York Times e fez previsões corretas
para os resultados das eleições presidenciais nos 50 estados norte-americanos nas duas
últimas eleições presidenciais. Há diversos livros que tratam do uso prático da estatística tais
como: “Os números governam suas vidas”, “O poder do hábito”, “O andar do bêbado” entre
outros.
Figura 1.5 – Imagem da capa do livro de Nate Silver e imagem do filme Moneyball.
Para mais informações, consulte o site: http://segredosdaestatistica.wordpress.com
2- Estatística Descritiva
A estatística descritiva utiliza um conjunto de técnicas tais como: medidas de posição
e dispersão, tabelas e gráficos para resumir as características dos dados coletados.
Para simplificar o que chamamos de estatística descritiva vamos fazer a análise da
estatura dos estudantes de uma turma. A altura dos 40 alunos foi medida e os resultados são
apresentados na forma de uma tabela de freqüência e de um histograma, conforme
visualizamos na Figura 2.1.
Figura 2.1- Histograma das alturas dos alunos de uma turma.
Na Figura observamos que existem intervalos da variável altura. Na tabela de dados
bruta deve se avaliar qual o valor menor (limite inferior) e o valor maior (limite superior). A
diferença chama-se amplitude da classe. Com esse valor e com o número de dados podemos
estabelecer o número de classes. No exemplo acima são 6 intervalos de classe. O número de
classes deve ser fixado de forma que as classes consigam representar adequadamente a
amostra de dados em estudo. O número (k) pode ser calculado da seguinte forma (deve-se
arredondar o valor final):
k= 1+3,322 xlog(40)= 6,3
Considere ainda o exemplo: Um borracheiro anotou a vida útil dos pneus dos carros de
seus clientes. Os dados são descritos e organizados por meio do diagrama de ramos e folhas,
da tabela de freqüências e do histograma.
Figura 2.2- Histograma das alturas dos alunos de uma turma.
Analisando-se a tabela 2.1 a seguir não é tão fácil tirar conclusões sobre como se
comportam as viscosidades para as três misturas analisadas. Por isso é muito comum o uso de
diagramas de caixa, também chamados de box plot. Nesses diagramas os dados são divididos
em duas partes (50% para cada lado), tendo o valor central chamado de mediana. Cada parte
também é dividida em 2 (25% = quartil).
Tabela 2.1- Medidas de viscosidade:
Figura 2.3- Representação das viscosidades em diagramas de caixa.
Figura 2.4- Representação de um diagrama de caixa.
A seguir temos um exemplo de correlação estatística relacionando tempo de estudo de
matemática com notas obtidas na estatística.
Figura 2.5- Representação de uma correlação linear.
Da mesma forma podemos observar como se relacionam a potência do motor (HP) e o
tempo para se acelerar um carro. O que podemos inferir a partir do gráfico?
Figura 2.6- Representação de uma correlação negativa.
Você poderia afirmar que há correlação estatística entre o peso (N) e a estatura dos
estudantes de sua turma? E entre horas de estudo e resultados nas provas? Ou entre
temperatura no verão e venda de cervejas? Ou entre tempo de exposição de uma marca e
resultado nas vendas? Ou entre anos de escolaridade e salários? A partir dessas reflexões
podemos compreender a importância de correlacionarmos variáveis como forma de entender
os fenômenos que nos rodeiam. Na Figura a seguir apresentamos os quatro tipos mais
comuns de diagramas de dispersão. Observamos que a correlação é mais forte quando o valor
de “r” é mais próximo da unidade.
Figura 2.7- Diagramas de dispersão mais comuns.
Conforme pode ser observado é fundamental o uso de gráficos para facilitar a
compreensão de análises estatísticas. O gráfico é uma forma de apresentação dos dados
estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma
impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à
compreensão que as séries. Em estatística são usados vários tipos de gráficos tais como
gráfico de linha, de barras, de setores, cartograma, polar, pictograma, ramo e folhas, de
pontos, de Pareto, de dispersão, de caixa, histograma, polígono de freqüência, ogiva de
Galton. Existem algumas definições básicas na Estatística descritiva, que mostraremos a
seguir:
Média Aritmética é a mais usada dentre todas as médias, face à sua aplicabilidade a
situações práticas. Podemos calcular a média aritmética de várias maneiras, dependendo
apenas da forma em que os dados se encontram:
n
∑ xi
i=1
x=
n
Quando os dados estão agrupados em intervalos de classe, convenciona-se que
todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto
médio, e determina-se a média aritmética ponderada pela fórmula:
n
xi
x=
fi
i=1
n
fi
i=1
onde: xi é o ponto médio de cada classe i.
Moda – é o valor da amostra que mais aparece (de maior freqüência). Uma amostra pode ser:
amodal, unimodal, bimodal, trimodal ou multimodal. Da mesma forma que a média, podemos
calcular a moda de várias maneiras, dependendo apenas da forma em que os dados se
encontram:
Mediana – A mediana de uma amostra é aquele valor que ocupa a posição central do rol, isto
é, a mediana é o valor que divide a amostra em duas partes iguais. A mediana pode não
pertencer a amostra.
Quartis (Qi) – são os valores da série que dividem a amostra em quatro partes iguais.
Variância - baseia-se nos desvios em torno da média aritmética, porém determinando a
média aritmética dos quadrados dos desvios. Para uma população fazemos:
Quando o interesse não se restringe à descrição dos dados partindo da população, mas
da amostra, visando tirar inferências válidas para a respectiva população, usaremos:
Quando as informações são apresentadas por meio de tabela de frequências fazemos o
cálculo do desvio padrão e da média conforme ilustramos a seguir:
Faixa de alturas dos estudantes
Quantidade de alunos
em cada faixa de altura
160-165
4
165-170
8
170-175
20
175-180
8
180-185
4
A quantidade de alunos na turma é N = 44.
Para calcularmos a média de alturas da turma e o desvio padrão fazemos inicialmente o
cálculo do ponto médio de cada faixa de altura. Na primeira faixa fazemos: (160 + 165) /2.
A média é calculada pela equação:
Os cálculos da variância e do desvio padrão são realizados da seguinte forma:
3- Princípios da teoria de probabilidades
Diversos autores apontam que o cálculo das Probabilidades teve início na Idade
Média, com as primeiras tentativas de análise matemática das chances de se vencer nos jogos
de azar, muito difundidos na época. Os jogos também eram utilizados para se prever o futuro,
decidir conflitos e dividir heranças.
Devem-se aos algebristas italianos Pacioli, Cardano e Tartaglia (séc. XVI) as primeiras
considerações matemáticas acerca dos jogos e das apostas.
No entanto, a contribuição decisiva para o início da Teoria das Probabilidades foi dada
pela correspondência trocada entre os matemáticos franceses Blaise Pascal e seu amigo Pierre
de Fermat, em que ambos, por diferentes caminhos, chegam à solução correta do célebre
problema da divisão das apostas em 1654, quando jogo é interrompido antes do final. No
blog http://segredosdaestatistica.wordpress.com apresentamos links para todos os grandes
nomes da estatística.
Há alguns conceitos fundamentais na estatística que são: espaço amostral e eventos:
Ao conjunto de todos os resultados possíveis em um experimento aleatório chamamos de
Espaço Amostral, que indicaremos como “S”. Por exemplo, o espaço amostral dos naipes de
um baralho pode ser escrito como: S1 = {ouro, copas, paus, espadas }. O espaço amostral das
possíveis faces de um dado pode ser escrito como: S 2 = { 1, 2, 3, 4, 5, 6 }. Podemos ter
também espaços amostrais infinitos tais como a contagem de carros que passa em
determinada rodovia: S3 = { 0, 1, 2, 3, 4, ..., n }.
Um evento é qualquer conjunto de resultados de um experimento, que pertence ao
espaço amostral S. Ao lançarmos um dado temos o espaço amostral S '1= {1, 2, 3, 4, 5, 6} e
podemos desejar calcular a probabilidade de que saia uma face “par”. Nesse caso, podemos
chamar de evento A = sair um número par e escrever: A = { 2, 4, 6 }
Laplace definiu a Probabilidade de ocorrência de um evento “A” como sendo:
No exemplo acima, a probabilidade de sair um número par em um dado honesto
(equilibrado) é de 3/6, pois há três possibilidades de ocorrência de uma face par em um total
de 6.
Para análise de eventos probabilísticos é muito comum o uso de diagramas de Veen.
Figura 3.1- Diagrama de VEEN.
Há diversos teoremas e axiomas da probabilidade. As regras mais importantes são:
Regra Geral da Multiplicação:
P(A ∩ B) = P(A)*P(B\A) se P(A) ≠ 0
P(A ∩ B) = P(B)*P(A\B) se P(B) ≠ 0
Se A e B são independentes então: P(A/B)=P(A) e por consequência se A for
independente de B, B será independente de A. Nesse caso: P(A ∩ B) = P(A)*P(B)
Se jogarmos dois dados ao mesmo tempo, a probabilidade de sair um número par no
primeiro dado seguido de um número menor que 3 no segundo dado é calculado como sendo
P(A) x P(B) = 1/6. Nesse caso podemos dizer que os eventos A e B são independentes.
Se A e B são dois eventos quaisquer, que podem ser mutuamente excludentes ou não,
podemos escrever: P(A U B) = P(B) + P(B) – P (A ∩ B)
No caso de A e B serem eventos mutuamente exclusivos (também chamados de
excludentes ou disjuntos) então escrevemos: P(A U B) = P(B) + P(B)
Podemos definir ainda Probabilidade condicional como sendo: a probabilidade de
ocorrer um determinado evento, dado que se sabe que ocorreu um outro evento anteriormente.
Nesse caso podemos ler: probabilidade de sair o evento A, dado que aconteceu B, que é
calculado por:
Como exemplo, vamos supor que queremos saber a probabilidade de ocorrer
uma face 3 em um dado honesto se sabemos que ocorreu face ímpar. Nesse caso fazemos
P(A/B)=(1/6)/(3/6)=1/3.
Podemos ainda definir o teorema da probabilidade total (Teorema de Bayes), ilustrado na
figura:
4- Distribuição de probabilidades
A distribuição de pro
.
Quando lançamos duas vezes uma moeda podemos ter nenhuma coroa, uma coroa ou duas
coroas. Nesse caso trata-se de uma variável aleatória discreta (que assumem valores
0,1,2,3...n).
Se chamarmos de X = número de coroas temos então a seguinte distribuição de
probabilidades: X = 0 quando não sair nenhuma coroa, X = 1 quando sair apenas 1 coroa e
X=2 quando sair duas coroas.
Figura 4.1- Distribuição de probabilidade binomial.
Em Estatística há diversos tipos de distribuição de probabilidades tais como: de
Bernoulli ou binomial, normal, T Student, Poisson, uniforme entre outras.
Distribuição de Bernoulli
Considerando a variável aleatória X que representa o número de sucessos em “n”
provas de Bernoulli tem uma distribuição denominada Binomial dada por:
Distribuição de Poisson
. Exemplos: número de chamadas telefônicas por minuto, número
de mensagens que chegam a um servidor por segundo, número de acidentes por dia, número
de defeitos por m2.
Ao contrário de uma variável aleatória discreta, uma variável aleatória contínua pode
assumir qualquer valor fracionário dentro de um intervalo definido de valores. Por isso não
podemos enumerar todos os possíveis valores da variável com os valores de probabilidade
correspondentes. O que fazemos é construir uma FUNÇÃO DENSIDADE DE
PROBABILIDADE. O tempo de vida de um rolamento e a altura dos alunos de uma escola
são variáveis aleatórias contínuas.
A mais importante distribuição de probabilidade contínua é a NORMAL (também
conhecida como curva de Gauss). A curva que representa a distribuição normal de
probabilidade tem uma forma de sino. No livro: “As 17 equações que mudaram o mundo”
tem-se os detalhes históricos da importante descoberta da equação que consegue modelar com
precisão uma infinidade de fenômenos naturais que ocorrem seguindo uma distribuição
normal.
http://www.portalaction.com.br/content/62-distribui%C3%A7%C3%A3o-normal
Figura 4.2- Ilustração de uma curva NORMAL.
Observamos que os valores da variável aleatória x mais próximos da média ocorrem com
maior frequência. Os valores simétricos da variável x em relação à média ocorrem com mesma
frequência. A área sobre a curva tem valor unitário 1. Do lado esquerdo da curva tem-se uma
probabilidade e ocorrência de 50%. Para facilitar os cálculos há tabelas para distribuição normal
padrão, que tem média = 0. Para se transformar uma curva normal real em uma curva normal padrão
faz-se:
Figura 4.3- Transformação em curva normal padronizada (tabelada).
Também podemos a recorrer a softwares e aplicativos tais como Wolfram, Mathlab e
“R” para realizarmos os cálculos necessários:
http://www.wolfram.com/mathematica/new-in-8/probability-and-statistics-solvers-andproperties/index.pt-br.html?footer=lang
http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase12.html#x14-8800012.1
/
Quando o número de observações ou tentativas for relativamente grande, a
distribuição de probabilidade normal pode ser utilizada para aproximações das probabilidades
binomiais. Nesse caso fazemos uma correção de continuidade somando-se ou se adicionando
0,5.
Uma distribuição comum é a distribuição uniforme, com os parâmetros a e b, que tem
a seguinte função densidade da probabilidade:
Figura 4.4- Distribuição de probabilidade uniforme.
5- Teorema Central do Limite e Inferência estatística
Uma das definições mais importantes na área de estatística é o Teorema Central do
Limite, porque permite que façamos inferência a uma população a partir de amostras
selecionadas aleatoriamente. Pelo Teorema, não importa qual é a distribuição de X, a
distribuição de sua média se aproxima da normal a medida que o número de elementos da
amostras cresce.
A inferência estatística tem por objetivo generalizar conclusões obtidas de uma
amostra para toda uma população. Um exemplo são as pesquisas eleitorais realizadas com
uma pequena amostra dos eleitores.
Figura 5.1- Ilustração de uma inferência estatística.
Dada uma população com desvio padrão σ, a forma geral do INTERVALO DE
CONFIANÇA para o valor médio de μ (com nível de confiança estipulado) será:
Quando não conhecemos o desvio padrão da população devemos calcular o desvio
padrão da amostra e utilizar a Tabela T de Student (Gosset) para obter o valor de “t” que será
utilizado na equação acima no lugar da variável “Z”. Para obtenção de “t” usamos o nível de
confiança desejado e o grau de liberdade GL = N – 1. A Tabela T de Student encontra-se no
anexo.
6- Testes de hipóteses
Para testarmos parâmetros de uma população, formulamos hipóteses a respeito de seus
parâmetros. Essas hipóteses são chamadas de Ho = hipótese nula e Ha = hipótese alternativa.
Devemos testar as hipóteses formuladas para decidir se aceitamos ou rejeitamos a hipótese
nula Ho. Quando se rejeita a hipótese nula, automaticamente estamos aceitando a hipótese
alternativa Ha.
O teste de hipótese se relaciona com o intervalo de confiança, pois qualquer hipótese
que estiver fora do intervalo de confiança pode ser considerada rejeitada. Por isso o intervalo
de confiança pode ser tomado como um conjunto de hipóteses não rejeitáveis.
Ao conjunto de valores que levam à rejeição da Hipótese nula damos o nome de
Região de rejeição do teste.
Ao realizarmos o teste de hipóteses há a possibilidade de que a decisão tomada seja
errada, conforme mostramos na tabela:
Há o ERRO TIPO I quando rejeitamos Ho, mas Ho é verdadeira e o ERRO TIPO II,
quando não se rejeita Ho, embora Ho seja falsa.
Se a variância é conhecida (σ2) e se X é uma variável aleatória normalmente
distribuída e com média podemos fazer o seguinte teste:
Considere que μ = µ0, calcula-se o valor de Zcalculado como sendo:
Obter valor de Ztabelado na Tabela normal padronizada usando Nível de confiança
(NC=1-α). Se hipótese alternativa for: Halternativa = μ < µ 0, então deve se rejeitar Ho se
Zcalculado < -Ztabelado. Já se hipótese alternativa for: Halternativa = μ > µ 0, então deve se
rejeitar Ho se Zcalculado > Ztabelado. No caso de Halternativa for: = μ ≠ µ 0 então deve se
rejeitar Ho se Zcalculado for menor que - Ztabelado para α/2 ou se Zcalculado for maior que
Ztabelado para α/2.
Se o valor da variância for desconhecido então no lugar de Z usar Estatística de Teste
T de Studant e substituir σ (desvio padrão da população) pelo desvio padrão da amostra (s).
Na Figura a seguir resumimos graficamente estes procedimentos.
Figura – Testes estatísticos para uma média – Fonte: Notas de aula prof. Armando Albertazzi.
Em diversas situações é conveniente o uso da distribuição QUI-QUADRADO para
comparar a discrepância entre as freqüências observadas e as freqüências esperadas. Um
exemplo de uso da distribuição QUI-QUADRADO é quando a variância não é conhecida,
mas pode se estivar o valor do desvio padrão da amostra. Nesse caso, se a população tiver
distribuição normal, o valor verdadeiro da variância estará dentro do intervalo de confiança
dado por:
Exemplo: Uma amostra de 12 resistores apresentou desvio padrão de 2ohms. Construir
o intervalo de confiança do desvio padrão para nível de confiança de 95%. Assumir que a
distribuição é normal.
Nesse caso, o grau de liberdade é N1=11. Na Tabela temos (QUI-QUADRADO) X2
para 0,025 e (QUI-QUADRADO) X2 para 0,975. Observamos que se queremos NC = 95%
temos 2,5% para cada lado da curva, da mesma forma que fazemos para a curva normal.
X2 (11 e α=0,975) = 21,92
X2 (11 e α=0,025) = 3,82
Calculando-se o intervalo de confiança temos:
Também podemos usar a distribuição QUI-QUADRADO para testar hipóteses
envolvendo uma variância. No exemplo a seguir mostramos como fazer o teste.
As variações em um determinado processo de fabricação de eixos para motores devem
ser tais que desvio padrão do diâmetro seja menor ou igual a 0,50. Uma amostra de tamanho
N = 15 foi analisada. O valor de (desvio padrão) s é de 0,64. Com nível de confiança de 95%
podemos dizer que a diferença é casual e que o desvio padrão do processo pode mesmo ser
0,50? A distribuição dos diâmetros é normal.
Considerar Ho: σ= 0,50 e Ha: σ > 0,50
Nível de confiança = 95%, ou seja α = 0,05
Devemos rejeitar Ho se (QUI-QUADRADO) X2 calculado for MAIOR que X2 tabelado (para
α = 0,05 e GL = n-1).
Para Grau de Liberdade = 15-1=14 e α = 0,05 temos: X2 tabelado = 23,7
Como 22,94 < 23,68 NÃO PODEMOS REJEITAR Ho. Não há evidências de que o
desvio padrão do processo seja maior que 0,50. O valor do desvio da amostra é casual com
nível de confiança de 95%.
Outra aplicação comum do Teste de QUI-QUADRADO é para analisar a existência de
aderência entre dados observados e medidos de uma amostra.
Como exemplo, suponha que uma indústria produza refrigerantes do tipo A, tipo B e
do tipo C. O objetivo do departamento de marketing é avaliar se a venda destes produtos está
relacionada ao gênero do consumidor para direcionar melhor a política de publicidade. Foram
selecionados aleatoriamente 150 consumidores para responder um questionário sobre a
preferência pelos refrigerantes do tipo A, B ou C. Os resultados são tabelados a seguir:
(Frequências observadas)
Gênero
Tipo A
Tipo B
Tipo C
Total
Mulheres
20
40
20
80
Homens
30
30
10
70
Total
50
70
30
150
Para solucionar essa questão fazemos o teste de hipóteses:
Ho = hipótese nula – a preferência não tem relação com o sexo do consumidor
Há = hipótese alternativa – a preferência depende do sexo.
O primeiro passo é calcular as freqüências esperadas em cada uma das 6 freqüências observadas:
(Frequências esperadas)
Tipo A
Tipo B
Tipo C
Total
Mulheres
26,67
37,33
16
80
Homens
23,33
32,67
14
70
50
70
30
150
O cálculo de X2 é realizado pela equação:
O grau de liberdade é calculado pela equação: (no de linhas -1).(no de colunas -1) = 2
Na tabela para QUI quadrado, com GL = 2 e nível de confiança de 95% temos: X 2crítico =
5,99.
Como X2crítico é menor que X2 (5,99 < 6,13) a hipótese nula deve ser rejeitada. Logo, com
95% de nível de confiança a hipótese alternativa é aceita e a preferência pelos refrigerantes do tipo A,
B e C depende sim do sexo do consumidor.
A seguir, apresentamos mais um exemplo. Vamos verificar se há dependência entre a
renda e o número de filhos em famílias de uma cidade. Suponha que, a partir de 250 famílias
escolhidas ao acaso, tenhamos a tabela:
Determinação do grau de liberdade = 2 x 3 = 6 . Na tabela, com nível de confiança de 95%
temos X2 tabelado = 12,6.
Como X2 calculado (crítico) é maior que X2 tabelado rejeitamos a Hipótese nula. Com 95% de
nível de confiança podemos afirmar que não existe independência entre a renda e o número de
filhos.
Na Figura a seguir ilustramos os procedimentos para se fazer teste de hipóteses
relativas a duas médias que são comparadas.
Figura - Testes de hipóteses de duas médias – Fonte: Notas de aula Prof. Armando Albertazzi
7- Técnicas de Amostragem
Uma amostra é uma parte representativa da população. Ou seja, a amostra deve possuir
as mesmas características básicas da população. Como exemplo, para se calcular a estatura
média das alunas de uma escola devemos inicialmente saber a quantidade de alunas por sala
de aula e fazer a seleção aleatória das alunas de forma proporcional. Prof. Barbeta (2012)
apresenta a fórmula para o cálculo do tamanho mínimo da amostra:
“N” o tamanho da população,
“n” o tamanho da amostra,
é uma primeira aproximação para o tamanho da amostra e “E0” o erro amostral tolerável.
As principais técnicas de amostragem são: aleatória simples, sistemática, estratificada,
estratificada proporcional, conglomerado (agrupamento), não aleatórias: por cotas, por
julgamento, etc. A seguir serão apresentadas quatro técnicas de amostragem:
a) Amostragem Casual ou Aleatória Simples – é equivalente a um sorteio aleatório. Nesse
tipo de amostragem é necessário que os elementos da população sejam numerados. Quando o
número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito
trabalhoso. Existem Tabelas de Números Aleatórios, construída de modo que os dez
algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas.
b) Amostragem Estratificada Proporcional – na maioria das vezes a população se divide
em sub-populações – estratos. Exemplo: uma turma de engenharia tem 66 alunos, onde 57
são meninos e 9 são meninas. Tem-se; portanto; dois estratos nesta população (sexo
masculino e feminino), logo para uma amostra de 10% da população tem-se 1 menina e 6
meninos.
c) Amostragem Sistemática – quando os elementos da amostra já se acham ordenados, não
há necessidade de construir o sistema de referência. Exemplos: linha de produção, prédio de
uma rua, prontuários de um hospital, etc. Nestes casos, a seleção dos elementos que
constituirão a amostra pode ser feita por um sistema feito pelo pesquisador. Assim, no caso de
uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a
uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em
10% da população. Exemplo: supondo que, uma fábrica possui em estoque 450 computadores
ordenados. O setor de controle de qualidade da fábrica deseja obter uma amostra formada por
25 unidades. Pode-se, neste caso, usar o seguinte procedimento: como 450/25 = 18, escolhese por sorteio casual um número de 1 a 18 (inclusive), o qual indica o primeiro elemento
sorteado para a amostra; os demais serão periodicamente considerados de 18 em 18. Assim, se
o número sorteado for o 4, toma-se, o 40 computador, o 220, o 400 etc., até completar a
amostra.
d) Amostragem por Agrupamento – Quando a população apresenta ocorrência natural de
subgrupos, cada um deles com características similares. Dividida a população em grupos,
chamados de agrupamentos e selecione todos os membros de um ou mais agrupamentos (mas
não todos). Exemplo – População de domicílios de uma cidade, os quarteirões formam os
agrupamentos de domicílios.
A finalidade da técnica de amostragem é fazer generalizações sobre um universo ou
uma população grande sem precisar examinar todos os componentes do grupo. Para
populações que possuem distribuição normal uma amostra de mais de 30 elementos é
suficiente para se fazer inferência da população. Podemos escolher inúmeras amostras para
cada população. Para cada uma delas haverá um intervalo de confiança da média obtida,
quando extrapolada para fazer inferência da média da população. O intervalo de confiança é
calculado por meio de uma relação entre a estatística “t” (quando desvio padrão é
desconhecido) ou pela estatística “z” (quando desvio padrão é conhecido) multiplicado pelo
desvio padrão (da amostra se usarmos “t” ou da população se usarmos “z”) dividido pela raiz
de “n”, onde n é o número de elementos da amostra.
Uma população consiste de todas as observações possíveis de um determinado
fenômeno. Um censo é o exame de todos os elementos de uma população ou universo. A
composição de uma amostra estatística é o que diferencia uma pesquisa de uma enquete.
Enquanto a enquete ouve pessoas que se auto-selecionam, arbitrariamente, a pesquisa é
realizada com uma amostra com representatividade estatística.
A construção do plano amostral começa na análise dos grandes levantamentos do
Instituto Brasileiro de Geografia e Estatística (IBGE): o Censo e a Pesquisa Nacional por
Amostra de Domicílios (Pnad). Normalmente, o processo de construção de uma amostra para
saber a preferência de candidato a presidente por exemplo envolve várias etapas: são
selecionadas quase todas as capitais do País. Em seguida, são realizados sorteios para a
seleção de municípios para conferirem representatividade ao interior dos estados. Depois
disso, são realizados novos sorteios, agora para a definição dos setores censitários em cada
município. Daí em diante os pesquisadores saem em busca de um número de pessoas que
possam representar proporcionalmente a população, com base em critérios de ramo de
atividade, nível de escolaridade, faixa etária e sexo. Com isso, chega-se a uma amostra que
possa ser considerada um retrato do universo que representa. Para saber mais, visite o site do
IBOPE:
http://www.ibope.com.br/pt-br/ibope/comofazemos/paginas/composicao-dasamostras.aspx e https://www.youtube.com/watch?v=e4W8zCSW6gQ.
Quando não se conhece o tamanho da população é utilizada a seguinte equação (com
nível de confiança de 95%):
REFERÊNCIAS BIBLIOGRÁFICAS
BARBETTA, Pedro Alberto. Estatística Aplicada às Ciências Sociais (5ª edição revisada). Ed
itora da UFSC. Florianópolis (SC), 2003.
MONTGOMERY, Douglas C.; RUNGER, George C. Estatística Aplicada e Probabilidade
para Engenheiros; 4ª ed. Rio de Janeiro:LTC, 2009. p. ISBN 9788521616643
SPIEGEL, Murray R Estatística; 3ª ed. São Paulo:Pearson, 1994. p. ISBN 9788534601207
LARSON, Ron; FARBER, Betsy Estatística aplicada; 2ª ed. São Paulo:Pearson Prentice
Hall, 2004. p. ISBN 9788587918598
CRESPO, Antonio A. Estatística Fácil; 19ª ed. São Paulo:Saraiva, 2009. 224p. ISBN
9788502081062
DOWNING, Douglas; CLARK, Jeffrey Estatística Aplicada (Série Essencial).; 3ª ed. São
Paulo:Saraiva, 2010. 351p. ISBN 9788502104167
BUSSAB, W.; Morettin, P. Estatística básica; 5ª ed. São Paulo:Saraiva, 206. p. ISBN
9788502207998
MORETTIN, P. A. & BUSSAB, W. O. (2010) Estatística Básica. 6a ed. São Paulo: Saraiva.
COSTA, S.F. (1992). Introdução Ilustrada à Estatística. 2 ed. São Paulo: Harbra.
MEYER, P.L. Probabilidade: Aplicações à Estatística: 2 ed. Riode Janeiro: Livros Técnicos e
Científicos, 1983
Notas de aulas do prof. Armando Albertazzi – UFSC - 2012
Notas de aula da prof. Elisa Flemming Luz – IFSC - 2010
As 17 equações que mudaram o mundo
O andar do bêbado
Estatística para Leigos
Probabilidades e Processos estocásticos
Brasil em números
Probabilidades e estatística para engenharia e ciências (Pearson)
O poder do hábito
Os números governam nossas vidas
A história da matemática
Tabela para obtenção dos valores de X 2crítico (Teste de QUI QUADRADO)
PARTE II
100 Exercícios
Resolvidos
Exercícios Resolvidos
1- Ordene os dados. Indique o 1º, 2º e 3º quartil. Desenhe o diagrama de caixa. Calcule a
média e a mediana dos dados. Determine qual o desvio padrão.
4, 2, 3, 4, 11, 8, 5, 15
2- Calcule a correlação que relaciona a idade e a altura de uma criança.
Idade (anos)
Altura (cm)
6
70
8
110
10
130
12
150
3- Uma empresa precisa selecionar 1 novo colaborador entre 50 que realizaram 6 tipos
de provas. 3 deles obtiveram as melhores notas: A, B e C, conforme a tabela.
Considerando-se o critério de escolha o candidato com menor variância, qual deles deve
ser escolhido?
Candidato Prova 1
Prova 2
Prova 3
Prova 4
Prova 5
Prova 6
A
7
7,5
8
8
8,5
9
B
6
7
8
8
9
10
C
7,5
8
8
8
8
8,5
4- Cinco empregados coletados aleatoriamente de 3 empresas (A, B e C). Perguntou-se o
salário deles (em salários-mínimos) Em qual você trabalharia a partir dessa pesquisa?
A
5,5
6
6
6
6,5
B
4
5
6
6
9
C
5
6
6
6
7
5- Calcule o coeficiente R de Pearson para a relação entre a venda de cerveja com a
temperatura do dia.
6- O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe.
a) Construir uma tabela de freqüência das alturas dos alunos.
b) Construir o histograma.
K = 6 Classes – Na primeira linha lemos 148 inclusive até 153 (não incluso).
7- O quadro seguinte representa as massas de um conjunto de estudantes. Organize os
dados em 6 intervalos de classes:
8- Construa a tabela com os intervalos de classes:
9- Qual a reta ajustada que melhor representa a correlação entre a grandeza X e Y
representada abaixo?
Xi
5
8
7
10
6
7
9
3
8
2
Yi
6
9
8
10
5
7
8
4
6
2
10- Calcule a média, a mediana e a moda dos dados apresentados a seguir:
82, 86, 88, 84, 85, 85, 91, 93
11- Um fabricante pretende avaliar a correlação existente entre a temperatura do dia e o
consumo de cerveja. Os dados foram inseridos na tabela a seguir. Avalie qual a
correlação é mais adequada.
12- Calcular a média dos dados apresentados por meio da tabela de classes / frequência:
Intervalo de
classe
Frequência
170 a 175
8
175 a 180
12
180 a 185
5
13- Construir o diagrama de caixa (Box-plot) dos dados:
13, 9, 18, 15, 14, 21, 7, 10, 11, 20, 5, 18, 37, 16, 17
14- Dado um histograma, qual a moda e o terceiro quartil ?
15- As notas de 40 alunos são mostradas na tabela. Qual a média e a mediana?
Nota
Quantidade
2
2
4
4
6
26
8
6
10
2
16- Na Páscoa uma tia compra ovos para seus 5 sobrinhos. Ela comprou 1 chocolate
Lacta e 2 chocolates Garotos para cada sobrinho. Dentro do chocolate há brindes, sendo
que a probabilidade de se encontrar um brinde no chocolate Lacta é de 1/6. Já para o
chocolate Garoto a chance é de 1/12. Nesse caso, qual é a probabilidade do sobrinho
mais velho ser o único a ganhar um brinde no chocolate Lacta? Qual a probabilidade
do sobrinho mais novo ganhar um prêmio da Lacta ou da Garoto?
17-Qual a probabilidade de uma caixa de leite, escolhida aleatoriamente seja do tipo U,
sabendo que ele está fora das especificações?
Tipo B
Tipo C
Tipo U
Total
Dentro das especificações
500
4500
1500
6500
Fora das especificações
30
270
50
350
Total
530
4770
1550
6850
18- Uma caixa possui 12 peças, mas 4 delas são defeituosas. Selecionando-se
aleatoriamente 2 bolas sem reposição, qual a probabilidade de obtermos 2 peças boas ?
19- Uma empresa tem 2 alarmes que funcionam de forma independente. Qual a
probabilidade de que um problema seja detectado por apenas um deles? A
probabilidade do alarme funcionar quando o sensor detecta uma invasão é de 95% no
alarme A e 90% no alarme B.
20- Um dado equilibrado é lançado. Qual a probabilidade de sair a face o número 3, se
já temos a informação de que a face que saiu é ímpar ?
21- Um sistema funciona a partir de uma combinação de relés. A probabilidade de cada
relé funcionar é “p”. Qual a probabilidade do sistema funcionar ?
22- Considere 3 lançamentos seguidos de uma moeda honesta. Qual a probabilidade de
sair apenas 1 cara nesses 3 lançamentos?
23- Uma caixa tem 3 bolas brancas e 2 bolas pretas. Selecionando-se aleatoriamente
(por sorteio) 2 bolas sem reposição, qual a probabilidade de sair 2 bolas pretas? E se
houvesse reposição?
24- Considere que dois dados honestos sejam lançados juntos. Em cada jogada, calculase a soma dos resultados. Qual a probabilidade de que a soma seja 6 ou 7 ?
25- Um piloto tem probabilidade de vencer uma corrida calculada em 1/5. Qual a
probabilidade do piloto não vencer a corrida? Qual a probabilidade de vencer 3
corridas seguidas?
26- De um baralho de 52 cartas extraem-se 2 cartas sucessivamente e sem reposição.
Qual a probabilidade de se obter um ás e um valete nessa ordem?
27- Uma urna tem bolas numeradas de 1 a 25. Sorteamos uma bola aleatoriamente.
Qual a probabilidade de sair um número múltiplo de 2 ou de 3 ?
28- No lançamento de 2 dados honestos simultaneamente, qual a probabilidade de
obtermos 1 no primeiro dado e 5 no segundo?
29- Uma caixa tem 9 bolas, sendo 2 brancas, 3 vermelhas e 4 pretas. Qual a
probabilidade de ser retirar uma bola que não seja preta?
30- Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saia com o dobro
de freqüência da face 1 e que as outras faces saiam com a freqüência esperada de um
dado não viciado. Qual a freqüência da face 1?
31- Uma peça é montada a partir de 3 módulos. A probabilidade de ocorrer 1 defeito
no primeiro módulo é de 80 por 1 milhão, no segundo é de 50 em 1 milhão e no terceiro
120 em 1 milhão. Selecionado um módulo aleatoriamente na produção, qual a
probabilidade dele não ter nenhum defeito? Qual a probabilidade de serem fabricados
1000 módulos sem defeito?
32- Uma pesquisa é realizada com 10.000 consumidores sobre a preferência por tipo de
sabão em pó. Verificou-se que 6500 usam a marca X. 5500 usam a marca Y. 2000
utilizam as duas marcas. Foi sorteada uma pessoa entre as 10000 e verificou-se que ela
usa a marca X. Qual a probabilidade dessa pessoa também ser usuária da marca Y?
33- Em um colégio 5% dos homens e 2% das mulheres têm mais que 1,80m de altura. O
total de homens é de 60% dos estudantes. Se um estudante é escolhido aleatoriamente e
tem mais que 1,80m de altura, qual é a probabilidade de que seja mulher?
34- Uma caixa contém 11 bolas numeradas de 1 a 11. Retirando-se uma delas ao acaso,
observa-se que o número que ela traz é impar. Determine a probabilidade de que esse
número seja menor que 5.
35- Uma cidade tem 50.000 pessoas e 3 jornais em circulação: A, B e C. Sabe-se que
15000 pessoas lêem o jornal A, 10000 pessoas lêem o jornal B, 8000 lêem o jornal C, 6000
lêem os jornais A e B, 4000 lêem os jornais A e C, 3000 lêem os jornais B e C, 1000 lêem
os jornais A, B e C. Uma pessoa é escolhida aleatoriamente. Qual é probabilidade de que
ela leia pelo menos um jornal? Qual a probabilidade de que ela leia apenas 1 jornal?
36- Uma caixa tem 5 bolas, sendo 2 pretas e 3 brancas. Qual a probabilidade de se
sortear 2 bolas pretas na seqüência (com e sem reposição) ?
37- Um dado equilibrado (honesto) é lançado 3 vezes. Qual a probabilidade de se obter a
face 5 duas vezes?
38- Dado o espaço amostral:
S = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9} e os eventos
A = {0,2,4,6,8}, B={1,3,5,7,9} e C={2,3,4,5}, encontre:
a) A U C
b) A n C
c) C´
39- Uma caixa tem bolas numeradas de 1 a 10. Sorteamos uma bola. Qual a
probabilidade de sair múltiplo de 2 ? E qual a probabilidade de sair múltiplo de 3 ?
40- Um casal pretende ter 3 filhos. Qual a probabilidade de nascerem EXATAMENTE
dois meninos?
41- Dados os algarismos 1,2,3,4,5,6,7 construímos todos os números que podem ser
representados usando-se dois deles sem repetir. Escolhendo-se um dos números
formados (aleatoriamente), qual a probabilidade dele ser par?
42- Considere o experimento aleatório E = dado honesto é lançado e a face é observada e
os eventos A = ocorre face 3 e B = ocorre face impar. Qual a probabilidade de que o
evento A ocorrer? Qual a probabilidade do evento A ocorrer sabendo que o evento B já
ocorreu?
43- Uma empresa de aluguel de carros anota o número de carros alugados. Em um
determinado período, a probabilidade de alugar 10 carros é de 25%, a de alugar 11
carros é e 30%, de alugar 12 carros é de 35% e de alugar 13 carros é de 10%. Calcule o
número médio de carros alugados por semana.
44, sem reposição. Construa um diagrama de
árvore para esta informação. Qual a probabilidade de que as duas bolas retiradas
aleatoriamente sejam azuis?
45- Uma pesquisa realizada com 100 estudantes, sendo 50 mulheres e 50 homens,
mediu o tempo de reação para frear um carro em milisegundos. O valor médio obtido
tanto para homens quanto para mulheres foi de 170ms com um desvio padrão de 30ms.
Considerando que o tempo de reação obedece a uma distribuição normal, qual é a
probabilidade de encontrar uma pessoa com tempo de reação maior que 140ms e menor
que 200ms ?
46- Em uma rede de computadores, em 50% dos dias ocorre alguma falha. Considere
a variável aleatória X = número de dias com falha na rede. Considere o período de
observação de 30 dias e suponha que os eventos são independentes. Qual a probabilidade
de ocorrer 12 ou mais dias de falha na rede, considerando os 30 dias de observação?
Qual a probabilidade de ocorrer exatamente 12 dias de falha na rede, considerando os
mesmos 30 dias de observação?
47- Uma pesquisa com 100 pessoas mediu o tempo de reação para frear um carro em
milisegundos. O valor médio obtido foi de 180ms com desvio padrão de 50ms.
Considerando que o tempo de reação é normalmente distribuído, qual é a probabilidade
de encontrar entre as 100 pessoas, uma que tenha tempo de reação menor que 100ms?
48- Pesquisas mostram que o percentual de gênios na população obedece uma curva
normal com média de QI = 100 e desvio padrão de 15. Qual a probabilidade de
encontramos pessoas com QI superior a 130 em uma população?
49- Uma fábrica de cimentos necessita encher sacos com peso médio de 50kg. No
entanto, a massa é normalmente distribuída com desvio padrão de 2kg. Selecionando-se
um saco de cimento aleatoriamente, qual a probabilidade de que ele tenha massa menor
que 48kg?
50- Uma máquina produz discos de diâmetro médio de 2cm com desvio padrão de
0,01cm. As peças que se afastam por mais de 0,03cm desse valor médio são consideradas
com defeito. Qual o percentual de peças consideradas defeituosas?
51- A vida média de uma marca de televisão é de 8 anos com desvio padrão de 1,8 anos.
A campanha de lançamento diz que todos os produtos que tiverem defeito dentro do
prazo de garantia serão trocados por novos. Se você fosse o gerente de produção, qual
seria o tempo de garantia que você especificaria para ter no máximo 5% de trocas?
52- Uma empresa produz resistores com resistência média de 40 ohms e desvio padrão
de 6 ohms. A resistência é normalmente distribuída. Quais os valores de resistências
correspondem a 45% da área da curva normal à esquerda e área de 14% à direita da
curva normal ?
53- A vida útil de um tipo de lâmpada é normalmente distribuída com valor médio de
800h e desvio padrão de 40h. Ao selecionarmos uma lâmpada aleatoriamente, qual a
probabilidade de que ela queime entre 778 e 834 horas?
54- Em uma fábrica, um grande lote de resistores possui resistência elétrica
normalmente distribuída com valor médio de 40 ohms e desvio padrão de 2 ohm. Qual a
probabilidade de encontrarmos um resistor com resistência maior que 43 ohms?
55- O engenheiro de uma fábrica de motores elétricos sabe que a vida média dos
equipamentos produzidos é de 10 anos com desvio padrão de 2 anos. Os motores com
defeito são trocados se estiverem na garantia. Se a fabrica quiser trocar somente 3% dos
motores que apresentarem defeito, qual deve ser o tempo de garantia?
56- Um cruzamento tem uma média de 3 acidentes por mês. Qual a probabilidade de
ocorrer 4 ou mais acidentes em um mês qualquer?
57- Um taxista recebe em média 4 chamadas a cada 30min. Qual a probabilidade de não
receber nenhuma chamada em 30 minutos?
58- Em um tipo de fabricação de uma fita especial para computação, ocorrem defeitos a
uma taxa de 1 a cada 2000 metros. Qual a probabilidade de que em um rolo de 2000
metros de fita não tenha nenhum defeito? Ou que tenha pelo menos dois defeitos?
59- Um time de futebol joga 3 partidas. Assumindo que a probabilidade de vitória em cada jogo
é de 50%, qual é a probabilidade de que o time vença exatamente dois jogos?
60- Um posto de gasolina atende em média 6 clientes por hora. Qual a probabilidade de
que apenas 3 clientes seja atendido em uma hora?
61- Uma delegacia de polícia recebe uma média de 5 solicitações por hora. Qual a
probabilidade de que ela receba 2 solicitações em uma determinada hora selecionada
aleatoriamente?
62- Suponha que em uma linha de produção a probabilidade de se obter uma peça
defeituosa seja de 10%. Toma-se uma amostra de 30 peças para serem inspecionadas.
Qual a probabilidade de se obter na amostra: a) Uma peça defeituosa? b) Nenhuma
peça defeituosa? c) Mais que 2 peças defeituosas?
63- Suponha que numa linha de produção a probabilidade de se obter uma peça
defeituosa (sucesso) é p=0,1. Toma-se uma amostra de 10 peças para serem
inspecionadas. Qual a probabilidade de se obter: a) Uma peça defeituosa? b) mais que
uma peça defeituosa?
64- Um jogador tem precisão de 40% nos arremessos. Em 5 lances qual é a
probabilidade de acertar mais que 2 cestas?
65- Em uma rede de computadores, em 60% dos dias ocorre alguma falha. Construir a
distribuição de probabilidades para a variável aleatória X = número de dias com falha
na rede, considerando o período de observação de 3 dias. Suponha que os eventos são
independentes.
66- Uma empresa de telefonia sabe que em um determinado lote de telefones
produzidos, 10% deles são defeituosos. Retirando-se aleatoriamente 6 telefones para
avaliação, qual é a probabilidade de se encontrar pelo menos um telefone defeituoso?
Qual a probabilidade de se encontrar apenas um telefone defeituoso? Qual a
probabilidade de encontrar mais que dois telefones defeituosos?
67- Um determinado gene ocorre em 20% de uma população. Se uma amostra aleatória
de 7 pessoas é selecionada ao acaso, qual é a probabilidade de encontrarmos nesse
conjunto exatamente 3 pessoas com o gene?
68- Em uma cidade sabe-se que 59% das casas têm TV a cabo. Escolhemos 6 casas
aleatoriamente e perguntamos para eles se eles possuem TV a cabo. Qual a
probabilidade de encontrarmos 5 famílias com TV a cabo na amostra?
69-Qual a probabilidade de encontrarmos entre 3 e 6 caras no lançamento de uma
moeda honesta 10 vezes? Faça o mesmo cálculo por meio de uma aproximação com a
distribuição normal.
70- Uma moeda é lançada 400 vezes. Qual a probabilidade de encontrarmos um número
de caras entre 185 e 210 caras?
71- Em uma população de uma pequena cidade, 70% são favoráveis a um determinado
projeto. Se escolhermos aleatoriamente uma amostra de 10 pessoas, qual a
probabilidade de que a maioria seja favorável ao projeto?
72- Qual a probabilidade de se obter 2 caras em 5 lançamentos de uma moeda honesta?
Qual a probabilidade de se obter no máximo 2 caras?
73- Uma cidade tem 20% de sua força de trabalho desempregada. Uma amostra
aleatória de 14 pessoas é analisada. Qual a probabilidade de que se encontrem 3
desempregados na amostra?
74- Uma prova tem 12 questões com 4 alternativas cada. Um aluno pouco estudioso
resolve escolher aleatoriamente as respostas. Qual a probabilidade dele acertar 6
questões? Qual a probabilidade dele acertar 7 questões?
75- Uma escola tem 35 professores, sendo 21 homens e 14 mulheres. O Diretor formou
uma comissão de 3 pessoas. Qual a probabilidade de na comissão tenha 2 ou mais
mulheres?
76- Sabemos que 70% das empresas estão aptas a participar de uma licitação. Qual a
probabilidade de encontrar pelo menos 1 apta em uma amostra aleatória de 20
empresas?
77- Uma moeda viciada é lançada 8 vezes. A probabilidade de se obter cara em cada
jogada é de 0,60. No total de lançamentos, qual a probabilidade de se obter 5 caras?
78município. Calcule a probabilidade de 3 pessoas da amostra estarem desempregadas.
79- Por norma uma fábrica de leite em pó (Ninhol) deve produzir latas com massa
líquida de 400g (desconsiderando a massa da lata). No entanto, a massa segue uma
distribuição normal com desvio padrão de 5g. Funcionários do INMETRO retiraram
uma amostra aleatória de 25 latas para avaliação. A média das massas encontradas
(descontadas as massas das latas) foi de 402g. A partir dessa média amostral, qual é a
probabilidade de encontrarmos na população uma lata de leite com massa menor que
400g?
80- Um fabricante produz resistores com desvio padrão de 8Ω. O valor da resistência
dos resistores produzidos segue uma distribuição normal. A resistência média de uma
amostra aleatória de 20 resistores foi medida como sendo de 80 Ω. Calcule o intervalo de
confiança para a média da população de resistores produzidos. Use o nível de confiança
de 95,0%.
81- Uma fábrica de Jaraguá do Sul produz rolamentos para a Fórmula 1. Os
rolamentos são feitos de esferas de aço polido. Para avaliar a qualidade dos rolamentos
produzidos, um engenheiro coletou uma amostra aleatória de 12 esferas da produção
diária. Usando um paquímetro ele obteve as seguintes medições para as esferas. Calcule
o intervalo de confiança para a média das esferas produzidas pela máquina com nível de
confiança de 95%.
8,2 8,3 8,4 8,2 8,2 8,4 8,3 8,2 8,4 8,4 8,2 8,4
82- Um engenheiro de telecomunicações está desconfiado de que a resistência de ruptura
de um perfil metálico usado para construção de torres para antenas de celular está fora
das especificações definidas no contrato com o fornecedor. Ele selecionou aleatoriamente
no pátio da fornecedora uma amostra de 10 perfis e levou para avaliação no laboratório
de metrologia do IFSC. Sabe-se que a resistência de ruptura segue uma distribuição
normal. Os valores a seguir foram obtidos em MPa (megapascals). A partir desses
valores, calcule qual o intervalo de confiança para a tensão de ruptura média dos perfis
metálicos que estão sendo utilizados. Utilize nível de confiança de 95%.
8,3 8,4 8,2 8,2
8,4 8,3 8,2 8,4 8,4 8,2
83- Por norma, uma fábrica de café em pó deve produzir sacos com massa de 500 g de
café (desconsiderando a massa do saco). Todos os dias são produzidos 10.000 sacos de
café. A massa de café nos sacos apresenta uma distribuição normal com desvio padrão
de 10g. Funcionários do INMETRO retiraram uma amostra aleatória de 30 sacos para
avaliação. As massas foram pesadas uma a uma, obtendo-se uma massa média das
amostras de 502 gramas. Baseado nessas informações, qual a probabilidade de
encontrarmos pacotes com menos que 500g entre os 10.000 sacos de café (população).
84- Um fabricante produz resistores com desvio padrão desconhecido e distribuição
normal. A resistência média obtida em uma amostra aleatória de n = 25 resistores foi
98,0Ω. O desvio padrão da amostra foi 16Ω. Calcule o intervalo de confiança para a
média da população de resistores produzidos. Use o nível de confiança 95,0%.
85- Um fabricante produz resistores com desvio padrão 12Ω e distribuição normal. A
resistência média de uma amostra aleatória de n=25 foi 98,0Ω. Calcule o intervalo de
confiança para a média da população de resistores produzidos. Use o nível de confiança
95,0%.
86- Os dados a seguir correspondem ao diâmetro em mm de UMA AMOSTRA DE 20
esferas de rolamentos produzidos por uma máquina. Construa um intervalo de
confiança, a 95%, para a média da população de todas as possíveis esferas
produzidas por essa máquina.
15,7 15,4 15,9 15,5 15,7 15,9 15,8 15,9 15,2 15,4
15,7 15,9 16,2 15,1 14,9 15,4 15,2 15,1 15,3 15,5
87- Um pesquisador está estudando a resistência à tração de uma certa liga de aço sob
determinadas condições. Ele já obteve previamente a informação de que essa variável é
normalmente distribuída. Uma amostra aleatória de tamanho 11 é escolhida, obtendo-se
os seguintes valores para a tensão de ruptura (em MPa): 7,9 6,8 5,4 7,5 7,9 6,4 8,0
6,3 5,9 7,2 6,8. A partir desses valores, calcule qual o intervalo de confiança para a
resistência à ruptura média dessa liga de aço, com 90% de nível de confiança.
88- Os rolamentos produzidos por uma empresa precisam ter diâmetro entre 140 e
160mm. Uma amostra de 30 rolamentos é selecionada aleatoriamente, obtendo-se as
medidas relacionadas a seguir:
137 154 159 155 167 159 158 159 152 169
154 158 140 149 145 157 160 155 155 143
157 139 159 139 129 162 151 150 134 151
a) Qual o intervalo de confiança da média de diâmetros das peças produzidas?
b) Determine a proporção de peças fabricadas pela máquina que satisfazem as
especificações, com nível de confiança de 98%.
89- Foi realizada uma pesquisa envolvendo uma amostra de 600 pacientes de um
hospital. Cada um desses pacientes foi submetido a um conjunto de exames. Entre eles
mediu-se a taxa de índice cardiáco. Os 600 pacientes foram divididos em 40 grupos de 15
pacientes cadas. Em um desses grupos tem-se os seguintes valores para a taxa de índice
cardíaco: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 559, 143, 172. A partir
desses valores construa o intervalo de confiança para o valor médio de índice cardíaco
com nível de confiança de 95%.
90- Um pesquisador está estudando a resistência mecânica de um material. Essa é uma
grandeza normalmente distribuída com variância igual a 4 MPa 2. Uma amostra
aleatória de 10 corpos de prova é testada em laboratório, obtendo-se os seguintes valores
para a ruptura em MPa: 7,9 / 6,8 / 5,4 / 7,5 / 7,9 / 6,4 / 8,0 / 6,3 / 4,4 / 5,9. Calcule qual o
intervalo de confiança para a resistência média do material com nível de confiança de
90%. Se o desvio padrão não fosse dado, como você resolveria a questão?
91- São realizados teste de tensão de ruptura em 22 corpos de prova. A carga no ponto
de falha foi calculada em um valor médio de 13,71MPa e desvio padrão de 3,55. Os
dados obtidos nos permite afirmar com nível de confiança de 95% que a tensão de
ruptura da população dos corpos de prova é superior a 10 MPa?
92- Um fabricante afirma em seu catálogo que suas lâmpadas apresentam vida útil de
2000 horas e desvio padrão de 50 horas. Um comprador desconfiado fez um teste com
16 lâmpadas e obteve que o tempo de vida útil é de 1970 horas. Com um nível de
confiança de 95% é possível afirmar que o fabricante está mentindo?
93- Pretende-se comparar as tensões de ruptura de três materiais distintos: A, B e C.
Cento e vinte corpos de prova similares foram avaliados em uma mesma bateria de
testes, sendo 40 de cada material. Os valores médios e desvios padrões das respectivas
amostras estão na tabela abaixo. Com base nestes dados, e com nível de confiança de
95%, é possível afirmar que as resistências destes materiais são significativamente
diferentes? Use testes de hipóteses para justificar sua resposta.
Material
Valor médio
Desvio padrão
A
230,2 MPa
12,5 MPa
B
227,4 MPa
11,9 MPa
C
223,4 MPa
12,9 MPa
94- Um determinado tipo de barbante é vendido como sendo capaz de resistir 180 N.
Um cliente retirou 5 amostras e obteve valores de resistência de 185N, 182N, 187N, 183N
e 189N. Com um nível de confiança de 99% é possível afirmar que os barbantes
vendidos têm resistência superior à 180N ?
95- Um estudante fez um ensaio para determinar a influência da corrente de
alimentação de um laser diodo na qualidade de um certo tipo de imagem. Para tal,
realizou seis ensaios com a corrente de 60 mA e seis outros ensaios com a corrente de 100
mA. Para cada ensaio, calculou um certo coeficiente, encontrando os resultados da
tabela abaixo. Quanto maior o valor do coeficiente, melhor é qualidade da imagem. Com
95% de probabilidade é possível afirmar que a corrente de alimentação do laser diodo
influi na qualidade da imagem?
Corrente
Ensaio 1
Ensaio 2
Ensaio 3
Ensaio 4
Ensaio 5
Ensaio 6
60 mA
208,6
209,0
208,1
208,3
209,2
208,3
100 mA
202,1
197,9
200,4
200,7
203,0
203,1
96- Um professor está pensando em se candidatar a vereador de uma cidade da Grande
Florianópolis e quer saber se tem chances de ser eleito. Para isso contratou o Instituto de
Pesquisas Lopes Populix. A cidade tem 30.000 habitantes. Para uma margem de erro de
10% qual deve ser a quantidade de pessoas entrevistas para saber se votariam no
professor?
97- Em uma empresa com 10.000 funcionários, desejamos estimar o percentual de
pessoas que são favoráveis a um determinado treinamento. Qual deve ser o tamanho da
amostra para que o erro da pesquisa seja menor que 4%?
98- Quantas pessoas devem ser entrevistadas para conhecermos a opinião dos 1000
alunos de uma escola sobre a qualidade dos serviços da lanchonete?
99- Um pesquisador não conhece a população de uma cidade, mas deseja saber a
preferência de voto para presidente. Nesse caso, quantas pessoas devem ser
entrevistadas para obter um resultado com margem de erro de 2% e nível de confiança
de 95%?
100- Qual a diferença de amostragem sistemática e estratificada?
R. Na amostra estratificada coletamos elementos de forma proporcional em que eles
aparecem na população. Na amostra sistemática podemos escolher valores de uma lista já
ordenada, sorteando-se o primeiro número (posição) de referência e escolhendo os próximos
números de forma a mantermos os mesmos intervalos a partir do primeiro (exemplo: escolher
de 20 em 20 números a partir de um número selecionado).
ANEXO A – QUESTÕES COMPLEMENTARES
1- Ordene os dados. Indique o 1º, 2º e 3º quartil. Desenhe o diagrama de caixa. Calcule a
média e a mediana dos dados. Determine qual o desvio padrão.
11, 12, 4, 2, 3, 4, 11, 8, 5, 15, 20, 21
3- Calcule a correlação que relaciona a idade e a altura de uma criança.
Idade (anos)
Altura (cm)
6
70
8
110
10
130
12
150
14
155
15
160
3- O dono de uma lanchonete anotou quanto de refrigerantes (em litros) ele vende ao
longo dos dias de acordo com a temperatura. Qual a relação entre estas duas
informações?
temp.
15
20
25
27
30
31
32
35
litros
22
25
28
30
32
31
33
35
4- O quadro seguinte representa as alturas (em cm) de 25 alunos de uma classe.
Construa o histograma e calcule a média e o desvio padrão.
155
164
170
150
166
163
165
165
150
169
148
159
176
160
152
166
175
157
165
170
169
155
157
164
190
5- Qual a reta ajustada que melhor representa a correlação entre as grandezas X e Y
representadas abaixo?
Xi
5
7
7
10
6
7
9
Yi
7
9
8
10
5
7
8
6- Calcule a média, a mediana e a moda dos dados apresentados a seguir:
80, 94, 86, 88, 84, 85, 85, 91, 93
7- Calcular a média e o desvio padrão dos dados apresentados por meio da tabela de
classes / frequência:
Classe
150 a 155
156 a 160
161 a 165
166 a 170
171 a 175
176 a 180
181 a 185
Frequência
2
4
6
15
6
4
3
8- Construir o diagrama de caixa (Box-plot) dos dados:
12, 16, 13, 9, 18, 15, 14, 21, 7, 10, 11, 20, 5, 18, 37, 16, 17
9- Dado um histograma, qual a moda e o terceiro quartil ?
10- As notas de turma de alunos são mostradas na tabela. Qual a média e a mediana?
Nota
Quantidade
2
2
4
4
6
12
8
6
10
2
11- Na Páscoa uma tia compra ovos para seus 3 sobrinhos. Ela comprou 1 chocolate
Lacta e 2 chocolates Garotos para cada sobrinho. Dentro do chocolate há brindes, sendo
que a probabilidade de se encontrar um brinde no chocolate Lacta é de 1/3. Já para o
chocolate Garoto a chance é de 1/6. Nesse caso, qual é a probabilidade do sobrinho mais
velho ser o único a ganhar um brinde no chocolate Lacta? Qual a probabilidade do
sobrinho mais novo ganhar um prêmio da Lacta ou da Garoto?
12-Qual a probabilidade de uma caixa de leite, escolhida aleatoriamente seja do tipo U,
sabendo que ele está fora das especificações?
Tipo B
Tipo C
Tipo U
Total
Dentro das especificações
500
4500
1500
6500
Fora das especificações
80
270
50
400
Total
580
4770
1550
6900
13- Uma caixa possui 10 peças, mas 4 delas são defeituosas. Selecionando-se
aleatoriamente 2 bolas sem reposição, qual a probabilidade de obtermos 2 peças boas ?
14- Um dado equilibrado é lançado. Qual a probabilidade de sair a face o número 4, se
já temos a informação de que a face que saiu é par ?
15- Considere 3 lançamentos seguidos de uma moeda honesta. Qual a probabilidade de
sair exatamente 2 cara nesses 3 lançamentos?
16- Uma caixa tem 5 bolas brancas e 2 bolas pretas. Selecionando-se aleatoriamente (por
sorteio) 2 bolas sem reposição, qual a probabilidade de sair 2 bolas pretas?
17- Considere que dois dados honestos sejam lançados juntos. Em cada jogada, calculase a soma dos resultados. Qual a probabilidade de que a soma seja 5 ou 7 ?
18- Um piloto tem probabilidade de vencer uma corrida calculada em 1/10. Qual a
probabilidade do piloto vencer duas corridas em 5 ?
19- Uma urna tem bolas numeradas de 1 a 20. Sorteamos uma bola aleatoriamente.
Qual a probabilidade de sair um número múltiplo de 2 ou de 3 ?
20- Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saia com o triplo
de freqüência da face 1 e que as outras faces saiam com a freqüência esperada de um
dado não viciado. Qual a freqüência da face 1?
21- Uma pesquisa é realizada com 10.000 consumidores sobre a preferência por tipo de
sabão em pó. Verificou-se que 7.500 usam a marca X. 4.500 usam a marca Y. 2.000
utilizam as duas marcas. Foi sorteada uma pessoa entre as 10.000 e verificou-se que ela
usa a marca X. Qual a probabilidade dessa pessoa também ser usuária da marca Y?
22- Em um colégio 10% dos homens e 8% das mulheres têm mais que 1,80m de altura.
O total de homens é de 60% dos estudantes. Se um estudante é escolhido aleatoriamente
e tem mais que 1,80m de altura, qual é a probabilidade de que seja mulher?
23- Uma cidade tem 50.000 pessoas e 3 jornais em circulação: A, B e C. Sabe-se que
15000 pessoas lêem o jornal A, 10000 pessoas lêem o jornal B, 8000 lêem o jornal C, 6000
lêem os jornais A e B, 4000 lêem os jornais A e C, 3000 lêem os jornais B e C, 2.000 lêem
os jornais A, B e C. Uma pessoa é escolhida aleatoriamente. Qual é probabilidade de que
ela leia pelo menos um jornal? Qual a probabilidade de que ela leia apenas 1 jornal?
24- Dado o espaço amostral:
S = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9} e os eventos
A = {0,2,4,6}, B={1,3,5,9} e C={2,4,5}, encontre:
d) A U C
e) A n C
f) C´
25- Um casal pretende ter 4 filhos. Qual a probabilidade de nascerem EXATAMENTE
dois meninos?
26- Uma empresa de aluguel de carros anota o número de carros alugados. Em um
determinado período, a probabilidade de alugar 10 carros é de 30%, a de alugar 11
carros é e 30%, de alugar 12 carros é de 35% e de alugar 13 carros é de 15%. Calcule o
número médio de carros alugados por semana.
27- Uma pesquisa realizada com 1.000 estudantes, sendo 500 mulheres e 500 homens,
mediu o tempo de reação para frear um carro em milisegundos. O valor médio obtido
tanto para homens quanto para mulheres foi de 150ms com um desvio padrão de 25ms.
Considerando que o tempo de reação obedece a uma distribuição normal, qual é a
probabilidade de encontrar uma pessoa com tempo de maior que 200ms?
28- Em uma rede de computadores, em 20% dos dias ocorre alguma falha. Considere
a variável aleatória X = número de dias com falha na rede. Considere o período de
observação de 10 dias e suponha que os eventos são independentes. Qual a probabilidade
de ocorrer mais que 6 dias e falhas na rede, considerando os 10 dias de observação?
29- Uma fábrica de cimentos necessita encher sacos com peso médio de 50kg. No
entanto, a massa é normalmente distribuída com desvio padrão de 1kg. Selecionando-se
um saco de cimento aleatoriamente, qual a probabilidade de que ele tenha massa menor
que 49kg?
30- Uma máquina produz discos de diâmetro médio de 3cm com desvio padrão de
0,08cm. As peças que se afastam por mais de 0,16cm do diâmetro médio são
consideradas com defeito. Qual o percentual de peças consideradas defeituosas?
31- A vida média de uma marca de televisão é de 10 anos com desvio padrão de 1,5
anos. A campanha de lançamento diz que todos os produtos que tiverem defeito dentro
do prazo de garantia serão trocados por novos. Se você fosse o gerente de produção,
qual seria o tempo de garantia que você especificaria para ter no máximo 5% de trocas?
32- Uma empresa produz resistores com resistência média de 60 ohms e desvio padrão
de 4 ohms. A resistência é normalmente distribuída. Qual a probabilidade de
encontrarmos resistores com resistência inferior a 50 ohms?
33- A vida útil de um tipo de lâmpada é normalmente distribuída com valor médio de
1.000h e desvio padrão de 50h. Ao selecionarmos uma lâmpada aleatoriamente, qual a
probabilidade de que ela queime entre 500 e 600 horas?
34- O engenheiro de uma fábrica de motores elétricos sabe que a vida média dos
equipamentos produzidos é de 12 anos com desvio padrão de 2 anos. Os motores com
defeito são trocados se estiverem na garantia. Se a fabrica quiser trocar somente 5% dos
motores que apresentarem defeito, qual deve ser o tempo de garantia?
35- Um cruzamento tem uma média de 5 acidentes por mês. Qual a probabilidade de
ocorrer 4 acidentes em um mês qualquer?
36- Um taxista recebe em média 5 chamadas a cada hora. Qual a probabilidade de não
receber nenhuma chamada em uma determinada hora ?
37- Um time de futebol joga 8 partidas. Assumindo que a probabilidade de vitória em
cada jogo é de 40%, qual é a probabilidade de que o time vença exatamente 4 jogos?
38- Um posto de gasolina atende em média 8 clientes por hora. Qual a probabilidade de
que apenas 4 clientes sejam atendidos em uma hora?
39- Suponha que em uma linha de produção a probabilidade de se obter uma peça
defeituosa seja de 5%. Toma-se uma amostra de 30 peças para serem inspecionadas.
Qual a probabilidade de se obter na amostra mais que 2 peças defeituosas?
40- Suponha que numa linha de produção a probabilidade de se obter uma peça
defeituosa é de 10%. Toma-se uma amostra de 10 peças para serem inspecionadas. Qual
a probabilidade de se obter duas peças defeituosas?
41- Um jogador tem precisão de 60% nos arremessos. Em 5 lances qual é a
probabilidade de acertar mais que 2 cestas?
42- Uma empresa de telefonia sabe que em um determinado lote de telefones produzidos,
20% deles são defeituosos. Retirando-se aleatoriamente 10 telefones para avaliação, qual
é a probabilidade de se encontrar pelo menos um telefone defeituoso?
43- Um determinado gene ocorre em 10% de uma população. Se uma amostra aleatória
de 10 pessoas é selecionada ao acaso, qual é a probabilidade de encontrarmos nesse
conjunto exatamente 3 pessoas com o gene?
44- Uma moeda honesta é lançada 400 vezes. Qual a probabilidade de encontrarmos um
número de caras maior que 250?
45- Em uma população de uma pequena cidade, 60% são favoráveis a um determinado
projeto. Se escolhermos aleatoriamente uma amostra de 30 pessoas, qual a
probabilidade de que a maioria seja favorável ao projeto?
46- Qual a probabilidade de se obter 2 caras em 8 lançamentos de uma moeda honesta?
47- Uma cidade tem 20% de sua força de trabalho desempregada. Uma amostra
aleatória de 20 pessoas é analisada. Qual a probabilidade de que se encontrem 5
desempregados na amostra?
48- Uma prova tem 30 questões com 5 alternativas cada. Um aluno pouco estudioso
resolve escolher aleatoriamente as respostas. Qual a probabilidade dele acertar 15
questões ou mais?
49- Uma escola tem 40 professores, sendo 18 homens e 22 mulheres. O Diretor formou
uma comissão de 3 pessoas. Qual a probabilidade de na comissão tenha 2 ou mais
mulheres?
50- Sabemos que 70% das empresas estão aptas a participar de uma licitação. Qual a
probabilidade de encontrar pelo menos 1 apta em uma amostra aleatória de 20
empresas?
51- Uma moeda viciada é lançada 10 vezes. A probabilidade de se obter cara em cada
jogada é de 0,60. No total de lançamentos, qual a probabilidade de se obter 5 caras?
52- Por norma uma fábrica de leite em pó (Ninhol) deve produzir latas com massa
líquida de 500g (desconsiderando a massa da lata). No entanto, a massa segue uma
distribuição normal com desvio padrão de 5g. Funcionários do INMETRO retiraram
uma amostra aleatória de 25 latas para avaliação. A média das massas encontradas
(descontadas as massas das latas) foi de 502g. A partir dessa média amostral, qual é a
probabilidade de encontrarmos na população uma lata de leite com massa menor que
500g?
53- Um fabricante produz resistores com desvio padrão de 10Ω. O valor da resistência
dos resistores produzidos segue uma distribuição normal. A resistência média de uma
amostra aleatória de 25 resistores foi medida como sendo de 90 Ω. Calcule o intervalo de
confiança para a média da população de resistores produzidos. Use o nível de confiança
de 95,0%. Se retirarmos aleatoriamente um resistor da produção, qual a probabilidade
dele ter resistência menor que 80 Ω ?
54- Uma fábrica de Jaraguá do Sul produz rolamentos para a Fórmula 1. Os
rolamentos são feitos de esferas de aço polido. Para avaliar a qualidade dos rolamentos
produzidos, um engenheiro coletou uma amostra aleatória de 10 esferas da produção
diária. Usando um paquímetro ele obteve as seguintes medições para os diâmetros das
esferas. Calcule o intervalo de confiança para a média das esferas produzidas pela
máquina com nível de confiança de 95%.
8,2 8,3 8,4 8,2 8,2
8,4 8,3 8,2 8,4 8,4
55- Um engenheiro de telecomunicações está desconfiado de que a resistência de ruptura
de um perfil metálico usado para construção de torres para antenas de celular está fora
das especificações definidas no contrato com o fornecedor. Ele selecionou aleatoriamente
no pátio da fornecedora uma amostra de 12 perfis e levou para avaliação no laboratório
de metrologia do IFSC. Sabe-se que a resistência de ruptura segue uma distribuição
normal. Os valores a seguir foram obtidos em MPa (megapascals). A partir desses
valores, calcule qual o intervalo de confiança para a tensão de ruptura média dos perfis
metálicos que estão sendo utilizados. Utilize nível de confiança de 95%.
18,3 18,4 18,2 18,2 18,4 18,3 18,2 18,4 18,4 18,2 18,8 19,0
56- Um fabricante produz resistores com desvio padrão desconhecido e distribuição
normal. A resistência média obtida em uma amostra aleatória de n = 20 resistores foi
100Ω. O desvio padrão da amostra foi 12 Ω. Calcule o intervalo de confiança para a
média da população de resistores produzidos. Use o nível de confiança 90,0%.
57- Os dados a seguir correspondem ao diâmetro em mm de UMA AMOSTRA DE 18
esferas de rolamentos produzidos por uma máquina. Construa um intervalo de
confiança, a 90%, para a média da população de todas as possíveis esferas
produzidas por essa máquina.
15,7 15,4 15,9 15,5 15,7 15,9 15,8 15,9 15,2
15,7 15,9 16,2 15,1 14,9 15,4 15,2 15,1 15,3
58- Um pesquisador está estudando a resistência à tração de uma certa liga de aço sob
determinadas condições. Ele já obteve previamente a informação de que essa variável é
normalmente distribuída. Uma amostra aleatória de tamanho 12 é escolhida, obtendo-se
os seguintes valores para a tensão de ruptura (em MPa): 7,9 6,8 5,4 7,5 7,9 6,4 8,0
6,3 5,9 7,2 6,8 e 8,2. A partir desses valores, calcule qual o intervalo de confiança
para a resistência à ruptura média dessa liga de aço, com 95% de nível de confiança.
59- Os rolamentos produzidos por uma empresa precisam ter diâmetro entre 150 e
160mm. Uma amostra de 30 rolamentos é selecionada aleatoriamente, obtendo-se as
medidas relacionadas a seguir:
135 154 159 155 167 159 158 159 152 169
154 158 140 149 145 157 160 155 155 143
157 139 159 139 129 162 151 150 134 155
a) Qual o intervalo de confiança da média de diâmetros das peças produzidas?
b) Determine a proporção de peças fabricadas pela máquina que satisfazem as
especificações, com nível de confiança de 95%.
60- Foi realizada uma pesquisa envolvendo uma amostra de 400 pacientes de um
hospital. Cada um desses pacientes foi submetido a um conjunto de exames. Entre eles
mediu-se a taxa de glicose. Os 400 pacientes foram divididos em 20 grupos de 20
pacientes. Em um desses grupos foram tabelados os seguintes valores para a taxa de
glicose: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 559, 143, 172, 420, 380,
180, 200, 250. A partir desses valores construa o intervalo de confiança para o valor
médio da taxa de glicose com nível de confiança de 95%.
61- Um pesquisador está estudando a resistência mecânica de um material. Essa é uma
grandeza normalmente distribuída. Uma amostra aleatória de 12 corpos de prova é
testada em laboratório, obtendo-se os seguintes valores para a ruptura em MPa: 7,9 /
6,8 / 5,4 / 7,5 / 7,9 / 6,4 / 8,0 / 6,3 / 4,4 / 5,9 / 6,5 / 7,0. Calcule qual o intervalo de
confiança para a resistência média do material com nível de confiança de 90%.
62- São realizados teste de tensão de ruptura em 20 corpos de prova. A carga no ponto
de falha foi calculada em um valor médio de 13MPa e desvio padrão de 2MPa. Os dados
obtidos nos permite afirmar com nível de confiança de 95% que a tensão de ruptura da
população dos corpos de prova é superior a 13 MPa?
63- Um fabricante afirma em seu catálogo que suas lâmpadas apresentam vida útil de
2000 horas e desvio padrão de 100 horas. Um comprador desconfiado fez um teste com
20 lâmpadas e obteve que o tempo de vida útil é de 1900 horas. Com um nível de
confiança de 95% é possível afirmar que o fabricante está mentindo?
64- Pretende-se comparar as tensões de ruptura de três materiais distintos: A, B e C.
Cento e vinte corpos de prova similares foram avaliados em uma mesma bateria de
testes, sendo 30 de cada material. Os valores médios e desvios padrões das respectivas
amostras estão na tabela abaixo. Com base nestes dados, e com nível de confiança de
95%, é possível afirmar que as resistências destes materiais são significativamente
diferentes? Use testes de hipóteses para justificar sua resposta.
Material
Valor médio
Desvio padrão
A
230MPa
12 MPa
B
225 MPa
11 MPa
C
220 MPa
10 MPa
65- Um determinado tipo de barbante é vendido como sendo capaz de resistir 185 N.
Um cliente retirou 6 amostras e obteve valores de resistências de 184N, 182N, 187N,
183N e 189N e 190. Com um nível de confiança de 99% é possível afirmar que os
barbantes vendidos têm resistência superior à 185N ?
66- Um estudante fez um ensaio para determinar a influência da corrente de
alimentação na qualidade da imagem. Ele realizou 5 ensaios com a corrente de 50 mA e
outros 5 ensaios outros ensaios com a corrente de 100 mA. Para cada um deles, calculou
o coeficiente de nitidez, encontrando os resultados da tabela abaixo. Quanto maior o
valor do coeficiente, melhor é qualidade da imagem. Com 90% de probabilidade é
possível afirmar que a corrente de alimentação influencia na qualidade da imagem?
Corrente
Ensaio 1
Ensaio 2
Ensaio 3
Ensaio 4
Ensaio 5
50 mA
208,6
209,0
208,1
208,3
209,2
100 mA
202,1
197,9
200,4
200,7
203,0
67- Um professor está pensando em se candidatar a vereador de uma cidade da Grande
Florianópolis e quer saber se tem chances de ser eleito. Para isso contratou o Instituto de
Pesquisas Lopes Populix. A cidade tem 50.000 habitantes. Para uma margem de erro de
10% qual deve ser a quantidade de pessoas entrevistas para saber se votariam no
professor?
68- Em uma empresa com 5.000 funcionários, desejamos estimar o percentual de pessoas
que são favoráveis a um determinado treinamento. Qual deve ser o tamanho da amostra
para que o erro da pesquisa seja menor que 5%?
69- Se uma fábrica possui em seu quadro 2.000 mulheres e 500 homens, qual seria a
amostra de mulheres e de homens necessária para se fazer uma pesquisa de opinião
sobre a qualidade da creche? A margem de erro tolerável é de 10%.
70- Uma pesquisa para presidente da república deve ter quantos participantes para
nível de confiança de 95%? Como essa pesquisa deveria ser realizada para que a
amostra seja representativa da população brasileira?
ANEXO B- LISTAGEM DE VÍDEOS RECOMENDADOS:
Vídeo número 1- Reportagem da Globo News sobre Big Data:
http://www.youtube.com/watch?v=LsMt5jp1a9k
Vídeo número 2 – O prazer da estatística:
http://www.youtube.com/watch?v=AfYVOsuT-EI
Vídeo número 3 – O que é estatística:
http://www.youtube.com/watch?v=-Wm9cxiXUe0
Vídeo número 4- Vocação – Estatística:
http://www.youtube.com/watch?v=vwo3GzKuNXo
Vídeo número 5- Aulas de Estatística e Probabilidade do VEDUCA:
http://www.veduca.com.br/play/7026
Vídeo número 6- Escolher 1 AULA entre as disponíveis na Khan Academy:
https://www.khanacademy.org/math/probability/independent-dependentprobability/old_prob_videos/v/introduction-to-random-variables?playlist=Statistics
Vídeo número 7- Distribuição de Probabilidade Binomial
http://www.youtube.com/watch?v=ConmIDAzRqI&feature=youtu.be
Vídeo número 8 – O crescimento da população mundial – análise estatística
http://www.youtube.com/watch?v=RuGTZEXh6yw
Vídeo número 9- Aula de estatística da RNP:
Curso Estatística RNP
Vídeo número 10 – Estatística Descritiva:
http://www.youtube.com/watch?v=l2MyLvp82Rg
Vídeo número 11 – Teorema do Limite Central 2:
http://www.youtube.com/watch?v=zEwT_fIpSBE
Vídeo número 12- As melhores estatísticas que você já viu.
http://www.youtube.com/watch?v=HQPSRHncJLo
Vídeo número 13- Estatísticas e o poder da máquina de lavar roupa
http://www.youtube.com/watch?v=khsq7nHAveA
Vídeo número 14- Coeficiente de correlação e Regressão
http://www.youtube.com/watch?v=ODGzDA4zAq8
Vídeo número 15- Como são realizadas as pesquisas eleitorais:
http://www.youtube.com/watch?v=mWI8QM-HoeU&feature=youtu.be
ANEXO C- Videoaulas disponibilizadas no Portal Educreations











































Aula 1 - Exercícios de Probabilidade
Aula 2 - Exercícios de Probabilidade
Aula 3 - Probabilidade de eventos não exclusivos
Aula 4 - Probabilidade Condicional 1
Aula 5 - Probabilidade Condicional 2
Aula 6 - Probabilidade Condicional 3
Aula 7 - Probabilidade Condicional 4
Aula 8 - Probabilidade Condicional 5
Aula 9 - Exercícios Gerais
Aula 10 - Aplicando distribuição de probabilidades binomial 1
Aula 11 - Cálculo de probabilidades usando diagrama de Veen
Aula 12 - Distribuição probabilidades binomial
Aula 13 - Distribuição de probabilidades binomial
Aula 14 - Organização de dados e construção de diagrama de caixa (Quartil e Box Plot)
Aula 15 - Cálculo de probabilidades usando curva normal
Aula 16 - Calculando probabilidades com curva normal
Aula 17 - Organização de dados em quartis e construção de diagrama de caixa
Aula 18 - Probabilidade de obter bolas da mesma cor de uma urna
Aula 19 - Média e desvio padrão a partir de um histograma
Aula 20 - Poisson
Aula 21 - Distribuição Normal
Aula 22 - Distribuição normal
Aula 23 - Média, moda e diagrama de caixa
Aula 24 - Distribuição de Poisson
Aula 25 - Distribuição binomial
Aula 26 - Construção de diagrama de caixa
Aula 27 - Aproximação da distribuição binomial como uma normal
Aula 28 - Teorema Do Limite Central
Aula 29 - Exercício de probabilidade
Aula 30 - Probabilidade binomial aplicada ao controle estatístico de processos
Aula 31 - Correlação entre idade e altura de crianças
Aula 32 - Distribuição de poisson
Aula 33 - Probabilidade de erros em um módulo
Aula 34 - Diagrama De Veen
Aula 35 - Eventos
Aula 36 - Usando Curva Normal
Aula 37 - Aproximação Normal
Aula 38 - Aproximação Normal
Aula 39 - Usando Curva Normal
Aula 40 - Construção De Histograma
Aula 41 - Construção De Histograma
Aula 42 - Usando Curva Normal
Aula 43 - Uso Da Curva Normal









Aula 44 - Distribuição Normal
Aula 45 - Distribuição Binomial
Aula 46 - Probabilidade Binomial
Aula 47 - Distribuição Binomial
Aula 48 - Distribuição Binomial
Aula 49 - Exercícios Resolvidos - Binomial E Probabilidade Condicional
Aula 50 - Exercícios
Aula 51 - Probabilidade
Aula 52 - Inferência Estatística
ANEXO D- Outros vídeos recomendados:
https://class.coursera.org/stats1-002/lecture/15
https://class.coursera.org/stats1-002/lecture
https://www.coursera.org/course/dataanalysis
http://www.youtube.com/watch?v=EC1bTDBz46k
http://www.veduca.com.br/play/7029
http://www.veduca.com.br/play/2522
http://www.veduca.com.br/play/2552?q=estat%C3%ADstica&t=170
http://www.youtube.com/watch?v=rL9QjaeKWhI&sns=em
http://youtu.be/mWI8QM-HoeU
http://youtu.be/6xF4zduML2Y
http://www.youtube.com/watch?v=kRP4x_zF0HY&list=PLXECgj2of624V0oPua7AtVGbZa4qkGDj
http://www.youtube.com/watch?v=RuGTZEXh6yw&list=PLXECgj2of624V0oPua7AtVGbZa4qkGDj
http://www.youtube.com/watch?v=vwo3GzKuNXo
http://www.youtube.com/watch?v=WgQYIDssjLw
http://www.youtube.com/watch?v=HQPSRHncJLo
http://www.youtube.com/watch?v=t9fV8VnLbLk
http://www.youtube.com/watch?v=LMrjYNLeaXk
http://www.youtube.com/watch?v=-7VWgfoeOS4
http://www.youtube.com/watch?v=3UnPIVPz-VU
http://www.youtube.com/watch?v=PDXLfs5OZQ8
http://www.youtube.com/watch?v=O7SvBZVQ1bI
http://www.youtube.com/watch?v=OjUT9hw21rM%5D
http://www.youtube.com/watch?v=PGbsHLY5hDc%5D
http://www.youtube.com/watch?v=LhsJ1BiGqBE%5D
http://www.youtube.com/watch?v=B7zANBDwFYk%5D
http://www.youtube.com/watch?v=ODGzDA4zAq8%5D
http://www.youtube.com/watch?v=A5Lv1aD2ib4%5D
http://www.youtube.com/watch?v=l2MyLvp82Rg%5D%5D
http://www.youtube.com/watch?v=uhxtUt_-GyM&list=SP1328115D3D8A2566%5D
http://www.youtube.com/watch?v=hJZ6RW3ybB4%5D
http://www.youtube.com/watch?v=Onv14BajlDg%5D
http://www.youtube.com/watch?v=bIEczPQ6FpM%5D
http://www.youtube.com/watch?v=-E61WDtNlwM
http://www.veduca.com.br/play/5310?q=estat%C3%ADstica
http://www.veduca.com.br/play/7046/matematica-estatistica-probabilidade-estatisticadistribuicoes-binomial-e-poisson
ANEXO E – APLICAÇÕES DE ESTATÍSTICA EM TELECOMUNICAÇÕES
Apresentação do prof. Mario Noronha Neto
O ruído está sempre presente na área de telecomunicações. É uma fonte de impurezas que
temos que conviver. Parte é de natureza humana: uma rede lógica próxima de uma rede de corrente
está sujeita à interferência. No projeto temos que evitar essa situação dando o espaçamento adequado.
Há ainda o ruído natural, que independe da ação humana. Um dos mais importantes é o ruído térmico,
que é gerado por qualquer circuito eletrônico pela dissipação de calor decorrente da passagem dos
elétrons. Há diversas técnicas para se combater esse ruído térmico tanto na forma analógica, quanto na
digital.
Existe uma medida chamada SNR que é a relação sinal – ruído. Uma vez que o ruído é parte
do sistema de telecomunicações temos que saber modelá-lo e combatê-lo usando técnicas apropriadas.
Na Figura 1 apresentamos duas relações de sinal – ruído para a voz humana (sinal de fala). No caso
onde SNR = 0 há sinal de ruído interferindo no sinal transmitido. No segundo caso, onde SNR = 30dB
tem se uma relação sinal-ruído mais apropriada, pois a potência do sinal se sobressaiu ao ruído (som
transmitido de forma mais nítida). Uma potência de 3dB significa que a potência do sinal é duas vezes
a potência do ruído, pois a escala é logarítmica. Quando temos SNR = 30 significa que a potência do
sinal é 1.000 vezes a potência do ruído e isso torna o sinal mais apropriado para ser transmitido em um
sistema de telecomunicações. O MatLAB é muito utilizado para simular relações de sinal – ruído.
Figura 1- Transmissão da voz humana – Fonte: notas de aula de Diego Medeiros
Na Figura 2 temos a representação da transmissão de fala por meio de um sinal digital, o sinal
de ruído é representado pelas linhas irregulares. A linha de forma regular é a representação do sinal
digital sem o ruído.
Figura 2- Modelagem do sinal com e sem ruído – Fonte: notas de aula de Diego Medeiros
Não é possível encontrar uma expressão matemática para se dizer como o sinal de ruído varia.
O ideal seria saber qual o sinal de ruído no instante t + 5. Mas isso não é possível. Somente sabemos o
valor do ruído no momento em que ele ocorre porque o ruído tem uma natureza aleatória. É importante
conseguirmos modelar de alguma maneira o ruído, porque se não tivéssemos nenhuma informação
sobre ele ficaria inviável saber em quanto temos que proporcionar uma relação sinal-ruído para que o
sinal se sobressaia.
A análise do ruído é modelada estatisticamente por uma distribuição de probabilidades, o que
possibilita a aferição de média, variância, desvio padrão e valor médio quadrático do ruído. Estas são
chamadas de medidas estatísticas de primeira e segunda ordem.
O ruído térmico é um dos elementos mais estudados na área de telecomunicações e pode ser
modelado por uma distribuição normal (gaussiana). O Teorema do Limite Central diz que se temos um
conjunto de variáveis aleatórias que tende ao infinito, a média das variáveis aleatórias tende a uma
distribuição normal. A integral da função de –infinito até +infinito tem valor unitário (1), que é a área
sob a curva da gaussiana.
Figura 3- Ilustração de uma curva normal de sinal de ruído.
O desvio padrão em telecomunicações se relaciona com a tensão e a variância se relaciona
com a potência. Se tivermos uma situação em que o ruído varia muito temos a situação descrita na
curva D, enquanto se o ruído varia pouco temos a situação descrita na curva C. A curva D tem o
desvio padrão maior que o desvio padrão da curva C. A chance em que o valor de tensão destoar da
média é maior no caso D.
Se imaginarmos que um sistema envia sinais binários (0,1) e que 0 represente transmissão de
5V e 1 represente 10V. O sinal é transmitido por um sistema. O receptor tem que decidir se o bit
transmitido é 0 ou 1. A regra lógica utilizada é a análise da amplitude. Se for negativo ou menor que
zero, o bit é zero. Se a amplitude for maior que zero o bit é 1. Mas quando se tem ruído no sistema, a
amostra tem um valor de x adicionado. Nesse caso precisamos conhecer a distribuição do ruído para
saber quando o receptor vai errar ao considerar ao somar o ruído e o sinal recebido ser interpretado de
forma equivocada. Temos que saber qual a probabilidade de ocorrência de bits de valores mais
elevados. Para sinais de voz e fala é aceitável determinada probabilidade de erros, mas na transmissão
de dados bancários isso não é aceitável.
Figura 4- Ilustração de 4 curvas de ruído com diferentes médias e desvios padrões.
Figura 5- Modelagem da propagação de um sinal por multipercursos.
Figura 6- Intensidade do sinal recebido.
Figura 7- Distribuições de probabilidades utilizadas na área de telecomunicações.
ANEXO F – CONTROLE ESTATÍSTICO DO PROCESSO (CEP)