Exercícios Resolvidos - jesuegraciliano
Transcrição
Exercícios Resolvidos - jesuegraciliano
Agradeço à minha família pelo apoio incondicional. Aos estudantes do IFSC, em especial do Curso de Engenharia em Telecomunicações pelas sugestões: Ernani, Jean, Tiago Teixeira, Lucas, Matuzalem, Roicenir, Thiago Bonotto, Thiago Werner, Flávia, Tamara, Letícia, Leonan, Gustavo, Elton, Marcus, Danilo pelo apoio e incentivo. Ao prof. Armando Albertazzi (UFSC), prof. Elisa Flemming Luz e Marcos Moecke pelo apoio na organização desse trabalho. Dúvidas e sugestões serão bem vindas: [email protected] Apresentação Prezados estudantes, este texto tem por objetivo facilitar o aprendizado da disciplina de Estatística e Probabilidades. Basta uma pesquisa nos sites de busca para perceber que há centenas de livros e apostilas sobre o assunto. Por isso não temos por objetivo apresentar mais um livro-texto convencional. Optamos por apresentar um resumo de cada assunto mostrando na sequência diversos exercícios resolvidos. A Estatística é uma disciplina universal, aprendida na maioria dos cursos superiores em todas as grandes universidades. Há diversas motivações para seu estudo: possibilita uma compreensão mais precisa do mundo e por isso é uma ferramenta poderosa para engenheiros, pesquisadores, cientistas, gestores públicos e executivos; possibilita o desenvolvimento de uma capacidade crítica para leitura das informações divulgadas na imprensa e nas revistas científicas; possibilita a construção de gráficos e de correlações matemáticas entre outras. Há diferença entre o método estatístico (ou estatística), e estatísticas. A palavra estatística se origina de “status”, ou estado, em Latim. O primeiro uso da palavra está ligado aos interesses de governantes em busca de otimização dos meios de coleta de impostos. Mas apenas no início do século XX que o verdadeiro método estatístico nasce na Inglaterra, a partir dos trabalhos de K. Pearson e A. Fisher, sobre problemas agronômicos. Essa verdadeira revolução no modo de pensar afetou todas as áreas do conhecimento. O profissional que domina os princípios estatísticos tem uma poderosa ferramenta que poderá ser utilizada ao longo de sua carreira. As aplicações são diversas. Na engenharia destacamos a aplicação no controle estatístico de processos, que utilizam modernas técnicas de amostragem. A partir de amostras selecionadas aleatoriamente é possível fazer inferência a todo um lote de produção e melhorar os procedimentos e controle da qualidade. Didaticamente dividimos o assunto em cinco partes: estatística descritiva, probabilidade básica, distribuições de probabilidades, inferência estatística e técnicas de amostragem. Apresentamos a solução de quase uma centena de exercícios resolvidos e selecionamos diversos vídeos didáticos, que foram disponibilizados no blog: http://segredosdaestatistica.wordpress.com. Cada questão resolvida nesse texto está relacionada com dezenas de vídeos disponibilizados no Portal Educreations: http://www.educreations.com/profile/18702675/. Com essa metodologia, esperamos contribuir com o desenvolvimento dos estudantes dessa área. Caso você tenha alguma dúvida ou queira enviar sugestões para a melhoria desse texto entre em contato pelo email: [email protected]. Atenciosamente, Prof. Jesué Graciliano da Silva PARTE I RESUMO DE ESTATÍSTICA E PROBABILIDADES 1- Introdução Encontramos na literatura diversas definições para ESTATÍSTICA. Podemos simplificar dizendo que “estatística é o estudo da coleta, organização, análise, interpretação e apresentação de dados”. Dados são valores coletados da variável em estudo. Na Figura 1.1 mostramos como o estudo da estatística é normalmente realizado. Figura 1.1 – Organização do estudo da estatística. A definição pode parecer complexa, mas a humanidade já aplicava os rudimentos da estatística desde a antigüidade. Vários povos já registravam o número de habitantes, de nascimentos, de óbitos; faziam estimativas das riquezas individuais e social; distribuíam terras ao povo; cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje, chamamos de “Estatística. Na época do imperador Otávio Augusto, que governou Roma por 41 anos, já se fazia gestão pública e se tomava decisões por meio de indicadores. Roma chegou a abrigar 1 milhão de pessoas no início da era Cristã. E a diversão com jogos de azar também vem de longa data. A estatística se consolidou como ciência a partir do século XVII com Bernoulli, Pascal (Figura 1.2), Gauss, Galton, Gosset entre outros grandes nomes. Veja no site mais informações: http://segredosdaestatistica.wordpress.com/grandes-nomes/ Figura 1.2– Ilustração do matemático Blaise Pascal Todos os dias tomamos diversas decisões. E fazemos isso sem perceber, na maioria das vezes de forma intuitiva. Mas podemos se desejamos intervir na realidade de forma não acidental, precisamos conhecê-la. Se não podemos avaliar um fenômeno com precisão não podemos tomar as decisões mais acertadas. Para ilustrar a importância da estatística na engenharia vamos imaginar um exemplo simples. Vamos construir a estrutura de 200 torres de telecomunicações. Cada uma delas é composta por 50 barras de perfil em “I”. Qual deve ser a tensão de projeto nesse caso se sabemos que nem todas as barras da treliça têm a mesma resistência? Um procedimento normalmente realizado é a medição da resistência de 5 peças escolhidas aleatoriamente. Os resultados obtidos poderiam ser descritos como segue para a tensão máxima admissível: 2050N, 2020N, 1920N, 2220N e 1800N. Nesse caso, a amostra é adequada? Qual deveria ser a amostra mínima para se fazer uma afirmação da resistência à tração com intervalo de confiança de 95%? Como exemplo na área da educação sabemos que temos dificuldades em combater a evasão. Se você fosse nomeado(a) secretário(a) da educação do seu município o que faria inicialmente? Sabemos que a resposta depende do estilo de cada gestor. Mas é possível que o primeiro passo a ser feito seja um bom diagnóstico da situação presente (avaliação diagnóstica). Temos que conhecer quais são os índices de evasão de cada escola do município. Temos que conhecer o IDEB? O que as escolas com melhores IDEBs fazem de diferente? Os resultados do diagnóstico podem ser apresentados na forma gráfica e também podem ser utilizados para construção de correlações estatísticas. Por exemplo, será que é possível relacionar o IDEB da escola com o índice de qualificação dos professores? Será que a correlação está relacionado ao salário dos docentes? Será que está relacionado com o grau de escolaridade dos pais? As correlações são importantes para a tomada de decisões. Na Figura 1.3 mostramos uma correlação entre consumo de energia per capita e IDH. Figura 1.3 – Correlação entre consumo de energia per capita em TEP/ano versus IDH http://www.proceedings.scielo.br/scielo.php?pid=MSC0000000022002000200048&script=sci _arttext Existe relação entre democracia e desenvolvimento? E entre educação e riqueza das nações? Quantos bilhões de pessoas seremos em 2040? A seguridade social brasileira será capaz de garantir aposentadorias dignas dentro de 20 anos? Uma nova vacina é capaz de conter uma epidemia? O nível de consumo das classes D e E terá crescimento na próxima década? A realidade é complexa e exige aplicação de técnicas da estatística para intervenção. O “BIG DATA” já é uma realidade concreta para compreensão do mundo (Figura 1.4). Figura 1.4- Infográfico explicativo sobre BIG DATA http://www.ibm.com/midmarket/br/pt/infografico_bigdata.html Você já viu o filme: “O homem que virou o jogo” - Moneyball” ou já ouviu falar de Nate Silver? Nate Silver escreveu um livro chamado: “O sinal e o ruído – por que tantas previsões falham e outras não?” Ele trabalha no New York Times e fez previsões corretas para os resultados das eleições presidenciais nos 50 estados norte-americanos nas duas últimas eleições presidenciais. Há diversos livros que tratam do uso prático da estatística tais como: “Os números governam suas vidas”, “O poder do hábito”, “O andar do bêbado” entre outros. Figura 1.5 – Imagem da capa do livro de Nate Silver e imagem do filme Moneyball. Para mais informações, consulte o site: http://segredosdaestatistica.wordpress.com 2- Estatística Descritiva A estatística descritiva utiliza um conjunto de técnicas tais como: medidas de posição e dispersão, tabelas e gráficos para resumir as características dos dados coletados. Para simplificar o que chamamos de estatística descritiva vamos fazer a análise da estatura dos estudantes de uma turma. A altura dos 40 alunos foi medida e os resultados são apresentados na forma de uma tabela de freqüência e de um histograma, conforme visualizamos na Figura 2.1. Figura 2.1- Histograma das alturas dos alunos de uma turma. Na Figura observamos que existem intervalos da variável altura. Na tabela de dados bruta deve se avaliar qual o valor menor (limite inferior) e o valor maior (limite superior). A diferença chama-se amplitude da classe. Com esse valor e com o número de dados podemos estabelecer o número de classes. No exemplo acima são 6 intervalos de classe. O número de classes deve ser fixado de forma que as classes consigam representar adequadamente a amostra de dados em estudo. O número (k) pode ser calculado da seguinte forma (deve-se arredondar o valor final): k= 1+3,322 xlog(40)= 6,3 Considere ainda o exemplo: Um borracheiro anotou a vida útil dos pneus dos carros de seus clientes. Os dados são descritos e organizados por meio do diagrama de ramos e folhas, da tabela de freqüências e do histograma. Figura 2.2- Histograma das alturas dos alunos de uma turma. Analisando-se a tabela 2.1 a seguir não é tão fácil tirar conclusões sobre como se comportam as viscosidades para as três misturas analisadas. Por isso é muito comum o uso de diagramas de caixa, também chamados de box plot. Nesses diagramas os dados são divididos em duas partes (50% para cada lado), tendo o valor central chamado de mediana. Cada parte também é dividida em 2 (25% = quartil). Tabela 2.1- Medidas de viscosidade: Figura 2.3- Representação das viscosidades em diagramas de caixa. Figura 2.4- Representação de um diagrama de caixa. A seguir temos um exemplo de correlação estatística relacionando tempo de estudo de matemática com notas obtidas na estatística. Figura 2.5- Representação de uma correlação linear. Da mesma forma podemos observar como se relacionam a potência do motor (HP) e o tempo para se acelerar um carro. O que podemos inferir a partir do gráfico? Figura 2.6- Representação de uma correlação negativa. Você poderia afirmar que há correlação estatística entre o peso (N) e a estatura dos estudantes de sua turma? E entre horas de estudo e resultados nas provas? Ou entre temperatura no verão e venda de cervejas? Ou entre tempo de exposição de uma marca e resultado nas vendas? Ou entre anos de escolaridade e salários? A partir dessas reflexões podemos compreender a importância de correlacionarmos variáveis como forma de entender os fenômenos que nos rodeiam. Na Figura a seguir apresentamos os quatro tipos mais comuns de diagramas de dispersão. Observamos que a correlação é mais forte quando o valor de “r” é mais próximo da unidade. Figura 2.7- Diagramas de dispersão mais comuns. Conforme pode ser observado é fundamental o uso de gráficos para facilitar a compreensão de análises estatísticas. O gráfico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries. Em estatística são usados vários tipos de gráficos tais como gráfico de linha, de barras, de setores, cartograma, polar, pictograma, ramo e folhas, de pontos, de Pareto, de dispersão, de caixa, histograma, polígono de freqüência, ogiva de Galton. Existem algumas definições básicas na Estatística descritiva, que mostraremos a seguir: Média Aritmética é a mais usada dentre todas as médias, face à sua aplicabilidade a situações práticas. Podemos calcular a média aritmética de várias maneiras, dependendo apenas da forma em que os dados se encontram: n ∑ xi i=1 x= n Quando os dados estão agrupados em intervalos de classe, convenciona-se que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determina-se a média aritmética ponderada pela fórmula: n xi x= fi i=1 n fi i=1 onde: xi é o ponto médio de cada classe i. Moda – é o valor da amostra que mais aparece (de maior freqüência). Uma amostra pode ser: amodal, unimodal, bimodal, trimodal ou multimodal. Da mesma forma que a média, podemos calcular a moda de várias maneiras, dependendo apenas da forma em que os dados se encontram: Mediana – A mediana de uma amostra é aquele valor que ocupa a posição central do rol, isto é, a mediana é o valor que divide a amostra em duas partes iguais. A mediana pode não pertencer a amostra. Quartis (Qi) – são os valores da série que dividem a amostra em quatro partes iguais. Variância - baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. Para uma população fazemos: Quando o interesse não se restringe à descrição dos dados partindo da população, mas da amostra, visando tirar inferências válidas para a respectiva população, usaremos: Quando as informações são apresentadas por meio de tabela de frequências fazemos o cálculo do desvio padrão e da média conforme ilustramos a seguir: Faixa de alturas dos estudantes Quantidade de alunos em cada faixa de altura 160-165 4 165-170 8 170-175 20 175-180 8 180-185 4 A quantidade de alunos na turma é N = 44. Para calcularmos a média de alturas da turma e o desvio padrão fazemos inicialmente o cálculo do ponto médio de cada faixa de altura. Na primeira faixa fazemos: (160 + 165) /2. A média é calculada pela equação: Os cálculos da variância e do desvio padrão são realizados da seguinte forma: 3- Princípios da teoria de probabilidades Diversos autores apontam que o cálculo das Probabilidades teve início na Idade Média, com as primeiras tentativas de análise matemática das chances de se vencer nos jogos de azar, muito difundidos na época. Os jogos também eram utilizados para se prever o futuro, decidir conflitos e dividir heranças. Devem-se aos algebristas italianos Pacioli, Cardano e Tartaglia (séc. XVI) as primeiras considerações matemáticas acerca dos jogos e das apostas. No entanto, a contribuição decisiva para o início da Teoria das Probabilidades foi dada pela correspondência trocada entre os matemáticos franceses Blaise Pascal e seu amigo Pierre de Fermat, em que ambos, por diferentes caminhos, chegam à solução correta do célebre problema da divisão das apostas em 1654, quando jogo é interrompido antes do final. No blog http://segredosdaestatistica.wordpress.com apresentamos links para todos os grandes nomes da estatística. Há alguns conceitos fundamentais na estatística que são: espaço amostral e eventos: Ao conjunto de todos os resultados possíveis em um experimento aleatório chamamos de Espaço Amostral, que indicaremos como “S”. Por exemplo, o espaço amostral dos naipes de um baralho pode ser escrito como: S1 = {ouro, copas, paus, espadas }. O espaço amostral das possíveis faces de um dado pode ser escrito como: S 2 = { 1, 2, 3, 4, 5, 6 }. Podemos ter também espaços amostrais infinitos tais como a contagem de carros que passa em determinada rodovia: S3 = { 0, 1, 2, 3, 4, ..., n }. Um evento é qualquer conjunto de resultados de um experimento, que pertence ao espaço amostral S. Ao lançarmos um dado temos o espaço amostral S '1= {1, 2, 3, 4, 5, 6} e podemos desejar calcular a probabilidade de que saia uma face “par”. Nesse caso, podemos chamar de evento A = sair um número par e escrever: A = { 2, 4, 6 } Laplace definiu a Probabilidade de ocorrência de um evento “A” como sendo: No exemplo acima, a probabilidade de sair um número par em um dado honesto (equilibrado) é de 3/6, pois há três possibilidades de ocorrência de uma face par em um total de 6. Para análise de eventos probabilísticos é muito comum o uso de diagramas de Veen. Figura 3.1- Diagrama de VEEN. Há diversos teoremas e axiomas da probabilidade. As regras mais importantes são: Regra Geral da Multiplicação: P(A ∩ B) = P(A)*P(B\A) se P(A) ≠ 0 P(A ∩ B) = P(B)*P(A\B) se P(B) ≠ 0 Se A e B são independentes então: P(A/B)=P(A) e por consequência se A for independente de B, B será independente de A. Nesse caso: P(A ∩ B) = P(A)*P(B) Se jogarmos dois dados ao mesmo tempo, a probabilidade de sair um número par no primeiro dado seguido de um número menor que 3 no segundo dado é calculado como sendo P(A) x P(B) = 1/6. Nesse caso podemos dizer que os eventos A e B são independentes. Se A e B são dois eventos quaisquer, que podem ser mutuamente excludentes ou não, podemos escrever: P(A U B) = P(B) + P(B) – P (A ∩ B) No caso de A e B serem eventos mutuamente exclusivos (também chamados de excludentes ou disjuntos) então escrevemos: P(A U B) = P(B) + P(B) Podemos definir ainda Probabilidade condicional como sendo: a probabilidade de ocorrer um determinado evento, dado que se sabe que ocorreu um outro evento anteriormente. Nesse caso podemos ler: probabilidade de sair o evento A, dado que aconteceu B, que é calculado por: Como exemplo, vamos supor que queremos saber a probabilidade de ocorrer uma face 3 em um dado honesto se sabemos que ocorreu face ímpar. Nesse caso fazemos P(A/B)=(1/6)/(3/6)=1/3. Podemos ainda definir o teorema da probabilidade total (Teorema de Bayes), ilustrado na figura: 4- Distribuição de probabilidades A distribuição de pro . Quando lançamos duas vezes uma moeda podemos ter nenhuma coroa, uma coroa ou duas coroas. Nesse caso trata-se de uma variável aleatória discreta (que assumem valores 0,1,2,3...n). Se chamarmos de X = número de coroas temos então a seguinte distribuição de probabilidades: X = 0 quando não sair nenhuma coroa, X = 1 quando sair apenas 1 coroa e X=2 quando sair duas coroas. Figura 4.1- Distribuição de probabilidade binomial. Em Estatística há diversos tipos de distribuição de probabilidades tais como: de Bernoulli ou binomial, normal, T Student, Poisson, uniforme entre outras. Distribuição de Bernoulli Considerando a variável aleatória X que representa o número de sucessos em “n” provas de Bernoulli tem uma distribuição denominada Binomial dada por: Distribuição de Poisson . Exemplos: número de chamadas telefônicas por minuto, número de mensagens que chegam a um servidor por segundo, número de acidentes por dia, número de defeitos por m2. Ao contrário de uma variável aleatória discreta, uma variável aleatória contínua pode assumir qualquer valor fracionário dentro de um intervalo definido de valores. Por isso não podemos enumerar todos os possíveis valores da variável com os valores de probabilidade correspondentes. O que fazemos é construir uma FUNÇÃO DENSIDADE DE PROBABILIDADE. O tempo de vida de um rolamento e a altura dos alunos de uma escola são variáveis aleatórias contínuas. A mais importante distribuição de probabilidade contínua é a NORMAL (também conhecida como curva de Gauss). A curva que representa a distribuição normal de probabilidade tem uma forma de sino. No livro: “As 17 equações que mudaram o mundo” tem-se os detalhes históricos da importante descoberta da equação que consegue modelar com precisão uma infinidade de fenômenos naturais que ocorrem seguindo uma distribuição normal. http://www.portalaction.com.br/content/62-distribui%C3%A7%C3%A3o-normal Figura 4.2- Ilustração de uma curva NORMAL. Observamos que os valores da variável aleatória x mais próximos da média ocorrem com maior frequência. Os valores simétricos da variável x em relação à média ocorrem com mesma frequência. A área sobre a curva tem valor unitário 1. Do lado esquerdo da curva tem-se uma probabilidade e ocorrência de 50%. Para facilitar os cálculos há tabelas para distribuição normal padrão, que tem média = 0. Para se transformar uma curva normal real em uma curva normal padrão faz-se: Figura 4.3- Transformação em curva normal padronizada (tabelada). Também podemos a recorrer a softwares e aplicativos tais como Wolfram, Mathlab e “R” para realizarmos os cálculos necessários: http://www.wolfram.com/mathematica/new-in-8/probability-and-statistics-solvers-andproperties/index.pt-br.html?footer=lang http://leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase12.html#x14-8800012.1 / Quando o número de observações ou tentativas for relativamente grande, a distribuição de probabilidade normal pode ser utilizada para aproximações das probabilidades binomiais. Nesse caso fazemos uma correção de continuidade somando-se ou se adicionando 0,5. Uma distribuição comum é a distribuição uniforme, com os parâmetros a e b, que tem a seguinte função densidade da probabilidade: Figura 4.4- Distribuição de probabilidade uniforme. 5- Teorema Central do Limite e Inferência estatística Uma das definições mais importantes na área de estatística é o Teorema Central do Limite, porque permite que façamos inferência a uma população a partir de amostras selecionadas aleatoriamente. Pelo Teorema, não importa qual é a distribuição de X, a distribuição de sua média se aproxima da normal a medida que o número de elementos da amostras cresce. A inferência estatística tem por objetivo generalizar conclusões obtidas de uma amostra para toda uma população. Um exemplo são as pesquisas eleitorais realizadas com uma pequena amostra dos eleitores. Figura 5.1- Ilustração de uma inferência estatística. Dada uma população com desvio padrão σ, a forma geral do INTERVALO DE CONFIANÇA para o valor médio de μ (com nível de confiança estipulado) será: Quando não conhecemos o desvio padrão da população devemos calcular o desvio padrão da amostra e utilizar a Tabela T de Student (Gosset) para obter o valor de “t” que será utilizado na equação acima no lugar da variável “Z”. Para obtenção de “t” usamos o nível de confiança desejado e o grau de liberdade GL = N – 1. A Tabela T de Student encontra-se no anexo. 6- Testes de hipóteses Para testarmos parâmetros de uma população, formulamos hipóteses a respeito de seus parâmetros. Essas hipóteses são chamadas de Ho = hipótese nula e Ha = hipótese alternativa. Devemos testar as hipóteses formuladas para decidir se aceitamos ou rejeitamos a hipótese nula Ho. Quando se rejeita a hipótese nula, automaticamente estamos aceitando a hipótese alternativa Ha. O teste de hipótese se relaciona com o intervalo de confiança, pois qualquer hipótese que estiver fora do intervalo de confiança pode ser considerada rejeitada. Por isso o intervalo de confiança pode ser tomado como um conjunto de hipóteses não rejeitáveis. Ao conjunto de valores que levam à rejeição da Hipótese nula damos o nome de Região de rejeição do teste. Ao realizarmos o teste de hipóteses há a possibilidade de que a decisão tomada seja errada, conforme mostramos na tabela: Há o ERRO TIPO I quando rejeitamos Ho, mas Ho é verdadeira e o ERRO TIPO II, quando não se rejeita Ho, embora Ho seja falsa. Se a variância é conhecida (σ2) e se X é uma variável aleatória normalmente distribuída e com média podemos fazer o seguinte teste: Considere que μ = µ0, calcula-se o valor de Zcalculado como sendo: Obter valor de Ztabelado na Tabela normal padronizada usando Nível de confiança (NC=1-α). Se hipótese alternativa for: Halternativa = μ < µ 0, então deve se rejeitar Ho se Zcalculado < -Ztabelado. Já se hipótese alternativa for: Halternativa = μ > µ 0, então deve se rejeitar Ho se Zcalculado > Ztabelado. No caso de Halternativa for: = μ ≠ µ 0 então deve se rejeitar Ho se Zcalculado for menor que - Ztabelado para α/2 ou se Zcalculado for maior que Ztabelado para α/2. Se o valor da variância for desconhecido então no lugar de Z usar Estatística de Teste T de Studant e substituir σ (desvio padrão da população) pelo desvio padrão da amostra (s). Na Figura a seguir resumimos graficamente estes procedimentos. Figura – Testes estatísticos para uma média – Fonte: Notas de aula prof. Armando Albertazzi. Em diversas situações é conveniente o uso da distribuição QUI-QUADRADO para comparar a discrepância entre as freqüências observadas e as freqüências esperadas. Um exemplo de uso da distribuição QUI-QUADRADO é quando a variância não é conhecida, mas pode se estivar o valor do desvio padrão da amostra. Nesse caso, se a população tiver distribuição normal, o valor verdadeiro da variância estará dentro do intervalo de confiança dado por: Exemplo: Uma amostra de 12 resistores apresentou desvio padrão de 2ohms. Construir o intervalo de confiança do desvio padrão para nível de confiança de 95%. Assumir que a distribuição é normal. Nesse caso, o grau de liberdade é N1=11. Na Tabela temos (QUI-QUADRADO) X2 para 0,025 e (QUI-QUADRADO) X2 para 0,975. Observamos que se queremos NC = 95% temos 2,5% para cada lado da curva, da mesma forma que fazemos para a curva normal. X2 (11 e α=0,975) = 21,92 X2 (11 e α=0,025) = 3,82 Calculando-se o intervalo de confiança temos: Também podemos usar a distribuição QUI-QUADRADO para testar hipóteses envolvendo uma variância. No exemplo a seguir mostramos como fazer o teste. As variações em um determinado processo de fabricação de eixos para motores devem ser tais que desvio padrão do diâmetro seja menor ou igual a 0,50. Uma amostra de tamanho N = 15 foi analisada. O valor de (desvio padrão) s é de 0,64. Com nível de confiança de 95% podemos dizer que a diferença é casual e que o desvio padrão do processo pode mesmo ser 0,50? A distribuição dos diâmetros é normal. Considerar Ho: σ= 0,50 e Ha: σ > 0,50 Nível de confiança = 95%, ou seja α = 0,05 Devemos rejeitar Ho se (QUI-QUADRADO) X2 calculado for MAIOR que X2 tabelado (para α = 0,05 e GL = n-1). Para Grau de Liberdade = 15-1=14 e α = 0,05 temos: X2 tabelado = 23,7 Como 22,94 < 23,68 NÃO PODEMOS REJEITAR Ho. Não há evidências de que o desvio padrão do processo seja maior que 0,50. O valor do desvio da amostra é casual com nível de confiança de 95%. Outra aplicação comum do Teste de QUI-QUADRADO é para analisar a existência de aderência entre dados observados e medidos de uma amostra. Como exemplo, suponha que uma indústria produza refrigerantes do tipo A, tipo B e do tipo C. O objetivo do departamento de marketing é avaliar se a venda destes produtos está relacionada ao gênero do consumidor para direcionar melhor a política de publicidade. Foram selecionados aleatoriamente 150 consumidores para responder um questionário sobre a preferência pelos refrigerantes do tipo A, B ou C. Os resultados são tabelados a seguir: (Frequências observadas) Gênero Tipo A Tipo B Tipo C Total Mulheres 20 40 20 80 Homens 30 30 10 70 Total 50 70 30 150 Para solucionar essa questão fazemos o teste de hipóteses: Ho = hipótese nula – a preferência não tem relação com o sexo do consumidor Há = hipótese alternativa – a preferência depende do sexo. O primeiro passo é calcular as freqüências esperadas em cada uma das 6 freqüências observadas: (Frequências esperadas) Tipo A Tipo B Tipo C Total Mulheres 26,67 37,33 16 80 Homens 23,33 32,67 14 70 50 70 30 150 O cálculo de X2 é realizado pela equação: O grau de liberdade é calculado pela equação: (no de linhas -1).(no de colunas -1) = 2 Na tabela para QUI quadrado, com GL = 2 e nível de confiança de 95% temos: X 2crítico = 5,99. Como X2crítico é menor que X2 (5,99 < 6,13) a hipótese nula deve ser rejeitada. Logo, com 95% de nível de confiança a hipótese alternativa é aceita e a preferência pelos refrigerantes do tipo A, B e C depende sim do sexo do consumidor. A seguir, apresentamos mais um exemplo. Vamos verificar se há dependência entre a renda e o número de filhos em famílias de uma cidade. Suponha que, a partir de 250 famílias escolhidas ao acaso, tenhamos a tabela: Determinação do grau de liberdade = 2 x 3 = 6 . Na tabela, com nível de confiança de 95% temos X2 tabelado = 12,6. Como X2 calculado (crítico) é maior que X2 tabelado rejeitamos a Hipótese nula. Com 95% de nível de confiança podemos afirmar que não existe independência entre a renda e o número de filhos. Na Figura a seguir ilustramos os procedimentos para se fazer teste de hipóteses relativas a duas médias que são comparadas. Figura - Testes de hipóteses de duas médias – Fonte: Notas de aula Prof. Armando Albertazzi 7- Técnicas de Amostragem Uma amostra é uma parte representativa da população. Ou seja, a amostra deve possuir as mesmas características básicas da população. Como exemplo, para se calcular a estatura média das alunas de uma escola devemos inicialmente saber a quantidade de alunas por sala de aula e fazer a seleção aleatória das alunas de forma proporcional. Prof. Barbeta (2012) apresenta a fórmula para o cálculo do tamanho mínimo da amostra: “N” o tamanho da população, “n” o tamanho da amostra, é uma primeira aproximação para o tamanho da amostra e “E0” o erro amostral tolerável. As principais técnicas de amostragem são: aleatória simples, sistemática, estratificada, estratificada proporcional, conglomerado (agrupamento), não aleatórias: por cotas, por julgamento, etc. A seguir serão apresentadas quatro técnicas de amostragem: a) Amostragem Casual ou Aleatória Simples – é equivalente a um sorteio aleatório. Nesse tipo de amostragem é necessário que os elementos da população sejam numerados. Quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito trabalhoso. Existem Tabelas de Números Aleatórios, construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas. b) Amostragem Estratificada Proporcional – na maioria das vezes a população se divide em sub-populações – estratos. Exemplo: uma turma de engenharia tem 66 alunos, onde 57 são meninos e 9 são meninas. Tem-se; portanto; dois estratos nesta população (sexo masculino e feminino), logo para uma amostra de 10% da população tem-se 1 menina e 6 meninos. c) Amostragem Sistemática – quando os elementos da amostra já se acham ordenados, não há necessidade de construir o sistema de referência. Exemplos: linha de produção, prédio de uma rua, prontuários de um hospital, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema feito pelo pesquisador. Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. Exemplo: supondo que, uma fábrica possui em estoque 450 computadores ordenados. O setor de controle de qualidade da fábrica deseja obter uma amostra formada por 25 unidades. Pode-se, neste caso, usar o seguinte procedimento: como 450/25 = 18, escolhese por sorteio casual um número de 1 a 18 (inclusive), o qual indica o primeiro elemento sorteado para a amostra; os demais serão periodicamente considerados de 18 em 18. Assim, se o número sorteado for o 4, toma-se, o 40 computador, o 220, o 400 etc., até completar a amostra. d) Amostragem por Agrupamento – Quando a população apresenta ocorrência natural de subgrupos, cada um deles com características similares. Dividida a população em grupos, chamados de agrupamentos e selecione todos os membros de um ou mais agrupamentos (mas não todos). Exemplo – População de domicílios de uma cidade, os quarteirões formam os agrupamentos de domicílios. A finalidade da técnica de amostragem é fazer generalizações sobre um universo ou uma população grande sem precisar examinar todos os componentes do grupo. Para populações que possuem distribuição normal uma amostra de mais de 30 elementos é suficiente para se fazer inferência da população. Podemos escolher inúmeras amostras para cada população. Para cada uma delas haverá um intervalo de confiança da média obtida, quando extrapolada para fazer inferência da média da população. O intervalo de confiança é calculado por meio de uma relação entre a estatística “t” (quando desvio padrão é desconhecido) ou pela estatística “z” (quando desvio padrão é conhecido) multiplicado pelo desvio padrão (da amostra se usarmos “t” ou da população se usarmos “z”) dividido pela raiz de “n”, onde n é o número de elementos da amostra. Uma população consiste de todas as observações possíveis de um determinado fenômeno. Um censo é o exame de todos os elementos de uma população ou universo. A composição de uma amostra estatística é o que diferencia uma pesquisa de uma enquete. Enquanto a enquete ouve pessoas que se auto-selecionam, arbitrariamente, a pesquisa é realizada com uma amostra com representatividade estatística. A construção do plano amostral começa na análise dos grandes levantamentos do Instituto Brasileiro de Geografia e Estatística (IBGE): o Censo e a Pesquisa Nacional por Amostra de Domicílios (Pnad). Normalmente, o processo de construção de uma amostra para saber a preferência de candidato a presidente por exemplo envolve várias etapas: são selecionadas quase todas as capitais do País. Em seguida, são realizados sorteios para a seleção de municípios para conferirem representatividade ao interior dos estados. Depois disso, são realizados novos sorteios, agora para a definição dos setores censitários em cada município. Daí em diante os pesquisadores saem em busca de um número de pessoas que possam representar proporcionalmente a população, com base em critérios de ramo de atividade, nível de escolaridade, faixa etária e sexo. Com isso, chega-se a uma amostra que possa ser considerada um retrato do universo que representa. Para saber mais, visite o site do IBOPE: http://www.ibope.com.br/pt-br/ibope/comofazemos/paginas/composicao-dasamostras.aspx e https://www.youtube.com/watch?v=e4W8zCSW6gQ. Quando não se conhece o tamanho da população é utilizada a seguinte equação (com nível de confiança de 95%): REFERÊNCIAS BIBLIOGRÁFICAS BARBETTA, Pedro Alberto. Estatística Aplicada às Ciências Sociais (5ª edição revisada). Ed itora da UFSC. Florianópolis (SC), 2003. MONTGOMERY, Douglas C.; RUNGER, George C. Estatística Aplicada e Probabilidade para Engenheiros; 4ª ed. Rio de Janeiro:LTC, 2009. p. ISBN 9788521616643 SPIEGEL, Murray R Estatística; 3ª ed. São Paulo:Pearson, 1994. p. ISBN 9788534601207 LARSON, Ron; FARBER, Betsy Estatística aplicada; 2ª ed. São Paulo:Pearson Prentice Hall, 2004. p. ISBN 9788587918598 CRESPO, Antonio A. Estatística Fácil; 19ª ed. São Paulo:Saraiva, 2009. 224p. ISBN 9788502081062 DOWNING, Douglas; CLARK, Jeffrey Estatística Aplicada (Série Essencial).; 3ª ed. São Paulo:Saraiva, 2010. 351p. ISBN 9788502104167 BUSSAB, W.; Morettin, P. Estatística básica; 5ª ed. São Paulo:Saraiva, 206. p. ISBN 9788502207998 MORETTIN, P. A. & BUSSAB, W. O. (2010) Estatística Básica. 6a ed. São Paulo: Saraiva. COSTA, S.F. (1992). Introdução Ilustrada à Estatística. 2 ed. São Paulo: Harbra. MEYER, P.L. Probabilidade: Aplicações à Estatística: 2 ed. Riode Janeiro: Livros Técnicos e Científicos, 1983 Notas de aulas do prof. Armando Albertazzi – UFSC - 2012 Notas de aula da prof. Elisa Flemming Luz – IFSC - 2010 As 17 equações que mudaram o mundo O andar do bêbado Estatística para Leigos Probabilidades e Processos estocásticos Brasil em números Probabilidades e estatística para engenharia e ciências (Pearson) O poder do hábito Os números governam nossas vidas A história da matemática Tabela para obtenção dos valores de X 2crítico (Teste de QUI QUADRADO) PARTE II 100 Exercícios Resolvidos Exercícios Resolvidos 1- Ordene os dados. Indique o 1º, 2º e 3º quartil. Desenhe o diagrama de caixa. Calcule a média e a mediana dos dados. Determine qual o desvio padrão. 4, 2, 3, 4, 11, 8, 5, 15 2- Calcule a correlação que relaciona a idade e a altura de uma criança. Idade (anos) Altura (cm) 6 70 8 110 10 130 12 150 3- Uma empresa precisa selecionar 1 novo colaborador entre 50 que realizaram 6 tipos de provas. 3 deles obtiveram as melhores notas: A, B e C, conforme a tabela. Considerando-se o critério de escolha o candidato com menor variância, qual deles deve ser escolhido? Candidato Prova 1 Prova 2 Prova 3 Prova 4 Prova 5 Prova 6 A 7 7,5 8 8 8,5 9 B 6 7 8 8 9 10 C 7,5 8 8 8 8 8,5 4- Cinco empregados coletados aleatoriamente de 3 empresas (A, B e C). Perguntou-se o salário deles (em salários-mínimos) Em qual você trabalharia a partir dessa pesquisa? A 5,5 6 6 6 6,5 B 4 5 6 6 9 C 5 6 6 6 7 5- Calcule o coeficiente R de Pearson para a relação entre a venda de cerveja com a temperatura do dia. 6- O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe. a) Construir uma tabela de freqüência das alturas dos alunos. b) Construir o histograma. K = 6 Classes – Na primeira linha lemos 148 inclusive até 153 (não incluso). 7- O quadro seguinte representa as massas de um conjunto de estudantes. Organize os dados em 6 intervalos de classes: 8- Construa a tabela com os intervalos de classes: 9- Qual a reta ajustada que melhor representa a correlação entre a grandeza X e Y representada abaixo? Xi 5 8 7 10 6 7 9 3 8 2 Yi 6 9 8 10 5 7 8 4 6 2 10- Calcule a média, a mediana e a moda dos dados apresentados a seguir: 82, 86, 88, 84, 85, 85, 91, 93 11- Um fabricante pretende avaliar a correlação existente entre a temperatura do dia e o consumo de cerveja. Os dados foram inseridos na tabela a seguir. Avalie qual a correlação é mais adequada. 12- Calcular a média dos dados apresentados por meio da tabela de classes / frequência: Intervalo de classe Frequência 170 a 175 8 175 a 180 12 180 a 185 5 13- Construir o diagrama de caixa (Box-plot) dos dados: 13, 9, 18, 15, 14, 21, 7, 10, 11, 20, 5, 18, 37, 16, 17 14- Dado um histograma, qual a moda e o terceiro quartil ? 15- As notas de 40 alunos são mostradas na tabela. Qual a média e a mediana? Nota Quantidade 2 2 4 4 6 26 8 6 10 2 16- Na Páscoa uma tia compra ovos para seus 5 sobrinhos. Ela comprou 1 chocolate Lacta e 2 chocolates Garotos para cada sobrinho. Dentro do chocolate há brindes, sendo que a probabilidade de se encontrar um brinde no chocolate Lacta é de 1/6. Já para o chocolate Garoto a chance é de 1/12. Nesse caso, qual é a probabilidade do sobrinho mais velho ser o único a ganhar um brinde no chocolate Lacta? Qual a probabilidade do sobrinho mais novo ganhar um prêmio da Lacta ou da Garoto? 17-Qual a probabilidade de uma caixa de leite, escolhida aleatoriamente seja do tipo U, sabendo que ele está fora das especificações? Tipo B Tipo C Tipo U Total Dentro das especificações 500 4500 1500 6500 Fora das especificações 30 270 50 350 Total 530 4770 1550 6850 18- Uma caixa possui 12 peças, mas 4 delas são defeituosas. Selecionando-se aleatoriamente 2 bolas sem reposição, qual a probabilidade de obtermos 2 peças boas ? 19- Uma empresa tem 2 alarmes que funcionam de forma independente. Qual a probabilidade de que um problema seja detectado por apenas um deles? A probabilidade do alarme funcionar quando o sensor detecta uma invasão é de 95% no alarme A e 90% no alarme B. 20- Um dado equilibrado é lançado. Qual a probabilidade de sair a face o número 3, se já temos a informação de que a face que saiu é ímpar ? 21- Um sistema funciona a partir de uma combinação de relés. A probabilidade de cada relé funcionar é “p”. Qual a probabilidade do sistema funcionar ? 22- Considere 3 lançamentos seguidos de uma moeda honesta. Qual a probabilidade de sair apenas 1 cara nesses 3 lançamentos? 23- Uma caixa tem 3 bolas brancas e 2 bolas pretas. Selecionando-se aleatoriamente (por sorteio) 2 bolas sem reposição, qual a probabilidade de sair 2 bolas pretas? E se houvesse reposição? 24- Considere que dois dados honestos sejam lançados juntos. Em cada jogada, calculase a soma dos resultados. Qual a probabilidade de que a soma seja 6 ou 7 ? 25- Um piloto tem probabilidade de vencer uma corrida calculada em 1/5. Qual a probabilidade do piloto não vencer a corrida? Qual a probabilidade de vencer 3 corridas seguidas? 26- De um baralho de 52 cartas extraem-se 2 cartas sucessivamente e sem reposição. Qual a probabilidade de se obter um ás e um valete nessa ordem? 27- Uma urna tem bolas numeradas de 1 a 25. Sorteamos uma bola aleatoriamente. Qual a probabilidade de sair um número múltiplo de 2 ou de 3 ? 28- No lançamento de 2 dados honestos simultaneamente, qual a probabilidade de obtermos 1 no primeiro dado e 5 no segundo? 29- Uma caixa tem 9 bolas, sendo 2 brancas, 3 vermelhas e 4 pretas. Qual a probabilidade de ser retirar uma bola que não seja preta? 30- Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saia com o dobro de freqüência da face 1 e que as outras faces saiam com a freqüência esperada de um dado não viciado. Qual a freqüência da face 1? 31- Uma peça é montada a partir de 3 módulos. A probabilidade de ocorrer 1 defeito no primeiro módulo é de 80 por 1 milhão, no segundo é de 50 em 1 milhão e no terceiro 120 em 1 milhão. Selecionado um módulo aleatoriamente na produção, qual a probabilidade dele não ter nenhum defeito? Qual a probabilidade de serem fabricados 1000 módulos sem defeito? 32- Uma pesquisa é realizada com 10.000 consumidores sobre a preferência por tipo de sabão em pó. Verificou-se que 6500 usam a marca X. 5500 usam a marca Y. 2000 utilizam as duas marcas. Foi sorteada uma pessoa entre as 10000 e verificou-se que ela usa a marca X. Qual a probabilidade dessa pessoa também ser usuária da marca Y? 33- Em um colégio 5% dos homens e 2% das mulheres têm mais que 1,80m de altura. O total de homens é de 60% dos estudantes. Se um estudante é escolhido aleatoriamente e tem mais que 1,80m de altura, qual é a probabilidade de que seja mulher? 34- Uma caixa contém 11 bolas numeradas de 1 a 11. Retirando-se uma delas ao acaso, observa-se que o número que ela traz é impar. Determine a probabilidade de que esse número seja menor que 5. 35- Uma cidade tem 50.000 pessoas e 3 jornais em circulação: A, B e C. Sabe-se que 15000 pessoas lêem o jornal A, 10000 pessoas lêem o jornal B, 8000 lêem o jornal C, 6000 lêem os jornais A e B, 4000 lêem os jornais A e C, 3000 lêem os jornais B e C, 1000 lêem os jornais A, B e C. Uma pessoa é escolhida aleatoriamente. Qual é probabilidade de que ela leia pelo menos um jornal? Qual a probabilidade de que ela leia apenas 1 jornal? 36- Uma caixa tem 5 bolas, sendo 2 pretas e 3 brancas. Qual a probabilidade de se sortear 2 bolas pretas na seqüência (com e sem reposição) ? 37- Um dado equilibrado (honesto) é lançado 3 vezes. Qual a probabilidade de se obter a face 5 duas vezes? 38- Dado o espaço amostral: S = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9} e os eventos A = {0,2,4,6,8}, B={1,3,5,7,9} e C={2,3,4,5}, encontre: a) A U C b) A n C c) C´ 39- Uma caixa tem bolas numeradas de 1 a 10. Sorteamos uma bola. Qual a probabilidade de sair múltiplo de 2 ? E qual a probabilidade de sair múltiplo de 3 ? 40- Um casal pretende ter 3 filhos. Qual a probabilidade de nascerem EXATAMENTE dois meninos? 41- Dados os algarismos 1,2,3,4,5,6,7 construímos todos os números que podem ser representados usando-se dois deles sem repetir. Escolhendo-se um dos números formados (aleatoriamente), qual a probabilidade dele ser par? 42- Considere o experimento aleatório E = dado honesto é lançado e a face é observada e os eventos A = ocorre face 3 e B = ocorre face impar. Qual a probabilidade de que o evento A ocorrer? Qual a probabilidade do evento A ocorrer sabendo que o evento B já ocorreu? 43- Uma empresa de aluguel de carros anota o número de carros alugados. Em um determinado período, a probabilidade de alugar 10 carros é de 25%, a de alugar 11 carros é e 30%, de alugar 12 carros é de 35% e de alugar 13 carros é de 10%. Calcule o número médio de carros alugados por semana. 44, sem reposição. Construa um diagrama de árvore para esta informação. Qual a probabilidade de que as duas bolas retiradas aleatoriamente sejam azuis? 45- Uma pesquisa realizada com 100 estudantes, sendo 50 mulheres e 50 homens, mediu o tempo de reação para frear um carro em milisegundos. O valor médio obtido tanto para homens quanto para mulheres foi de 170ms com um desvio padrão de 30ms. Considerando que o tempo de reação obedece a uma distribuição normal, qual é a probabilidade de encontrar uma pessoa com tempo de reação maior que 140ms e menor que 200ms ? 46- Em uma rede de computadores, em 50% dos dias ocorre alguma falha. Considere a variável aleatória X = número de dias com falha na rede. Considere o período de observação de 30 dias e suponha que os eventos são independentes. Qual a probabilidade de ocorrer 12 ou mais dias de falha na rede, considerando os 30 dias de observação? Qual a probabilidade de ocorrer exatamente 12 dias de falha na rede, considerando os mesmos 30 dias de observação? 47- Uma pesquisa com 100 pessoas mediu o tempo de reação para frear um carro em milisegundos. O valor médio obtido foi de 180ms com desvio padrão de 50ms. Considerando que o tempo de reação é normalmente distribuído, qual é a probabilidade de encontrar entre as 100 pessoas, uma que tenha tempo de reação menor que 100ms? 48- Pesquisas mostram que o percentual de gênios na população obedece uma curva normal com média de QI = 100 e desvio padrão de 15. Qual a probabilidade de encontramos pessoas com QI superior a 130 em uma população? 49- Uma fábrica de cimentos necessita encher sacos com peso médio de 50kg. No entanto, a massa é normalmente distribuída com desvio padrão de 2kg. Selecionando-se um saco de cimento aleatoriamente, qual a probabilidade de que ele tenha massa menor que 48kg? 50- Uma máquina produz discos de diâmetro médio de 2cm com desvio padrão de 0,01cm. As peças que se afastam por mais de 0,03cm desse valor médio são consideradas com defeito. Qual o percentual de peças consideradas defeituosas? 51- A vida média de uma marca de televisão é de 8 anos com desvio padrão de 1,8 anos. A campanha de lançamento diz que todos os produtos que tiverem defeito dentro do prazo de garantia serão trocados por novos. Se você fosse o gerente de produção, qual seria o tempo de garantia que você especificaria para ter no máximo 5% de trocas? 52- Uma empresa produz resistores com resistência média de 40 ohms e desvio padrão de 6 ohms. A resistência é normalmente distribuída. Quais os valores de resistências correspondem a 45% da área da curva normal à esquerda e área de 14% à direita da curva normal ? 53- A vida útil de um tipo de lâmpada é normalmente distribuída com valor médio de 800h e desvio padrão de 40h. Ao selecionarmos uma lâmpada aleatoriamente, qual a probabilidade de que ela queime entre 778 e 834 horas? 54- Em uma fábrica, um grande lote de resistores possui resistência elétrica normalmente distribuída com valor médio de 40 ohms e desvio padrão de 2 ohm. Qual a probabilidade de encontrarmos um resistor com resistência maior que 43 ohms? 55- O engenheiro de uma fábrica de motores elétricos sabe que a vida média dos equipamentos produzidos é de 10 anos com desvio padrão de 2 anos. Os motores com defeito são trocados se estiverem na garantia. Se a fabrica quiser trocar somente 3% dos motores que apresentarem defeito, qual deve ser o tempo de garantia? 56- Um cruzamento tem uma média de 3 acidentes por mês. Qual a probabilidade de ocorrer 4 ou mais acidentes em um mês qualquer? 57- Um taxista recebe em média 4 chamadas a cada 30min. Qual a probabilidade de não receber nenhuma chamada em 30 minutos? 58- Em um tipo de fabricação de uma fita especial para computação, ocorrem defeitos a uma taxa de 1 a cada 2000 metros. Qual a probabilidade de que em um rolo de 2000 metros de fita não tenha nenhum defeito? Ou que tenha pelo menos dois defeitos? 59- Um time de futebol joga 3 partidas. Assumindo que a probabilidade de vitória em cada jogo é de 50%, qual é a probabilidade de que o time vença exatamente dois jogos? 60- Um posto de gasolina atende em média 6 clientes por hora. Qual a probabilidade de que apenas 3 clientes seja atendido em uma hora? 61- Uma delegacia de polícia recebe uma média de 5 solicitações por hora. Qual a probabilidade de que ela receba 2 solicitações em uma determinada hora selecionada aleatoriamente? 62- Suponha que em uma linha de produção a probabilidade de se obter uma peça defeituosa seja de 10%. Toma-se uma amostra de 30 peças para serem inspecionadas. Qual a probabilidade de se obter na amostra: a) Uma peça defeituosa? b) Nenhuma peça defeituosa? c) Mais que 2 peças defeituosas? 63- Suponha que numa linha de produção a probabilidade de se obter uma peça defeituosa (sucesso) é p=0,1. Toma-se uma amostra de 10 peças para serem inspecionadas. Qual a probabilidade de se obter: a) Uma peça defeituosa? b) mais que uma peça defeituosa? 64- Um jogador tem precisão de 40% nos arremessos. Em 5 lances qual é a probabilidade de acertar mais que 2 cestas? 65- Em uma rede de computadores, em 60% dos dias ocorre alguma falha. Construir a distribuição de probabilidades para a variável aleatória X = número de dias com falha na rede, considerando o período de observação de 3 dias. Suponha que os eventos são independentes. 66- Uma empresa de telefonia sabe que em um determinado lote de telefones produzidos, 10% deles são defeituosos. Retirando-se aleatoriamente 6 telefones para avaliação, qual é a probabilidade de se encontrar pelo menos um telefone defeituoso? Qual a probabilidade de se encontrar apenas um telefone defeituoso? Qual a probabilidade de encontrar mais que dois telefones defeituosos? 67- Um determinado gene ocorre em 20% de uma população. Se uma amostra aleatória de 7 pessoas é selecionada ao acaso, qual é a probabilidade de encontrarmos nesse conjunto exatamente 3 pessoas com o gene? 68- Em uma cidade sabe-se que 59% das casas têm TV a cabo. Escolhemos 6 casas aleatoriamente e perguntamos para eles se eles possuem TV a cabo. Qual a probabilidade de encontrarmos 5 famílias com TV a cabo na amostra? 69-Qual a probabilidade de encontrarmos entre 3 e 6 caras no lançamento de uma moeda honesta 10 vezes? Faça o mesmo cálculo por meio de uma aproximação com a distribuição normal. 70- Uma moeda é lançada 400 vezes. Qual a probabilidade de encontrarmos um número de caras entre 185 e 210 caras? 71- Em uma população de uma pequena cidade, 70% são favoráveis a um determinado projeto. Se escolhermos aleatoriamente uma amostra de 10 pessoas, qual a probabilidade de que a maioria seja favorável ao projeto? 72- Qual a probabilidade de se obter 2 caras em 5 lançamentos de uma moeda honesta? Qual a probabilidade de se obter no máximo 2 caras? 73- Uma cidade tem 20% de sua força de trabalho desempregada. Uma amostra aleatória de 14 pessoas é analisada. Qual a probabilidade de que se encontrem 3 desempregados na amostra? 74- Uma prova tem 12 questões com 4 alternativas cada. Um aluno pouco estudioso resolve escolher aleatoriamente as respostas. Qual a probabilidade dele acertar 6 questões? Qual a probabilidade dele acertar 7 questões? 75- Uma escola tem 35 professores, sendo 21 homens e 14 mulheres. O Diretor formou uma comissão de 3 pessoas. Qual a probabilidade de na comissão tenha 2 ou mais mulheres? 76- Sabemos que 70% das empresas estão aptas a participar de uma licitação. Qual a probabilidade de encontrar pelo menos 1 apta em uma amostra aleatória de 20 empresas? 77- Uma moeda viciada é lançada 8 vezes. A probabilidade de se obter cara em cada jogada é de 0,60. No total de lançamentos, qual a probabilidade de se obter 5 caras? 78município. Calcule a probabilidade de 3 pessoas da amostra estarem desempregadas. 79- Por norma uma fábrica de leite em pó (Ninhol) deve produzir latas com massa líquida de 400g (desconsiderando a massa da lata). No entanto, a massa segue uma distribuição normal com desvio padrão de 5g. Funcionários do INMETRO retiraram uma amostra aleatória de 25 latas para avaliação. A média das massas encontradas (descontadas as massas das latas) foi de 402g. A partir dessa média amostral, qual é a probabilidade de encontrarmos na população uma lata de leite com massa menor que 400g? 80- Um fabricante produz resistores com desvio padrão de 8Ω. O valor da resistência dos resistores produzidos segue uma distribuição normal. A resistência média de uma amostra aleatória de 20 resistores foi medida como sendo de 80 Ω. Calcule o intervalo de confiança para a média da população de resistores produzidos. Use o nível de confiança de 95,0%. 81- Uma fábrica de Jaraguá do Sul produz rolamentos para a Fórmula 1. Os rolamentos são feitos de esferas de aço polido. Para avaliar a qualidade dos rolamentos produzidos, um engenheiro coletou uma amostra aleatória de 12 esferas da produção diária. Usando um paquímetro ele obteve as seguintes medições para as esferas. Calcule o intervalo de confiança para a média das esferas produzidas pela máquina com nível de confiança de 95%. 8,2 8,3 8,4 8,2 8,2 8,4 8,3 8,2 8,4 8,4 8,2 8,4 82- Um engenheiro de telecomunicações está desconfiado de que a resistência de ruptura de um perfil metálico usado para construção de torres para antenas de celular está fora das especificações definidas no contrato com o fornecedor. Ele selecionou aleatoriamente no pátio da fornecedora uma amostra de 10 perfis e levou para avaliação no laboratório de metrologia do IFSC. Sabe-se que a resistência de ruptura segue uma distribuição normal. Os valores a seguir foram obtidos em MPa (megapascals). A partir desses valores, calcule qual o intervalo de confiança para a tensão de ruptura média dos perfis metálicos que estão sendo utilizados. Utilize nível de confiança de 95%. 8,3 8,4 8,2 8,2 8,4 8,3 8,2 8,4 8,4 8,2 83- Por norma, uma fábrica de café em pó deve produzir sacos com massa de 500 g de café (desconsiderando a massa do saco). Todos os dias são produzidos 10.000 sacos de café. A massa de café nos sacos apresenta uma distribuição normal com desvio padrão de 10g. Funcionários do INMETRO retiraram uma amostra aleatória de 30 sacos para avaliação. As massas foram pesadas uma a uma, obtendo-se uma massa média das amostras de 502 gramas. Baseado nessas informações, qual a probabilidade de encontrarmos pacotes com menos que 500g entre os 10.000 sacos de café (população). 84- Um fabricante produz resistores com desvio padrão desconhecido e distribuição normal. A resistência média obtida em uma amostra aleatória de n = 25 resistores foi 98,0Ω. O desvio padrão da amostra foi 16Ω. Calcule o intervalo de confiança para a média da população de resistores produzidos. Use o nível de confiança 95,0%. 85- Um fabricante produz resistores com desvio padrão 12Ω e distribuição normal. A resistência média de uma amostra aleatória de n=25 foi 98,0Ω. Calcule o intervalo de confiança para a média da população de resistores produzidos. Use o nível de confiança 95,0%. 86- Os dados a seguir correspondem ao diâmetro em mm de UMA AMOSTRA DE 20 esferas de rolamentos produzidos por uma máquina. Construa um intervalo de confiança, a 95%, para a média da população de todas as possíveis esferas produzidas por essa máquina. 15,7 15,4 15,9 15,5 15,7 15,9 15,8 15,9 15,2 15,4 15,7 15,9 16,2 15,1 14,9 15,4 15,2 15,1 15,3 15,5 87- Um pesquisador está estudando a resistência à tração de uma certa liga de aço sob determinadas condições. Ele já obteve previamente a informação de que essa variável é normalmente distribuída. Uma amostra aleatória de tamanho 11 é escolhida, obtendo-se os seguintes valores para a tensão de ruptura (em MPa): 7,9 6,8 5,4 7,5 7,9 6,4 8,0 6,3 5,9 7,2 6,8. A partir desses valores, calcule qual o intervalo de confiança para a resistência à ruptura média dessa liga de aço, com 90% de nível de confiança. 88- Os rolamentos produzidos por uma empresa precisam ter diâmetro entre 140 e 160mm. Uma amostra de 30 rolamentos é selecionada aleatoriamente, obtendo-se as medidas relacionadas a seguir: 137 154 159 155 167 159 158 159 152 169 154 158 140 149 145 157 160 155 155 143 157 139 159 139 129 162 151 150 134 151 a) Qual o intervalo de confiança da média de diâmetros das peças produzidas? b) Determine a proporção de peças fabricadas pela máquina que satisfazem as especificações, com nível de confiança de 98%. 89- Foi realizada uma pesquisa envolvendo uma amostra de 600 pacientes de um hospital. Cada um desses pacientes foi submetido a um conjunto de exames. Entre eles mediu-se a taxa de índice cardiáco. Os 600 pacientes foram divididos em 40 grupos de 15 pacientes cadas. Em um desses grupos tem-se os seguintes valores para a taxa de índice cardíaco: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 559, 143, 172. A partir desses valores construa o intervalo de confiança para o valor médio de índice cardíaco com nível de confiança de 95%. 90- Um pesquisador está estudando a resistência mecânica de um material. Essa é uma grandeza normalmente distribuída com variância igual a 4 MPa 2. Uma amostra aleatória de 10 corpos de prova é testada em laboratório, obtendo-se os seguintes valores para a ruptura em MPa: 7,9 / 6,8 / 5,4 / 7,5 / 7,9 / 6,4 / 8,0 / 6,3 / 4,4 / 5,9. Calcule qual o intervalo de confiança para a resistência média do material com nível de confiança de 90%. Se o desvio padrão não fosse dado, como você resolveria a questão? 91- São realizados teste de tensão de ruptura em 22 corpos de prova. A carga no ponto de falha foi calculada em um valor médio de 13,71MPa e desvio padrão de 3,55. Os dados obtidos nos permite afirmar com nível de confiança de 95% que a tensão de ruptura da população dos corpos de prova é superior a 10 MPa? 92- Um fabricante afirma em seu catálogo que suas lâmpadas apresentam vida útil de 2000 horas e desvio padrão de 50 horas. Um comprador desconfiado fez um teste com 16 lâmpadas e obteve que o tempo de vida útil é de 1970 horas. Com um nível de confiança de 95% é possível afirmar que o fabricante está mentindo? 93- Pretende-se comparar as tensões de ruptura de três materiais distintos: A, B e C. Cento e vinte corpos de prova similares foram avaliados em uma mesma bateria de testes, sendo 40 de cada material. Os valores médios e desvios padrões das respectivas amostras estão na tabela abaixo. Com base nestes dados, e com nível de confiança de 95%, é possível afirmar que as resistências destes materiais são significativamente diferentes? Use testes de hipóteses para justificar sua resposta. Material Valor médio Desvio padrão A 230,2 MPa 12,5 MPa B 227,4 MPa 11,9 MPa C 223,4 MPa 12,9 MPa 94- Um determinado tipo de barbante é vendido como sendo capaz de resistir 180 N. Um cliente retirou 5 amostras e obteve valores de resistência de 185N, 182N, 187N, 183N e 189N. Com um nível de confiança de 99% é possível afirmar que os barbantes vendidos têm resistência superior à 180N ? 95- Um estudante fez um ensaio para determinar a influência da corrente de alimentação de um laser diodo na qualidade de um certo tipo de imagem. Para tal, realizou seis ensaios com a corrente de 60 mA e seis outros ensaios com a corrente de 100 mA. Para cada ensaio, calculou um certo coeficiente, encontrando os resultados da tabela abaixo. Quanto maior o valor do coeficiente, melhor é qualidade da imagem. Com 95% de probabilidade é possível afirmar que a corrente de alimentação do laser diodo influi na qualidade da imagem? Corrente Ensaio 1 Ensaio 2 Ensaio 3 Ensaio 4 Ensaio 5 Ensaio 6 60 mA 208,6 209,0 208,1 208,3 209,2 208,3 100 mA 202,1 197,9 200,4 200,7 203,0 203,1 96- Um professor está pensando em se candidatar a vereador de uma cidade da Grande Florianópolis e quer saber se tem chances de ser eleito. Para isso contratou o Instituto de Pesquisas Lopes Populix. A cidade tem 30.000 habitantes. Para uma margem de erro de 10% qual deve ser a quantidade de pessoas entrevistas para saber se votariam no professor? 97- Em uma empresa com 10.000 funcionários, desejamos estimar o percentual de pessoas que são favoráveis a um determinado treinamento. Qual deve ser o tamanho da amostra para que o erro da pesquisa seja menor que 4%? 98- Quantas pessoas devem ser entrevistadas para conhecermos a opinião dos 1000 alunos de uma escola sobre a qualidade dos serviços da lanchonete? 99- Um pesquisador não conhece a população de uma cidade, mas deseja saber a preferência de voto para presidente. Nesse caso, quantas pessoas devem ser entrevistadas para obter um resultado com margem de erro de 2% e nível de confiança de 95%? 100- Qual a diferença de amostragem sistemática e estratificada? R. Na amostra estratificada coletamos elementos de forma proporcional em que eles aparecem na população. Na amostra sistemática podemos escolher valores de uma lista já ordenada, sorteando-se o primeiro número (posição) de referência e escolhendo os próximos números de forma a mantermos os mesmos intervalos a partir do primeiro (exemplo: escolher de 20 em 20 números a partir de um número selecionado). ANEXO A – QUESTÕES COMPLEMENTARES 1- Ordene os dados. Indique o 1º, 2º e 3º quartil. Desenhe o diagrama de caixa. Calcule a média e a mediana dos dados. Determine qual o desvio padrão. 11, 12, 4, 2, 3, 4, 11, 8, 5, 15, 20, 21 3- Calcule a correlação que relaciona a idade e a altura de uma criança. Idade (anos) Altura (cm) 6 70 8 110 10 130 12 150 14 155 15 160 3- O dono de uma lanchonete anotou quanto de refrigerantes (em litros) ele vende ao longo dos dias de acordo com a temperatura. Qual a relação entre estas duas informações? temp. 15 20 25 27 30 31 32 35 litros 22 25 28 30 32 31 33 35 4- O quadro seguinte representa as alturas (em cm) de 25 alunos de uma classe. Construa o histograma e calcule a média e o desvio padrão. 155 164 170 150 166 163 165 165 150 169 148 159 176 160 152 166 175 157 165 170 169 155 157 164 190 5- Qual a reta ajustada que melhor representa a correlação entre as grandezas X e Y representadas abaixo? Xi 5 7 7 10 6 7 9 Yi 7 9 8 10 5 7 8 6- Calcule a média, a mediana e a moda dos dados apresentados a seguir: 80, 94, 86, 88, 84, 85, 85, 91, 93 7- Calcular a média e o desvio padrão dos dados apresentados por meio da tabela de classes / frequência: Classe 150 a 155 156 a 160 161 a 165 166 a 170 171 a 175 176 a 180 181 a 185 Frequência 2 4 6 15 6 4 3 8- Construir o diagrama de caixa (Box-plot) dos dados: 12, 16, 13, 9, 18, 15, 14, 21, 7, 10, 11, 20, 5, 18, 37, 16, 17 9- Dado um histograma, qual a moda e o terceiro quartil ? 10- As notas de turma de alunos são mostradas na tabela. Qual a média e a mediana? Nota Quantidade 2 2 4 4 6 12 8 6 10 2 11- Na Páscoa uma tia compra ovos para seus 3 sobrinhos. Ela comprou 1 chocolate Lacta e 2 chocolates Garotos para cada sobrinho. Dentro do chocolate há brindes, sendo que a probabilidade de se encontrar um brinde no chocolate Lacta é de 1/3. Já para o chocolate Garoto a chance é de 1/6. Nesse caso, qual é a probabilidade do sobrinho mais velho ser o único a ganhar um brinde no chocolate Lacta? Qual a probabilidade do sobrinho mais novo ganhar um prêmio da Lacta ou da Garoto? 12-Qual a probabilidade de uma caixa de leite, escolhida aleatoriamente seja do tipo U, sabendo que ele está fora das especificações? Tipo B Tipo C Tipo U Total Dentro das especificações 500 4500 1500 6500 Fora das especificações 80 270 50 400 Total 580 4770 1550 6900 13- Uma caixa possui 10 peças, mas 4 delas são defeituosas. Selecionando-se aleatoriamente 2 bolas sem reposição, qual a probabilidade de obtermos 2 peças boas ? 14- Um dado equilibrado é lançado. Qual a probabilidade de sair a face o número 4, se já temos a informação de que a face que saiu é par ? 15- Considere 3 lançamentos seguidos de uma moeda honesta. Qual a probabilidade de sair exatamente 2 cara nesses 3 lançamentos? 16- Uma caixa tem 5 bolas brancas e 2 bolas pretas. Selecionando-se aleatoriamente (por sorteio) 2 bolas sem reposição, qual a probabilidade de sair 2 bolas pretas? 17- Considere que dois dados honestos sejam lançados juntos. Em cada jogada, calculase a soma dos resultados. Qual a probabilidade de que a soma seja 5 ou 7 ? 18- Um piloto tem probabilidade de vencer uma corrida calculada em 1/10. Qual a probabilidade do piloto vencer duas corridas em 5 ? 19- Uma urna tem bolas numeradas de 1 a 20. Sorteamos uma bola aleatoriamente. Qual a probabilidade de sair um número múltiplo de 2 ou de 3 ? 20- Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saia com o triplo de freqüência da face 1 e que as outras faces saiam com a freqüência esperada de um dado não viciado. Qual a freqüência da face 1? 21- Uma pesquisa é realizada com 10.000 consumidores sobre a preferência por tipo de sabão em pó. Verificou-se que 7.500 usam a marca X. 4.500 usam a marca Y. 2.000 utilizam as duas marcas. Foi sorteada uma pessoa entre as 10.000 e verificou-se que ela usa a marca X. Qual a probabilidade dessa pessoa também ser usuária da marca Y? 22- Em um colégio 10% dos homens e 8% das mulheres têm mais que 1,80m de altura. O total de homens é de 60% dos estudantes. Se um estudante é escolhido aleatoriamente e tem mais que 1,80m de altura, qual é a probabilidade de que seja mulher? 23- Uma cidade tem 50.000 pessoas e 3 jornais em circulação: A, B e C. Sabe-se que 15000 pessoas lêem o jornal A, 10000 pessoas lêem o jornal B, 8000 lêem o jornal C, 6000 lêem os jornais A e B, 4000 lêem os jornais A e C, 3000 lêem os jornais B e C, 2.000 lêem os jornais A, B e C. Uma pessoa é escolhida aleatoriamente. Qual é probabilidade de que ela leia pelo menos um jornal? Qual a probabilidade de que ela leia apenas 1 jornal? 24- Dado o espaço amostral: S = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9} e os eventos A = {0,2,4,6}, B={1,3,5,9} e C={2,4,5}, encontre: d) A U C e) A n C f) C´ 25- Um casal pretende ter 4 filhos. Qual a probabilidade de nascerem EXATAMENTE dois meninos? 26- Uma empresa de aluguel de carros anota o número de carros alugados. Em um determinado período, a probabilidade de alugar 10 carros é de 30%, a de alugar 11 carros é e 30%, de alugar 12 carros é de 35% e de alugar 13 carros é de 15%. Calcule o número médio de carros alugados por semana. 27- Uma pesquisa realizada com 1.000 estudantes, sendo 500 mulheres e 500 homens, mediu o tempo de reação para frear um carro em milisegundos. O valor médio obtido tanto para homens quanto para mulheres foi de 150ms com um desvio padrão de 25ms. Considerando que o tempo de reação obedece a uma distribuição normal, qual é a probabilidade de encontrar uma pessoa com tempo de maior que 200ms? 28- Em uma rede de computadores, em 20% dos dias ocorre alguma falha. Considere a variável aleatória X = número de dias com falha na rede. Considere o período de observação de 10 dias e suponha que os eventos são independentes. Qual a probabilidade de ocorrer mais que 6 dias e falhas na rede, considerando os 10 dias de observação? 29- Uma fábrica de cimentos necessita encher sacos com peso médio de 50kg. No entanto, a massa é normalmente distribuída com desvio padrão de 1kg. Selecionando-se um saco de cimento aleatoriamente, qual a probabilidade de que ele tenha massa menor que 49kg? 30- Uma máquina produz discos de diâmetro médio de 3cm com desvio padrão de 0,08cm. As peças que se afastam por mais de 0,16cm do diâmetro médio são consideradas com defeito. Qual o percentual de peças consideradas defeituosas? 31- A vida média de uma marca de televisão é de 10 anos com desvio padrão de 1,5 anos. A campanha de lançamento diz que todos os produtos que tiverem defeito dentro do prazo de garantia serão trocados por novos. Se você fosse o gerente de produção, qual seria o tempo de garantia que você especificaria para ter no máximo 5% de trocas? 32- Uma empresa produz resistores com resistência média de 60 ohms e desvio padrão de 4 ohms. A resistência é normalmente distribuída. Qual a probabilidade de encontrarmos resistores com resistência inferior a 50 ohms? 33- A vida útil de um tipo de lâmpada é normalmente distribuída com valor médio de 1.000h e desvio padrão de 50h. Ao selecionarmos uma lâmpada aleatoriamente, qual a probabilidade de que ela queime entre 500 e 600 horas? 34- O engenheiro de uma fábrica de motores elétricos sabe que a vida média dos equipamentos produzidos é de 12 anos com desvio padrão de 2 anos. Os motores com defeito são trocados se estiverem na garantia. Se a fabrica quiser trocar somente 5% dos motores que apresentarem defeito, qual deve ser o tempo de garantia? 35- Um cruzamento tem uma média de 5 acidentes por mês. Qual a probabilidade de ocorrer 4 acidentes em um mês qualquer? 36- Um taxista recebe em média 5 chamadas a cada hora. Qual a probabilidade de não receber nenhuma chamada em uma determinada hora ? 37- Um time de futebol joga 8 partidas. Assumindo que a probabilidade de vitória em cada jogo é de 40%, qual é a probabilidade de que o time vença exatamente 4 jogos? 38- Um posto de gasolina atende em média 8 clientes por hora. Qual a probabilidade de que apenas 4 clientes sejam atendidos em uma hora? 39- Suponha que em uma linha de produção a probabilidade de se obter uma peça defeituosa seja de 5%. Toma-se uma amostra de 30 peças para serem inspecionadas. Qual a probabilidade de se obter na amostra mais que 2 peças defeituosas? 40- Suponha que numa linha de produção a probabilidade de se obter uma peça defeituosa é de 10%. Toma-se uma amostra de 10 peças para serem inspecionadas. Qual a probabilidade de se obter duas peças defeituosas? 41- Um jogador tem precisão de 60% nos arremessos. Em 5 lances qual é a probabilidade de acertar mais que 2 cestas? 42- Uma empresa de telefonia sabe que em um determinado lote de telefones produzidos, 20% deles são defeituosos. Retirando-se aleatoriamente 10 telefones para avaliação, qual é a probabilidade de se encontrar pelo menos um telefone defeituoso? 43- Um determinado gene ocorre em 10% de uma população. Se uma amostra aleatória de 10 pessoas é selecionada ao acaso, qual é a probabilidade de encontrarmos nesse conjunto exatamente 3 pessoas com o gene? 44- Uma moeda honesta é lançada 400 vezes. Qual a probabilidade de encontrarmos um número de caras maior que 250? 45- Em uma população de uma pequena cidade, 60% são favoráveis a um determinado projeto. Se escolhermos aleatoriamente uma amostra de 30 pessoas, qual a probabilidade de que a maioria seja favorável ao projeto? 46- Qual a probabilidade de se obter 2 caras em 8 lançamentos de uma moeda honesta? 47- Uma cidade tem 20% de sua força de trabalho desempregada. Uma amostra aleatória de 20 pessoas é analisada. Qual a probabilidade de que se encontrem 5 desempregados na amostra? 48- Uma prova tem 30 questões com 5 alternativas cada. Um aluno pouco estudioso resolve escolher aleatoriamente as respostas. Qual a probabilidade dele acertar 15 questões ou mais? 49- Uma escola tem 40 professores, sendo 18 homens e 22 mulheres. O Diretor formou uma comissão de 3 pessoas. Qual a probabilidade de na comissão tenha 2 ou mais mulheres? 50- Sabemos que 70% das empresas estão aptas a participar de uma licitação. Qual a probabilidade de encontrar pelo menos 1 apta em uma amostra aleatória de 20 empresas? 51- Uma moeda viciada é lançada 10 vezes. A probabilidade de se obter cara em cada jogada é de 0,60. No total de lançamentos, qual a probabilidade de se obter 5 caras? 52- Por norma uma fábrica de leite em pó (Ninhol) deve produzir latas com massa líquida de 500g (desconsiderando a massa da lata). No entanto, a massa segue uma distribuição normal com desvio padrão de 5g. Funcionários do INMETRO retiraram uma amostra aleatória de 25 latas para avaliação. A média das massas encontradas (descontadas as massas das latas) foi de 502g. A partir dessa média amostral, qual é a probabilidade de encontrarmos na população uma lata de leite com massa menor que 500g? 53- Um fabricante produz resistores com desvio padrão de 10Ω. O valor da resistência dos resistores produzidos segue uma distribuição normal. A resistência média de uma amostra aleatória de 25 resistores foi medida como sendo de 90 Ω. Calcule o intervalo de confiança para a média da população de resistores produzidos. Use o nível de confiança de 95,0%. Se retirarmos aleatoriamente um resistor da produção, qual a probabilidade dele ter resistência menor que 80 Ω ? 54- Uma fábrica de Jaraguá do Sul produz rolamentos para a Fórmula 1. Os rolamentos são feitos de esferas de aço polido. Para avaliar a qualidade dos rolamentos produzidos, um engenheiro coletou uma amostra aleatória de 10 esferas da produção diária. Usando um paquímetro ele obteve as seguintes medições para os diâmetros das esferas. Calcule o intervalo de confiança para a média das esferas produzidas pela máquina com nível de confiança de 95%. 8,2 8,3 8,4 8,2 8,2 8,4 8,3 8,2 8,4 8,4 55- Um engenheiro de telecomunicações está desconfiado de que a resistência de ruptura de um perfil metálico usado para construção de torres para antenas de celular está fora das especificações definidas no contrato com o fornecedor. Ele selecionou aleatoriamente no pátio da fornecedora uma amostra de 12 perfis e levou para avaliação no laboratório de metrologia do IFSC. Sabe-se que a resistência de ruptura segue uma distribuição normal. Os valores a seguir foram obtidos em MPa (megapascals). A partir desses valores, calcule qual o intervalo de confiança para a tensão de ruptura média dos perfis metálicos que estão sendo utilizados. Utilize nível de confiança de 95%. 18,3 18,4 18,2 18,2 18,4 18,3 18,2 18,4 18,4 18,2 18,8 19,0 56- Um fabricante produz resistores com desvio padrão desconhecido e distribuição normal. A resistência média obtida em uma amostra aleatória de n = 20 resistores foi 100Ω. O desvio padrão da amostra foi 12 Ω. Calcule o intervalo de confiança para a média da população de resistores produzidos. Use o nível de confiança 90,0%. 57- Os dados a seguir correspondem ao diâmetro em mm de UMA AMOSTRA DE 18 esferas de rolamentos produzidos por uma máquina. Construa um intervalo de confiança, a 90%, para a média da população de todas as possíveis esferas produzidas por essa máquina. 15,7 15,4 15,9 15,5 15,7 15,9 15,8 15,9 15,2 15,7 15,9 16,2 15,1 14,9 15,4 15,2 15,1 15,3 58- Um pesquisador está estudando a resistência à tração de uma certa liga de aço sob determinadas condições. Ele já obteve previamente a informação de que essa variável é normalmente distribuída. Uma amostra aleatória de tamanho 12 é escolhida, obtendo-se os seguintes valores para a tensão de ruptura (em MPa): 7,9 6,8 5,4 7,5 7,9 6,4 8,0 6,3 5,9 7,2 6,8 e 8,2. A partir desses valores, calcule qual o intervalo de confiança para a resistência à ruptura média dessa liga de aço, com 95% de nível de confiança. 59- Os rolamentos produzidos por uma empresa precisam ter diâmetro entre 150 e 160mm. Uma amostra de 30 rolamentos é selecionada aleatoriamente, obtendo-se as medidas relacionadas a seguir: 135 154 159 155 167 159 158 159 152 169 154 158 140 149 145 157 160 155 155 143 157 139 159 139 129 162 151 150 134 155 a) Qual o intervalo de confiança da média de diâmetros das peças produzidas? b) Determine a proporção de peças fabricadas pela máquina que satisfazem as especificações, com nível de confiança de 95%. 60- Foi realizada uma pesquisa envolvendo uma amostra de 400 pacientes de um hospital. Cada um desses pacientes foi submetido a um conjunto de exames. Entre eles mediu-se a taxa de glicose. Os 400 pacientes foram divididos em 20 grupos de 20 pacientes. Em um desses grupos foram tabelados os seguintes valores para a taxa de glicose: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 559, 143, 172, 420, 380, 180, 200, 250. A partir desses valores construa o intervalo de confiança para o valor médio da taxa de glicose com nível de confiança de 95%. 61- Um pesquisador está estudando a resistência mecânica de um material. Essa é uma grandeza normalmente distribuída. Uma amostra aleatória de 12 corpos de prova é testada em laboratório, obtendo-se os seguintes valores para a ruptura em MPa: 7,9 / 6,8 / 5,4 / 7,5 / 7,9 / 6,4 / 8,0 / 6,3 / 4,4 / 5,9 / 6,5 / 7,0. Calcule qual o intervalo de confiança para a resistência média do material com nível de confiança de 90%. 62- São realizados teste de tensão de ruptura em 20 corpos de prova. A carga no ponto de falha foi calculada em um valor médio de 13MPa e desvio padrão de 2MPa. Os dados obtidos nos permite afirmar com nível de confiança de 95% que a tensão de ruptura da população dos corpos de prova é superior a 13 MPa? 63- Um fabricante afirma em seu catálogo que suas lâmpadas apresentam vida útil de 2000 horas e desvio padrão de 100 horas. Um comprador desconfiado fez um teste com 20 lâmpadas e obteve que o tempo de vida útil é de 1900 horas. Com um nível de confiança de 95% é possível afirmar que o fabricante está mentindo? 64- Pretende-se comparar as tensões de ruptura de três materiais distintos: A, B e C. Cento e vinte corpos de prova similares foram avaliados em uma mesma bateria de testes, sendo 30 de cada material. Os valores médios e desvios padrões das respectivas amostras estão na tabela abaixo. Com base nestes dados, e com nível de confiança de 95%, é possível afirmar que as resistências destes materiais são significativamente diferentes? Use testes de hipóteses para justificar sua resposta. Material Valor médio Desvio padrão A 230MPa 12 MPa B 225 MPa 11 MPa C 220 MPa 10 MPa 65- Um determinado tipo de barbante é vendido como sendo capaz de resistir 185 N. Um cliente retirou 6 amostras e obteve valores de resistências de 184N, 182N, 187N, 183N e 189N e 190. Com um nível de confiança de 99% é possível afirmar que os barbantes vendidos têm resistência superior à 185N ? 66- Um estudante fez um ensaio para determinar a influência da corrente de alimentação na qualidade da imagem. Ele realizou 5 ensaios com a corrente de 50 mA e outros 5 ensaios outros ensaios com a corrente de 100 mA. Para cada um deles, calculou o coeficiente de nitidez, encontrando os resultados da tabela abaixo. Quanto maior o valor do coeficiente, melhor é qualidade da imagem. Com 90% de probabilidade é possível afirmar que a corrente de alimentação influencia na qualidade da imagem? Corrente Ensaio 1 Ensaio 2 Ensaio 3 Ensaio 4 Ensaio 5 50 mA 208,6 209,0 208,1 208,3 209,2 100 mA 202,1 197,9 200,4 200,7 203,0 67- Um professor está pensando em se candidatar a vereador de uma cidade da Grande Florianópolis e quer saber se tem chances de ser eleito. Para isso contratou o Instituto de Pesquisas Lopes Populix. A cidade tem 50.000 habitantes. Para uma margem de erro de 10% qual deve ser a quantidade de pessoas entrevistas para saber se votariam no professor? 68- Em uma empresa com 5.000 funcionários, desejamos estimar o percentual de pessoas que são favoráveis a um determinado treinamento. Qual deve ser o tamanho da amostra para que o erro da pesquisa seja menor que 5%? 69- Se uma fábrica possui em seu quadro 2.000 mulheres e 500 homens, qual seria a amostra de mulheres e de homens necessária para se fazer uma pesquisa de opinião sobre a qualidade da creche? A margem de erro tolerável é de 10%. 70- Uma pesquisa para presidente da república deve ter quantos participantes para nível de confiança de 95%? Como essa pesquisa deveria ser realizada para que a amostra seja representativa da população brasileira? ANEXO B- LISTAGEM DE VÍDEOS RECOMENDADOS: Vídeo número 1- Reportagem da Globo News sobre Big Data: http://www.youtube.com/watch?v=LsMt5jp1a9k Vídeo número 2 – O prazer da estatística: http://www.youtube.com/watch?v=AfYVOsuT-EI Vídeo número 3 – O que é estatística: http://www.youtube.com/watch?v=-Wm9cxiXUe0 Vídeo número 4- Vocação – Estatística: http://www.youtube.com/watch?v=vwo3GzKuNXo Vídeo número 5- Aulas de Estatística e Probabilidade do VEDUCA: http://www.veduca.com.br/play/7026 Vídeo número 6- Escolher 1 AULA entre as disponíveis na Khan Academy: https://www.khanacademy.org/math/probability/independent-dependentprobability/old_prob_videos/v/introduction-to-random-variables?playlist=Statistics Vídeo número 7- Distribuição de Probabilidade Binomial http://www.youtube.com/watch?v=ConmIDAzRqI&feature=youtu.be Vídeo número 8 – O crescimento da população mundial – análise estatística http://www.youtube.com/watch?v=RuGTZEXh6yw Vídeo número 9- Aula de estatística da RNP: Curso Estatística RNP Vídeo número 10 – Estatística Descritiva: http://www.youtube.com/watch?v=l2MyLvp82Rg Vídeo número 11 – Teorema do Limite Central 2: http://www.youtube.com/watch?v=zEwT_fIpSBE Vídeo número 12- As melhores estatísticas que você já viu. http://www.youtube.com/watch?v=HQPSRHncJLo Vídeo número 13- Estatísticas e o poder da máquina de lavar roupa http://www.youtube.com/watch?v=khsq7nHAveA Vídeo número 14- Coeficiente de correlação e Regressão http://www.youtube.com/watch?v=ODGzDA4zAq8 Vídeo número 15- Como são realizadas as pesquisas eleitorais: http://www.youtube.com/watch?v=mWI8QM-HoeU&feature=youtu.be ANEXO C- Videoaulas disponibilizadas no Portal Educreations Aula 1 - Exercícios de Probabilidade Aula 2 - Exercícios de Probabilidade Aula 3 - Probabilidade de eventos não exclusivos Aula 4 - Probabilidade Condicional 1 Aula 5 - Probabilidade Condicional 2 Aula 6 - Probabilidade Condicional 3 Aula 7 - Probabilidade Condicional 4 Aula 8 - Probabilidade Condicional 5 Aula 9 - Exercícios Gerais Aula 10 - Aplicando distribuição de probabilidades binomial 1 Aula 11 - Cálculo de probabilidades usando diagrama de Veen Aula 12 - Distribuição probabilidades binomial Aula 13 - Distribuição de probabilidades binomial Aula 14 - Organização de dados e construção de diagrama de caixa (Quartil e Box Plot) Aula 15 - Cálculo de probabilidades usando curva normal Aula 16 - Calculando probabilidades com curva normal Aula 17 - Organização de dados em quartis e construção de diagrama de caixa Aula 18 - Probabilidade de obter bolas da mesma cor de uma urna Aula 19 - Média e desvio padrão a partir de um histograma Aula 20 - Poisson Aula 21 - Distribuição Normal Aula 22 - Distribuição normal Aula 23 - Média, moda e diagrama de caixa Aula 24 - Distribuição de Poisson Aula 25 - Distribuição binomial Aula 26 - Construção de diagrama de caixa Aula 27 - Aproximação da distribuição binomial como uma normal Aula 28 - Teorema Do Limite Central Aula 29 - Exercício de probabilidade Aula 30 - Probabilidade binomial aplicada ao controle estatístico de processos Aula 31 - Correlação entre idade e altura de crianças Aula 32 - Distribuição de poisson Aula 33 - Probabilidade de erros em um módulo Aula 34 - Diagrama De Veen Aula 35 - Eventos Aula 36 - Usando Curva Normal Aula 37 - Aproximação Normal Aula 38 - Aproximação Normal Aula 39 - Usando Curva Normal Aula 40 - Construção De Histograma Aula 41 - Construção De Histograma Aula 42 - Usando Curva Normal Aula 43 - Uso Da Curva Normal Aula 44 - Distribuição Normal Aula 45 - Distribuição Binomial Aula 46 - Probabilidade Binomial Aula 47 - Distribuição Binomial Aula 48 - Distribuição Binomial Aula 49 - Exercícios Resolvidos - Binomial E Probabilidade Condicional Aula 50 - Exercícios Aula 51 - Probabilidade Aula 52 - Inferência Estatística ANEXO D- Outros vídeos recomendados: https://class.coursera.org/stats1-002/lecture/15 https://class.coursera.org/stats1-002/lecture https://www.coursera.org/course/dataanalysis http://www.youtube.com/watch?v=EC1bTDBz46k http://www.veduca.com.br/play/7029 http://www.veduca.com.br/play/2522 http://www.veduca.com.br/play/2552?q=estat%C3%ADstica&t=170 http://www.youtube.com/watch?v=rL9QjaeKWhI&sns=em http://youtu.be/mWI8QM-HoeU http://youtu.be/6xF4zduML2Y http://www.youtube.com/watch?v=kRP4x_zF0HY&list=PLXECgj2of624V0oPua7AtVGbZa4qkGDj http://www.youtube.com/watch?v=RuGTZEXh6yw&list=PLXECgj2of624V0oPua7AtVGbZa4qkGDj http://www.youtube.com/watch?v=vwo3GzKuNXo http://www.youtube.com/watch?v=WgQYIDssjLw http://www.youtube.com/watch?v=HQPSRHncJLo http://www.youtube.com/watch?v=t9fV8VnLbLk http://www.youtube.com/watch?v=LMrjYNLeaXk http://www.youtube.com/watch?v=-7VWgfoeOS4 http://www.youtube.com/watch?v=3UnPIVPz-VU http://www.youtube.com/watch?v=PDXLfs5OZQ8 http://www.youtube.com/watch?v=O7SvBZVQ1bI http://www.youtube.com/watch?v=OjUT9hw21rM%5D http://www.youtube.com/watch?v=PGbsHLY5hDc%5D http://www.youtube.com/watch?v=LhsJ1BiGqBE%5D http://www.youtube.com/watch?v=B7zANBDwFYk%5D http://www.youtube.com/watch?v=ODGzDA4zAq8%5D http://www.youtube.com/watch?v=A5Lv1aD2ib4%5D http://www.youtube.com/watch?v=l2MyLvp82Rg%5D%5D http://www.youtube.com/watch?v=uhxtUt_-GyM&list=SP1328115D3D8A2566%5D http://www.youtube.com/watch?v=hJZ6RW3ybB4%5D http://www.youtube.com/watch?v=Onv14BajlDg%5D http://www.youtube.com/watch?v=bIEczPQ6FpM%5D http://www.youtube.com/watch?v=-E61WDtNlwM http://www.veduca.com.br/play/5310?q=estat%C3%ADstica http://www.veduca.com.br/play/7046/matematica-estatistica-probabilidade-estatisticadistribuicoes-binomial-e-poisson ANEXO E – APLICAÇÕES DE ESTATÍSTICA EM TELECOMUNICAÇÕES Apresentação do prof. Mario Noronha Neto O ruído está sempre presente na área de telecomunicações. É uma fonte de impurezas que temos que conviver. Parte é de natureza humana: uma rede lógica próxima de uma rede de corrente está sujeita à interferência. No projeto temos que evitar essa situação dando o espaçamento adequado. Há ainda o ruído natural, que independe da ação humana. Um dos mais importantes é o ruído térmico, que é gerado por qualquer circuito eletrônico pela dissipação de calor decorrente da passagem dos elétrons. Há diversas técnicas para se combater esse ruído térmico tanto na forma analógica, quanto na digital. Existe uma medida chamada SNR que é a relação sinal – ruído. Uma vez que o ruído é parte do sistema de telecomunicações temos que saber modelá-lo e combatê-lo usando técnicas apropriadas. Na Figura 1 apresentamos duas relações de sinal – ruído para a voz humana (sinal de fala). No caso onde SNR = 0 há sinal de ruído interferindo no sinal transmitido. No segundo caso, onde SNR = 30dB tem se uma relação sinal-ruído mais apropriada, pois a potência do sinal se sobressaiu ao ruído (som transmitido de forma mais nítida). Uma potência de 3dB significa que a potência do sinal é duas vezes a potência do ruído, pois a escala é logarítmica. Quando temos SNR = 30 significa que a potência do sinal é 1.000 vezes a potência do ruído e isso torna o sinal mais apropriado para ser transmitido em um sistema de telecomunicações. O MatLAB é muito utilizado para simular relações de sinal – ruído. Figura 1- Transmissão da voz humana – Fonte: notas de aula de Diego Medeiros Na Figura 2 temos a representação da transmissão de fala por meio de um sinal digital, o sinal de ruído é representado pelas linhas irregulares. A linha de forma regular é a representação do sinal digital sem o ruído. Figura 2- Modelagem do sinal com e sem ruído – Fonte: notas de aula de Diego Medeiros Não é possível encontrar uma expressão matemática para se dizer como o sinal de ruído varia. O ideal seria saber qual o sinal de ruído no instante t + 5. Mas isso não é possível. Somente sabemos o valor do ruído no momento em que ele ocorre porque o ruído tem uma natureza aleatória. É importante conseguirmos modelar de alguma maneira o ruído, porque se não tivéssemos nenhuma informação sobre ele ficaria inviável saber em quanto temos que proporcionar uma relação sinal-ruído para que o sinal se sobressaia. A análise do ruído é modelada estatisticamente por uma distribuição de probabilidades, o que possibilita a aferição de média, variância, desvio padrão e valor médio quadrático do ruído. Estas são chamadas de medidas estatísticas de primeira e segunda ordem. O ruído térmico é um dos elementos mais estudados na área de telecomunicações e pode ser modelado por uma distribuição normal (gaussiana). O Teorema do Limite Central diz que se temos um conjunto de variáveis aleatórias que tende ao infinito, a média das variáveis aleatórias tende a uma distribuição normal. A integral da função de –infinito até +infinito tem valor unitário (1), que é a área sob a curva da gaussiana. Figura 3- Ilustração de uma curva normal de sinal de ruído. O desvio padrão em telecomunicações se relaciona com a tensão e a variância se relaciona com a potência. Se tivermos uma situação em que o ruído varia muito temos a situação descrita na curva D, enquanto se o ruído varia pouco temos a situação descrita na curva C. A curva D tem o desvio padrão maior que o desvio padrão da curva C. A chance em que o valor de tensão destoar da média é maior no caso D. Se imaginarmos que um sistema envia sinais binários (0,1) e que 0 represente transmissão de 5V e 1 represente 10V. O sinal é transmitido por um sistema. O receptor tem que decidir se o bit transmitido é 0 ou 1. A regra lógica utilizada é a análise da amplitude. Se for negativo ou menor que zero, o bit é zero. Se a amplitude for maior que zero o bit é 1. Mas quando se tem ruído no sistema, a amostra tem um valor de x adicionado. Nesse caso precisamos conhecer a distribuição do ruído para saber quando o receptor vai errar ao considerar ao somar o ruído e o sinal recebido ser interpretado de forma equivocada. Temos que saber qual a probabilidade de ocorrência de bits de valores mais elevados. Para sinais de voz e fala é aceitável determinada probabilidade de erros, mas na transmissão de dados bancários isso não é aceitável. Figura 4- Ilustração de 4 curvas de ruído com diferentes médias e desvios padrões. Figura 5- Modelagem da propagação de um sinal por multipercursos. Figura 6- Intensidade do sinal recebido. Figura 7- Distribuições de probabilidades utilizadas na área de telecomunicações. ANEXO F – CONTROLE ESTATÍSTICO DO PROCESSO (CEP)
Documentos relacionados
Exercícios Resolvidos - jesuegraciliano
http://segredosdaestatistica.wordpress.com. Cada questão resolvida nesse texto está relacionada com dezenas de vídeos disponibilizados no Portal Educreations: http://www.educreations.com/profile/18...
Leia mais