método estatístico bayesiano de dados difusos
Transcrição
método estatístico bayesiano de dados difusos
CADERNO DE FÍSICA DA UEFS 11 (01 E 02): 77-91, 2013 MÉTODO ESTATÍSTICO BAYESIANO DE DADOS DIFUSOS BAYESIAN STATISTICAL METHOD OF FUZZY DATA Péricles César de Araújo1, Sonia Barbosa Camargo Igliori2 1 2 Docente da Universidade Estadual de Feira de Santana, Doutor em Educação Matemática pela Pontifícia Universidade Católica de São Paulo. E-mail: [email protected]. Docente da Programa de Estudos Pós-Graduados em Educação Matemática da Pontifícia Universidade Católica de São Paulo. E-mail: [email protected]. Este artigo tem por tema a investigação sobre a metodologia de pesquisa em Educação Matemática e por foco as questões da variabilidade e da imprecisão dos dados dessa área de investigação. O objetivo, então é apresentar uma proposta metodológica em que se realiza a combinação de métodos com vistas à ampliação do grau de confiabilidade dos resultados das pesquisas. O estudo tem por pressuposto que a variabilidade, aspecto aleatório dos dados, tem sido tradicionalmente analisada por meio de métodos quantitativos utilizando a Estatística Clássica, e a imprecisão tem sido geralmente analisada por meio de métodos qualitativos. O que se propõe aqui é um método misto (quantitativos e qualitativos) com duas alterações fundamentais: a utilização da Estatística Bayesiana para abordar a variabilidade ou aspecto aleatório, e da Lógica dos Conjuntos Difusos para tratar a imprecisão. O resultado, o Método Estatístico Bayesiano Difuso, está em acordo com o que vem sendo discutido pela comunidade da Educação Matemática, da necessidade do uso dos métodos mistos computacionais, possivelmente pelo avanço da computação, e pela exigência do rigor na pesquisa. Palavras chave: Pesquisa em Educação Matemática, Variabilidade e Imprecisão dos Dados, Método Estatístico Bayesiano, Conjuntos Difusos. The theme of this article is the methodologies in Mathematics Education and focuses the questions about the variability and inaccuracy of data in this area of research. The purpose is to seek ways to increase the degree of reliability of the results of research in Mathematics Education. The study is assumed that the variability data of the random aspect, has traditionally been quantitative methods using the Classical Statistics, and has been generally the inaccuracy is analyzed by qualitative methods. What is proposed here is a (quantitative and qualitative) mixed method with two fundamental changes: the use Bayesian Statistics to address the variability or random aspect, and the Logic Fuzzy Sets to treat imprecision. The result, the Bayesian Statistical Method Fuzzy, is in accordance with what has been discussed by the community of Mathematics Education, the need for the use of computational methods mixed, possibly by the advance of computing and the requirement of rigor in research. Keywords: Research in Mathematics Education, Data Variability and Uncertainty, Bayesian Statistical Method, Fuzzy Sets. INTRODUÇÃO Iniciamos destacando vantagens de uma combinação de métodos científicos com vistas à ampliação do grau de confiabilidade dos resultados de pesquisas. Para Strauss e Corbin (2008, p. 40) “a combinação de métodos pode ser feita por razões suplementares, complementares, informativas, de desenvolvimento e outras”. Nós a assumimos por razões de desenvolvimento, e também como possibilidade de obter a complementaridade. A razão de desenvolvimento tem a perspectiva da metáfora conceitual de Lakoff e Johnson (2003) levando-se em consideração as críticas de Otte (2008), e a de complementaridade apoia-se em (Otte, 2003) que a considera adequada devido à variabilidade e imprecisão dos dados da Educação Matemática, sendo a imprecisão decorrente da relação de pertinência definida na Teoria Clássica dos Conjuntos. A perspectiva da metáfora conceitual para o desenvolvimento se justifica, pois, conforme Leite (2010) ocorreu uma notável evolução dessa concepção culminando com o reconhecimento da função epistemológica da metáfora para Ciência e para a Matemática, com está ilustrado na Figura 1. 77 Araújo e Igliori CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 Figura 1: Metáfora e Matemática – distanciamentos e aproximações. Fonte: Leite (2010, p.100). O tratamento da variabilidade, aspecto aleatório dos dados, tem sido tradicionalmente efetivado por meio da Estatística Clássica, e a imprecisão dos dados tem sido geralmente analisada por métodos qualitativos. Neste artigo essas duas condições são abordadas por meio da utilização de métodos mistos (quantitativos e qualitativos) com duas alterações fundamentais: a utilização da Estatística Bayesiana para abordar a variabilidade ou aspecto aleatório, e da Lógica dos Conjuntos Difusos para tratar a imprecisão. A Figura 2, como apresenta Ross (2010, p. 26), citado por Baleeiro (2007, p.7), ilustra de forma comparativa a relação de pertinência elemento/conjunto na Teoria Clássica dos conjuntos (lado esquerdo da Figura) e na Teoria dos Conjuntos Difusos (Fuzzy) (lado direito da Figura). Figura 2: Conjunto Clássico e Conjunto Difuso. Fonte: Ross (2010, p. 26), citado por Baleeiro (2007, p.7). Abar (2010, p. 2) afirma que: “A teoria dos conjuntos ‘fuzzy’ se baseia no fato de que os conjuntos do mundo real não possuem limites precisos”. Essa teoria nasce de forma alternativa à Teoria Clássica de Conjuntos, com a noção de conjunto difuso (fuzzy) e uma relação entre elemento e conjunto de graus de associativismo e não de pertinência, como no caso da Teoria Clássica. A utilização de conjuntos difusos também é feita nas representações artísticas. É o caso do quadro Metamorphosis II, representado na Figura 3, de Maurits Cornelis Escher, um artista gráfico holandês conhecido pelas xilogravuras, litografias e meios-tons. Nesse quadro há exemplos de conjuntos difusos expressos quando nas mudanças de uma ilustração para outra há transição difusa, quando se observa uma mistura da gravura seguinte como a anterior, ou seja, padrões geométricos entrecruzados que se transformam gradualmente em formas completamente diferentes. 78 CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 Método Estatístico Bayesiano... Figura 3: Metamorphosis II e M.C.Escher. Fonte: Hofstadter (1999, p.14). É fato que os pesquisadores, em Educação Matemática, têm ultimamente privilegiado o uso de metodologias qualitativas para analisar conjuntos de dados difusos. A título de exemplo citamos a pesquisa de Zucco (2010) na qual, variáveis linguísticas difusas, isto é, as variáveis “Incorreta”, “Correta” e “Incompleta”, são utilizadas para construção de um índice de acertos por meio de um método qualitativo. No âmbito da Teoria dos Conjuntos Difusos (fuzzy), ou na utilização da Lógica Fuzzy, não se precisa de um valor exato definido por uma variável, como é o caso. A Estatística Bayesiana, que tem como base a definição subjetiva de probabilidade atualizada por meio do Teorema de Bayes, é um suporte teórico para um método quantitativo na análise da variabilidade dos dados que leva em conta os aspectos subjetivos da pesquisa. A Lógica dos Conjuntos Difusos, que tem como base a generalização da relação de pertinência elementos/conjunto, é adequada para tratar a imprecisão dos dados, porque os objetos observados, no âmbito da pesquisa em Educação Matemática, não satisfazem de modo preciso aos critérios de pertinência da Teoria Clássica de Conjuntos. Cada vez mais vem sendo defendido, pela comunidade científica, o uso dos métodos mistos computacionais, possivelmente pelo avanço da computação, e pela exigência do rigor na pesquisa (LESTER JÚNIOR, 2005, p. 67). No que tange à teoria das probabilidades pode-se citar várias interpretações de probabilidades como está detalhado em Araújo e Igliori (2013) no artigo desse mesmo caderno: O Problema Epistemológico da Probabilidade. Entre essas a interpretação de probabilidade por meio da frequência relativa e a probabilidade subjetiva, isto é, o grau subjetivo de crença racional. As pesquisas que utilizam os métodos quantitativos, em Educação Matemática, geralmente, utilizam o paradigma da Estatística Clássica ou Estatística Convencional, baseada na interpretação de probabilidade por meio da frequência relativa. Esse paradigma teve uma grande importância para o avanço da ciência, como afirmam Kins e Andrade (2010, p. 1): O paradigma convencional dominou as análises estatísticas na maior parte do século passado. Em boa medida isto se deve aos brilhantes estatísticos que desenvolveram os seus fundamentos teóricos e os popularizaram nas universidades, criando uma ferramenta poderosa, que foi responsável, por boa parte dos avanços científicos nos últimos 150 anos. 79 Araújo e Igliori CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 No âmbito da pesquisa em Educação Matemática, a importância do paradigma convencional está defendida no artigo de Utsumi et al (1999): “Questões metodológicas dos trabalhos de abordagem quantitativa” apresentados no GT19-ANPED. Nesse artigo é apresentado um inventário de procedimentos estatísticos clássicos ou convencionais. Para nós a Estatística Bayesiana apresenta outra perspectiva para a análise, pois não se atém apenas aos dados, já que ela é baseada na interpretação subjetiva de probabilidade. E dessa forma leva em consideração o ponto de vista do pesquisador, formalizando o ponto de vista de Kant de que o conhecimento nunca se dá de maneira neutra. A LÓGICA DOS CONJUNTOS DIFUSOS E A COMPLEMENTARIDADE ENTRE PROBABILIDADE E GRAU DE ASSOCIATIVIDADE As aplicações operacionais das Teorias Objetivas, (POPPER, 2003 e 1993) estão associadas à Estatística Clássica enquanto as Teorias Subjetivas têm aplicações operacionais nos Métodos Estatísticos Bayesianos (PAULINO et al, 2003). A Estatística Clássica é caracterizada, no âmbito, das Ciências Sociais como um procedimento expresso por fórmulas matemáticas e dados observados; isto é, uma coleção de ferramentas misteriosas. Métodos Estatísticos Bayesianos são fundamentados no Teorema de Bayes que revisa as estimativas de probabilidade inicias. Segundo Lakatos (1999, p. 99), o Método Bayesiano é revolucionário. Os Métodos Estatísticos Bayesianos preservam aspectos de falseacionismo sofisticado ou metodológico, segundo Popper, Lakatos e Gelman, e revisão de probabilidades, segundo Bayes e Kuhn. Os problemas observados, no âmbito das Ciências Humanas, em particular na Educação Matemática, são de natureza inter/transdisciplinar. Portanto há adequação do uso dos Métodos Bayesianos nos tratamentos de problemas com tais caracterizações, possibilitando, assim, responder à questão de relevância científica nas análises, como proposto por Popper, e não tornar a análise estatística somente como uma coleção de ferramentas. Na Lógica Difusa a relação entre elementos e conjuntos (difusos) é estabelecida por meio de graus de associativismo a eles, diferentemente da Teoria Clássica em que a relação entre elementos e conjunto é binária, ou seja, na relação de pertinência, um dado elemento pertence ou não pertence ao conjunto. Na teoria de conjuntos difusos há uma avaliação gradual da pertinência do elemento ao conjunto. A Lógica de Conjunto Difuso, ou simplesmente Lógica Difusa, tem como objetivo representar o pensamento humano, ou seja, uma representação mais aproximada, ou melhor, ligada à linguística e à inteligência humana, porque muitos conceitos são melhores definidos por palavras ou como Zadeh (1995) definiu, variáveis linguísticas. A partir da noção de conjuntos difusos Zadeh vai estender o conceito de probabilidade para um evento difuso (fuzzy). Ele diz que nas experiências do dia a dia com frequência encontram-se situações para as quais um “evento” é antes difuso do que um conjunto de pontos bem delimitados. E exemplifica com os eventos em que há imprecisão nos significados das palavras e, portanto difusos: “É um dia quente” “x é aproximadamente igual a 5”, “em vinte jogadas de uma moeda há mais caras que coroas” (ZADEH, 1968, p.421). Para Zadeh a extensão dos conceitos de evento e probabilidade para os conjuntos difusos alarga o campo de aplicações da teoria das probabilidades. Zadeh (1995) propõe que a Lógica do Conjunto Difuso não é concorrente à Teoria de Probabilidades, mas complementar. 80 CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 Método Estatístico Bayesiano... A noção de complementaridade foi definida em Bohr (1995), ao introduzir a ideia de que a natureza humana é dotada de duas imagens, assim como, a onda e a partícula são consideradas aspectos complementares da matéria. Otte (2003) interpreta essa definição de Bohr no âmbito da Educação Matemática, indicando que a complementaridade faz referencia a símbolos e conceitos, em um duplo sentido, que se reajustam reciprocamente e que se integram para capturar os aspectos essenciais do desenvolvimento cognitivo e epistemológico do conhecimento científico e conceitos matemáticos. Moraes e Torre (2004, p.27) associam a complementaridade levando em conta o princípio da incerteza de Heisenberg quando afirmam: Associando o princípio da incerteza às descobertas relacionadas ao princípio da complementaridade onda/partícula formulado por Niels Bohr, que explicou a natureza complementar da matéria e a existência de superposição de estados quânticos, a física quântica reforçou ainda mais a impossibilidade de se determinar como uma situação experimental se apresentará até o momento da interferência do observador. Descobriu-se que o cientista já não podia distanciar-se do objeto para descrever os mecanismos da natureza e que não era possível se eliminar o observador, mas sim reintegrá-lo em sua intersubjetividade e restabelecer o seu diálogo com a natureza. Neste estudo nos interessa essa perspectiva da complementaridade na combinação de probabilidade com a intensidade de pertinência. Isso porque o universo da pesquisa na Educação Matemática é caracterizado por uma acentuada heterogeneidade, dessa forma, faz sentido uma partição difusa deste universo, em que cada dado, informação ou indivíduo pode ser membro parcial de mais de um subconjunto deste universo (SULEMAN, 2009). Na Lógica dos Conjuntos Difusos define-se a função associativismo, uma função que assume valores no intervalo [0; 1], grau de pertinência. Não se trata de uma probabilidade, representa sim, uma medida matemática da proporção da intensidade de pertinência. No Cálculo de Probabilidade existe a função de densidade de probabilidade que é diferente da função associativismo, porque mede o grau de incerteza de tal pertinência. Outro aspecto diferente, entre a função de densidade de probabilidade e a função de associativismo, do ponto de vista matemático, é que a função de densidade de probabilidade é normalizada, isto é, multiplicada por uma constante, para que a área da região limitada pelo eixo das abscissas e a curva de densidade de probabilidade, seja 1. Com isso, a função f de densidade de probabilidade satisfaz: a) , b) . Definimos a função de densidade de probabilidade e função de associativismo assim: Sejam f a função de densidade probabilidade Normal, definida por Gaussiana, definida por constante e fA a função de associativismo . A função densidade de probabilidade é normalizada pela . As funções f e fA apresentam o mesmo núcleo, a parte principal da função, a parte que permanece quando constantes são desconsideradas (CASELLA e BERGER, 2010, p.58). Exemplos Um conjunto difuso e a sua função de grau de associatividade A: o conjunto difuso dos números reais que são muito maiores do que 1. Pode-se dar uma precisão, embora subjetiva, de uma caracterização de uma fA definida em ; . Os valores respectivos de tal função podem ser: ; ; 81 ; . (ZADEH, 1965, pp. 339-340); ; Araújo e Igliori CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 Uma empresa de imobiliária pretende classificar as casas que disponibiliza aos seus clientes. O indicador de conforto é o número de quartos. Seja o universo de tipologia de o respectivo número de quartos, isto é, uma coleção de objetos (pontos). Assim, o casas e conjunto dos pares ordenados é um conjunto difuso e a função fA é função do grau de associatividade, ou simplesmente função de associativismo. De acordo com a empresa o conjunto difuso “tipologia de conforto para casal com dois filhos” a sua respectiva função do “grau de associatividade” é representado por: Com a análise a empresa considera: uma casa de 4 quartos é ideal para uma família de quatro pessoas, o que é expresso pelo grau de associatividade quartos é superdimensionada com zero. , enquanto que uma casa de sete . Sete quartos é um elemento incompatível, pois o grau é (SULEMAN, 2009, p.41). Observamos que , indicando que não se trata, portanto, de uma probabilidade. Por meio de um gráfico, podemos representar o conjunto difuso A. Assim, o gráfico representado 0.6 0.4 0.0 0.2 G raudeassociatividade 0.8 1.0 pela Figura 4 facilita uma visualização dos dados. 1 2 3 4 5 6 7 Universo(u) Figura 4: Representação do conjunto difuso A. Os autores, por meio do programa R (www.rproject.org). Ragin (2000) considera que a ideia básica, subjascente à lógica fuzzy, é a de permitir o dimensionamento dos escores de adesão o que permite uma adesão parcial ou difusa. Um escore de adesão 1 indica a plena adesão de um elemento a um conjunto; pontuação próxima de 1 (por exemplo, 0,8 ou 0,9) indica a associação forte, mas parcial em um conjunto; pontuação inferior a 0,5 mas superior a 0 (por exemplo, 0,2 e 0,3) indica que os objetos são mais “fora” do que “em” um conjunto, mas ainda elementos mais fracos do conjunto; uma pontuação de 0 indica uma não associação ao conjunto. Assim, a lógica fuzzy combina a avalição qualitativa e quantitativa: 1 e 0 são atribuições qualitativas (“plenamente” e “totalmente fora”, respectivamente); valores entre 0 e 1 (não inclusivo) indicam grau de adesão, uma valiação quantitativa. Para esse pesquisador os cientistas sociais enfrentam um dilema quando realizam pesquisa social quanto ao método de pesquisa diretamente relacionado tanto à profundidade quanto à amplitude do método. Os métodos de pesquisa qualitativos têm a propriedade da 82 CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 Método Estatístico Bayesiano... profundidade, enquanto os métodos quantitativos a propriedade da amplitude. Ele considera que o método de pesquisa etnográfico, um método qualitativo para determinar a dimensão sócio – cultural da Educação Matemática, conforme Gurgel (2012, p.1), é uma estratégia de profundidade. Nesse sentido, por meio da lógica fuzzy, Spagnolo (2003) tenta compreender como é possível analisar e estudar os fenômenos do ensino/aprendizagem da Matemática em situação multiculturais. A ENGENHARIA DIDÁTICA CLÁSSICA E O MÉTODO DA ESTATÍSTICA BAYESIANA A Engenharia Didática um método de pesquisa qualitativo criado no âmbito da pesquisa da Didática da Matemática francesa, foi elaborada numa analogia com o trabalho de um Engenheiro. Isto é: A noção de engenharia didática emergiu em didática da matemática no início dos anos 1980. Tratava-se de etiquetar com esse termo uma forma de trabalho: aquele comparável ao trabalho do engenheiro que, para realizar um projeto preciso, apoia-se sobre os conhecimentos científicos de seu domínio, aceita, submeter-se a um controle de tipo científico, mas, ao mesmo tempo, se encontra obrigado a trabalhar sobre objetos muito mais complexos que os objetos depurados da ciência e, portanto de se atacar, praticamente com todos os meios que ele dispõe problemas que a ciência não deseja ou não pode ainda se encarregar. (ARTIGUE, 1988, p. 283). Em Araújo e Igliori (2009) é apresentado um exemplo de método de pesquisa misto como agregação de um método quantitativo ao método qualitativo da Engenharia Didática. O método quantitativo utilizado foi o representado pelo Teste Wilcoxon (antes e depois) da Estatística Não Paramétrica da Estatística Clássica. Essa agregação foi feita ao utilizando a função wilcox.tes, um algoritmo presente no programa livre R (www.r-project.org). Observamos que a definição de Engenharia Didática utilizada em Araújo e Igliori (2009) é a “Engenharia Didática Clássica (amplamente conhecida) ou também denominada Engenharia Didática de 1ª Geração” (ALMOULOUD e SILVA, 2012, p. 22). Neste artigo se pretende aprimorar o estudo introduzindo como método quantitativo Bayesiano acrescido da utilização da Lógica Fuzzy. E para isso os autores tomam a Engenharia Didática Clássica como uma metáfora conceitual do Método Estatístico Bayesiano, conforme: [...] metáfora na Matemática e na Educação Matemática, partindo da premissa de que muitas equações A=B são metáforas, isto é, são construções teóricas somente possíveis de serem concebidas a partir de uma perspectiva particular e inusitada de estabelecimento de semelhança entre desiguais, de modo que a criatividade matemática consiste em representar um objeto A como um outro objeto B para, desta maneira, resolver um problema. Discutir a representação e comunicação com foco na metáfora pode contribuir para uma compreensão diferente de como se desenvolvem as idéias matemáticas, as particularidades de sua gênese, e particularmente o modo como se dá a intercomunicação de tais idéias em contextos educativos. (LEITE, 2010, p.87). E buscamos, no que segue, justificar essa condição de metáfora, destacando alguns elementos essenciais dos fundamentos da Estatística Bayesiana. A Estatística Bayesiana é uma teoria que tem como base a definição subjetiva de probabilidade que é atualizada por meio do Teorema de Bayes (BAYES, 1958). O Teorema de Bayes para variáveis aleatórias discretas por Bussab e Morettin (2002, p.311) se estabelece como: Suponha que valores com probabilidades a priori tenha os ; independente da experiência ou das informações dos dados obsevados. Chamamos de a nova informação sobre , que é obtida de um modelo discreto. Então o teorema de Bayes pode ser escrito: 83 Araújo e Igliori CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 , Então, temos que . é uma constante de normalização, e as verossimilhanças , e as dependentes da experiência ou das informações dos dados observados são probabilidades a posteriori determinadas pelo teorema de Bayes são essa distribuição a posteriori de estimar , dada a nova informação da observação . Obtida , podemos, por exemplo, como sendo a média dessa distribuição ou a moda (o valor que maximiza ). Schoner (2000) observa que Immanuel Kant (1724-1804) nunca chegou a conhecer Thomas Bayes (1702-1761), e certamente não chegou a conhecer o Teorema de Bayes (1763), nem também, Thomas Bayes escreveu sobre epistemologia, isto é, tomar a ciência como objeto de investigação ou criticar o conhecimento científico. No entanto, no livro “Crítica da Razão Pura” publicado pela primeira vez em 1781, Kant (2010, p. 36 e 37) afirma que: Se, porém, todo o conhecimento se inicia com a experiência isso não prova que todo ele derive da experiência. Pois bem poderia o nosso próprio conhecimento por experiência ser um composto do que recebemos através das impressões sensíveis e daquilo que a nossa própria capacidade de conhecer (apenas posta em ação por impressões sensíveis) produz por si mesma, acréscimo esse que não distinguimos dessa matéria-prima, enquanto a nossa atenção não despertar por um longo exercício que nos torne aptos a separá-los. Há pois, pelo menos, uma questão que carece de um estudo mais atento e que não se resolve à primeira vista; ser esta: se haverá um conhecimento assim, independente da experiência e de todas as impressões dos sentidos. Denomina-se a priori esse conhecimento e distingue-se do empírico, cuja origem é a a posteriori, ou seja, na experiência. (apud SCHONER, 2000, p.16). Schoner (2000) afirma que Kant expressa uma ideia muito semelhante a de Bayes, na medida em que postula que tem de haver alguma habilidade a priori, intelectual ou conhecimento, a fim de adquirir novos conhecimentos a partir da observação. A Estatística Bayesiana é um método quantitativo para analisar a variabilidade de dados levando em conta o aspecto subjetivo. Kins e Andrade (2010, p.1) apresentam uma comparação entre o Método Estatístico Bayesiano ou o paradigma bayesiano com o paradigma convencional ou Método da Estatística Clássica: Diferentemente da estatística convencional, em que somente se admite probabilidade num contexto restrito a fenômenos que podem ser medidos por frequências relativas, no paradigma bayesiano entende-se que probabilidade é uma medida racional e condicional de incerteza. Uma medida do grau de plausibilidade de proposições quaisquer, as quais não precisam necessariamente estar associadas a fenômenos medidos por frequência relativa. Do ponto de vista de Gelman (2011) a abordagem clássica ou frequentista da Estatística, em que a inferência é centrada nos testes de hipóteses, está associada a uma filosofia em que a ciência é dedutiva e segue a doutrina de Popper de falsificação. Popper fez objeções ao paradigma bayesiano por conta da intepretação subjetiva de probabilidade, mas, como afirma Hammerton (1968), Popper estava enganado, porque o paradigma bayesiano está de acordo com a espistemologia científica dele, pricipalmente, “a de que uma hipótese deve ser testável” (HAMMERTON, 1968, p. 111). A esse respeito, Bussab e Morettin (2002, p.310) afirmam que: 84 CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 Método Estatístico Bayesiano... A crítica que se faz à teoria frequentista é a possibilidade de ‘replicar dados’, bem como o recurso à teoria assintótica. Uma teoria que não faz uso de tais argumentos é a inferência bayesiana, cujos fundamentos foram estabelecidos por Thomas Bayes em 1763. Outros expoentes dessa corrente foram Bernoulli (1713), Laplace (1812) e Jeffreys (1939). A inferência bayesiana é comumente associada ao raciocínio indutivo e à ideia de que um modelo pode ser destronado por um modelo concorrente, mas nunca pode ser diretamente falsificada por um teste de significância. Gelman (2011) considera incorretos os argumentos que fazem associações da inferência bayesiana só ao raciocínio indutivo, o que foi prejudicial à prática da Estatística Bayesiana. Por meio de sua experiência, no uso e desenvolvimento de Métodos Bayesianos na área social e ciências ambientais, Gelman (2011) tem encontrado maneiras para verificação do modelo e falsificação, segundo Popper. A distribuição a priori e a distribuição a posteriori são os fundamentos do Método Bayesiano. Assim como análise a priori e análise a posteriori são os fundamentos da Engenharia Didática Clássica. Também, podemos observar as considerações sobre análise a priori e análise a posteriori, segundo Almouloud, respectivamente: O objetivo de uma análise a priori é determinar como as escolhas efetuadas (as variáveis que queremos admitir como pertinentes) permitem controlar os comportamentos dos alunos e explicar seu sentido. A análise a posteriori de uma sessão é o conjunto de resultados que se pode tirar da explicação dos dados recolhidos e que contribui para a melhoria dos conhecimentos didáticos que se têm sobre as condições da transmissão do saber em jogo. Ela não é a crônica da classe, mas uma análise feita à luz da análise a priori, dos fundamentos teóricos, das hipóteses e da problemática da pesquisa [...]. (ALMOULOUD, 2007, p.175-177). O aspecto subjetivo dos dois paradigmas, Método Bayesiano e Engenharia Didática Clássica, como os seus fundamentos de distribuição a priori e distribuição a posteriori e análise a priori e análise a posteriori, respectivamente, são elementos semelhantes nos dois métodos. No âmbito da Estatística Bayesiana, há criticas ao Método Bayesiano Empírico porque se trata de um método que utiliza dados empíricos para determinar a distribuição a priori, informações externas. Como afirma Artigue (1988), a validação da Engenharia Didática Clássica é essencialmente interna, fundada no confronto da análise a priori da análise a posteriori. Nesse sentido a Engenharia Didática, também, critica o uso do método empírico. A Engenharia Didática Clássica expressa uma ideia que está de acordo com os argumentos de Kant, assim como Kant expressa uma ideia muito semelhante aos argumentos de Bayes, como afirma Schoner (2000). Portanto, há um vínculo de similaridade semântica entre os fundamentos do Método Bayesiano e da Engenharia Didática Clássica. Nesse sentido, consideramos que a Engenharia Didática Clássica é uma metáfora conceitual segundo o que apresenta Leite (2010, p. 71-72): Nesse sentido, segundo a teoria da metáfora conceitual, ‘a essência da metáfora é compreender e experienciar uma coisa em termos de outra’ (LAKOFF & JOHNSON, 2002, p. 48) a partir de uma rede conceitual, que lembra um mapeamento ou um morfismo entre coisas distintas. Assim, observamos que a Engenharia Didática Clássica, com relação ao Método Bayesiano, é uma metáfora conceitual porque a Engenharia Didática Clássica é potencial heurístico, pois pode agregar aspectos da inferência do Método Bayesiano, no sentido de Leite (2010, p. 58), quando observa: “[...] potencial heurístico proporciona à metáfora uma importância cognitiva, visto que ela se torna relevante para a geração de um novo conhecimento”. 85 Araújo e Igliori CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 Os aspectos subjetivos dos dois métodos nos remetem à teoria do conhecimento de Kant, que o conhecimento nunca se dá de maneira neutra, como afirma Silveira (2002, p. 28): A teoria do conhecimento de Kant – a filosofia transcendental ou idealismo transcendental – teve como objetivo justificar a possibilidade do conhecimento científico dos séculos XVII e XVIII. Ela partiu da constatação de que nem o empirismo britânico, nem o racionalismo continental explicavam satisfatoriamente a ciência. Kant mostrou que, apesar de o conhecimento se fundamentar na experiência, esta nunca se dá de maneira neutra, pois a ela são impostas as formas a priori da sensibilidade e do entendimento, características da cognição humana. E também remetem a Popper (2006) quando se refere à procura de padrões de regularidade em pesquisa, correspondente à ideia de casualidade de Kant, ou seja: Esta expectativa inconsciente de encontrar padrões de regularidade, que é psicologicamente a priori, corresponde muito aproximadamente à lei da casualidade, que Kant acreditava fazer parte do nosso aparelho mental e ser a priori válida. Poderíamos, assim, sentir-nos inclinados a dizer que Kant não soube distinguir entre formas psicologicamente a priori de pensar ou reagir e crenças válidas a priori. Mas eu não creio que o seu erro tenha sido crasso. E isso na medida em que a expectativa de encontrar padrões de regularidade não é só psicologicamente a priori, mas também logicamente a priori: é logicamente anterior a toda a expectativa de observação, dado que é, tal como vimos, anterior a qualquer reconhecimento de semelhança; e toda observação envolve o reconhecimento de semelhanças (ou dessemelhanças). (POPPER, 2006, p.74). Assumindo-se a condição da Engenharia Didática Clássica como metáfora ao Método Estatístico Bayesiano, complementamos com a adoção da Lógica Fuzzy como meio de abordagem da imprecisão dos dados. MÉTODO ESTATÍSTICO BAYESIANO E A LÓGICA DOS CONJUNTOS DIFUSOS Neste estudo vamos propor a análise da imprecisão dos dados por meio da Lógica dos Conjuntos Difusos. Para isso, considerando Viertl (2011), por meio do argumento do Método Estatístico Bayesiano com Dados Difusos, podemos atualizar a probabilidade condicional P(t/e) de Popper, agregando a probabilidade subjetiva e grau de pertinência entre os elementos de um conjunto. Assim, corrigindo o erro de Popper, é proposta uma solução alternativa ao grau de corroboração, isto é, grau de pertinência por meio do Teorema de Bayes. Na Figura 5 é apresentado um mapa conceitual referente ao percurso feito neste estudo. Esse mapa foi construído por meio do programa ATLAS.ti (http://www.atlasti.com/index.html). Ele expressa as respostas às questões que surgiram antes e durante o desenvolvimento da pesquisa. 86 CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 Método Estatístico Bayesiano... Figura 5: Mapa conceitual referente ao percurso feito no estudo. Fonte: Os autores - programa ATLAS.ti. Exemplos de Aplicação As aplicações da Lógica do Conjunto Difuso e do Método Estatístico Bayesiano têm sido observadas em várias áreas do conhecimento. Apresentaremos a seguir alguns exemplos de aplicação. Ragin (2000) considera que as declarações teóricas em pesquisa social, na maioria das vezes podem ser formuladas como declarações sobre conjuntos. Os métodos qualitativos e quantitativos têm como propriedades a profundiade e amplitude, respectivamente. Ragin (2000) observa que há um meio termo entre elas e propôs uso de Lógica Difusa ou conjuntos difusos como um caminho alternativo para análise de dados observados em pesquisas das Ciências Sociais. Spagnolo (2003) tenta compreender como é possível analisar e estudar os fenômenos do ensino/aprendizagem da Matemática em situações multicuturais. Spagnolo e Gras (2004) propõem a utilização da Lógica Difusa no âmbito da Análise Estatística Implicativa. No préfacio da edição digital do 5º Colóquio da A.S.I. (Analyse Statistique Implicative) é respondida a seguinte pergunta: Análise Estatística Implicativa: uma vez mais, o que é? Na busca da essência da questão da origem do desenvolvimento da Análise Estatística Implicativa, Régis Gras e Jean-Claude Régnier consideram que ‘neste momento (ela) designa um campo teórico central sobre o conceito da implicação estatística ou mais precisamente sobre o conceito de quase – implicação para destingi-la da implicação da lógica de domínio da lógica e da matemática. O estudo da concepção de quase – 87 Araújo e Igliori CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 implicação e tanto um objeto matemático, dentro de campo das probabilidades e da estatística, que permitem construir os objetos teóricos que instrumentalizam um método de análise de dados’ (GRAS et al 2009, p. 6 apud RÉGNIER et al, 2010, p. 4). Spagnolo e Gras (2004) consideram importante tornar adequada a Análise Estatística Implicativa a uma nova epistemologia por meio da representação implicação fuzzy. Essa nova perspectiva está implementada no software CHIC 3.1. Análise Estatística Implicativa é um método de classificação de dados fundamentada na Estatística Clássica. Assim, a variabilidade, o aspecto aleatório da incerteza, no âmbito da Análise Estatística Implicativa, segue a abordagem da Estatística Clássica. A Estatística Clássica está fundamentada na interpretação de probabilidade por meio da frequência relativa. Por outro lado, Spagnolo e Gras (2004) propõem utilizar a implicação fuzzy na imprecisão dos dados, o aspecto difuso da incerteza. Portanto, software CHIC 3.1 utiliza a Estatística Clássica e a implicação fuzzy para fazer a classificação dos dados por meio de árvores de classificação e grafos de implicação. Suleman (2009) expõe duas aplicações do Método Estatístico Bayesiano com Dados Difusos, utilizando a Análise Bayesiana Empírica para dados observados em Portugal. Já foi observado que há criticas ao Método Bayesiano Empírico porque é um método que utiliza dados empíricos para determinar a distribuição a priori. Mas, alguns pesquisadores, como Suleman (2009), utilizam a Análise Bayesiana Empírica pela facilidade computacional por conta do software GoM desenvolvido pela DSISOFT (www.dsisoft.com). As duas aplicações apresentadas por Suleman (2009, p. 213-259) são: acidentes domésticos e perfis de competência bancária. A competência bancária é exemplo que apresenta alguma relação com a pesquisa em Educação Matemática devido à variável Grau de Escolaridade. A variável, Grau de Escolaridade, comporta três categorias: 1 - “Formação inferior ao 12º ano”; 2 - “Formação igual ao 12º ano”; 3 - “Formação superior ao 12º ano”. Assim, o universo é então particionado em três classes caracterizadas inicialmente pela formação acadêmica dos seus membros. Suleman (2009, p. 258) afirma que: Os dados analisados não são conclusivos quanto a Educação como promotora de competências. Os aspectos relativos ao papel da instituição no aproveitamento de capacidades não puderam ser contabilizados. O debate entre qualificação e competência mantém assim toda a atualidade. CONSIDERAÇÕES FINAIS A combinação de métodos não é novidade. Mas o que torna a proposta apresentada neste artigo inédita é o fato de tratar o problema no âmbito da pesquisa em Educação Matemática por meio da sua própria linguagem, a Matemática, utilizando as mais novas ferramentas, a Lógica dos Conjuntos Difusos e o Método da Estatística Bayesiana. Nesta proposta se considera o aspecto dual dos dados observados no âmbito da pesquisa em Educação Matmática, isto é, a variabilidade e a imprecisão dos dados. Com isso, a Lógica dos Conjuntos Difusos e o Método da Estatística Bayesiana podem agregar aspectos quantitativos aos métodos qualitativos que são utilizados na pesquisa dos fenômenos ou problemas reais da Educação Matemática, problemas caracterizados por representações epistemológicas, histórico-epistemológicas e comportamentais. Por conseguinte, o Método Estatístico Bayesiano é uma boa prática estatística que tem interseção com as ideias de Popper, Kuhn e Lakatos. Com esta proposta pensamos contribuir com a melhoria da confiabilidade dos resultados da pesquisa em Educação Matemática. 88 CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 Método Estatístico Bayesiano... REFERÊNCIAS BIBLIOGRÁFICAS ABAR, C. A. A. P. O conceito Fuzzy. Disponível em: <http://www.pucsp.br/~logica/Fuzzy.htm>. Acesso em: 22/10/2010. ALMOULOUD, S. A. e SILVA, M. J. F. Engenharia didática: evolução e diversidade. R. Eletr. de Edu. Matem., v.07, n.2, p.22-52, Florianópolis, 2012. ALMOULOUD, S. A. Fundamentos da didática da matemática. Ed. UFPR, 2007. ARAÚJO, P. C.; IGLIORI, S. B. C. O Problema Epistemológico da Probabilidade. Caderno de Física da UEFS, Vol. 11 (01 e 02), p 57-75, Feira de Santana, 2013. ARAÚJO, P. C.; IGLIORI, S. B. C. Engenharia Didática como uma Estatística Não-Paramétrica. Caderno de Física da UEFS, Vol. 07 (01 e 02), p 133-142, Feira de Santana, 2009. ARTIGUE, M. Ingénierie didactique. Recherches en Didactique des Mathématiques. La Pensée Sauvage, Grenoble, v. 9, n. 3, p. 281-307, 1988. BALEEIRO, G. B. Modelagem neuro-fuzzy estimativa de volume de eucalytus sp. Monografia, Departamento de Ciências da Computação. UFLA - Universidade Federal de Lavras, Lavras, 2007. BAYES, T. An essay towards solving a problem in the doctrine of chances. Phil. Trans. Roy. Soc., 53, 370-418, 54, 296-325, reprinted in Biometrika, 45, 293-315, 1958. BOHR, N. Física atômica e conhecimento humano: ensaios 1932-1957. Rio de Janeiro, Contraponto Editora LTDA, 1995. BUSSAB, W. O. e MORETTIN, P. A. Estatística Básica. Editora Saraiva, 5ª Edição. São Paulo. 2002. CASELLA, G.; BERGER, R. L. Inferência Estatística. Tradução Solange A. Visconte. São Paulo: Cengage Learning, 2010. GELMAN, A. Induction and Deduction in Bayesian Data Analysis. Special Topic: Statistical Science and Philosophy of Science. Edited by Deborah G. Mayo, Aris Spanos and Kent W. Staley. RMM Vol. 2, 67–78, 2011. GURGEL, C. M. A. Pesquisa etnográfica e educação matemática: processo, contextualização e construção. http://www.periodicos.udesc.br/index.php/linhas/article/viewFile/1257/1069. Acesso em 04/08/2012. 89 Araújo e Igliori CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 HAMMERTON, M. Bayesian Statisties and Popper’s Epistemology. Oxford University Press on behalf of the Mind Association. Mind, New Series, Vol. 77, No. 305 (Jan., 1968), pp. 109-112. http://www.jstor.org/stable/2252603. Acesso em 22/08/2012. HOFSTADTER, D. R. Gödel, Escher, Bacher: an Eternal Golden Braid. New York: Basic Books, 1999. KANT, I. Crítica da Razão Pura. Tradução baseada no original alemão intitulado KRITIK DER REINEN VERNUNFT, Edição da Fundação Calouste Gulbenkian, Lisboa, 2010. KINS, P. G. e ANDRADE, H. A. Introdução à análise bayesiana (com R). Ed. maisQnada, Porto Alegre, 2010. LAKATOS, I. The methodology of scientific research programmes. Philosophical Papers, Volume I, Cambridge University Press, Paperback edition, Cambridge, 1999. LAKOFF, G. & JOHNSON, M. Metaphors: We Live By. Chicago: University of Chicago Press, 1980. LESTER JÚNIOR, F. The place of theory in Mathematics Education research. Bloomington: Indiana University, 2005. p. 172-178. LEITE, K. G. Metáfora e Matemática: A contingência em uma disciplina escolar considerada exata. 2010, 135 f. Dissertação (Mestrado em Educação) Programa de Pós-Graduação em Educação do Instituto de Educação da Universidade Federal de Mato Grosso, Cuiabá, 2010. MORAES, M. C. e TORRE, S. Sentir pensar: Fundamentos e estratégias para reencantar a educação. Editora Vozes, Petrópolis, RJ, 2004. OTTE, M. Complementarity, Set and Numbres. Educational Studies in Mathematics, 53: 203-228, Printed in the Netherlands: Kluwer Academic Publisher, 2003. OTTE, M. F. Metaphor and Contingency. In: RADFORD, L.; SCHUBRING, G.; SEEGER, F. (Orgs.). Semiotics in Mathematics Education: Epistemology, History, Classroom, and Culture. Rotterdam: Sense Publishers, 2008. PAULINO, C. D.; TURKMAN, M. A. A.; MURTEIRA, B. Estatística Bayesiana. F. Calouste Gulbenkian, 2003. POPPER, K. A Lógica da Pesquisa Científica. Editora Cultrix, São Paulo-SP, 1993. POPPER, K. Conjecturas e Refutações. Tradução de Benedita Bettencourt. Coimbra: Livraria Almedina, 2006. RAGIN, C. C. Fuzzy-set social science. Chicago: University of Chicago Press, 2000. 90 CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013 Método Estatístico Bayesiano... RÉGNIER, Jean-Claude; GRAS, R.; BAILLEUL, M. 6º Colóquio Internacional sobre Análise Estatística Implicativa - A.S.I. Caen (França), 2010. https://sites.univ- lyon2.fr/asi6/lang/br/Appel_ASI6_PT_BR.pdf. Acesso em 15/08/2012. SCHONER, B. Probabilistic Characterization and Synthesis of Complex Driven Systems. Doctor of Philosophy, MIT, 2000. SILVEIRA, F. L. A Teoria do Conhecimento de Kant: O Idealismo Transcendental. Caderno Brasileiro de Ensino de Física, v.19, p. 28-51, Florianópolis, 2002. SPAGNOLO, F. Fuzzy Logic, Fuzzy Thinking and the teaching/learning of mathematics in multicultural situations. The Mathematics Education into the 21º Conference and the Undecidable in Mathematics Education Brno, Czech Republic, September 2003. SPAGNOLO, F.; GRAS, R. A. New approach in Zadeh’s classification: fuzzy implication through statistic implication. In NAFIPS-IEEE 3rd Conference of the North American Fuzzy Information Processing Society, p. 425-429, June 2004. STRAUSS, A. e CORBIN, J. Pesquisa qualitativa: Técnicas e procedimentos para o desenvolvimento de teoria fundamentada. Tradução Luciane de Oliveira da Rocha. 2ª Ed. Artmed, Porto Alegre, 2008. SULEMAN, A. Abordagem Estatística de Conjuntos Difusos. Edições Sílabo, Lisboa, 2009. UTSUMI, M. C.; CAZORLA, I. M.; VENDRAMINI, C. M. M.; e MENDES, C. R. Questões metodológicas dos trabalhos de abordagem quantitativa apresentado no GT19-ANPED. Educação Matemática e Pesquisa: Revista do Programa de Estudos Pós-Graduação em Educação Matemática/PUC-SP, São Paulo-SP, 1999. VIERTL, R. Statistical methods for fuzzy data. John Wiley & Sons, New Delhi, India, 2011. ZADEH, L. A. Discussion: Probability Theory and Fuzzy Logic Are Complementary Rather Than Competitive. Technometrics, 37, 271–276, 1995. ZADEH, L. A. Fuzzy sets. Inf Control, 8:338-53, 1965. ZADEH, L. A. Probability measures and fuzzy events. J.Math. Anal Appl, 23:421-7, 1968. ZUCCO, J. Funções Monotônicas: Alunos da 3ª série do ensino médio frente às Olimpíadas de Matemática das escolas públicas. 2010, 117 f. Dissertação ( Mestrado Profissional em Ensino de Matemática) – Programa de Pós-Graduação em Educação Matemática, Pontifícia Universidade Católica de São Paulo, 2010. 91
Documentos relacionados
Clique Aqui Para Baixar o Arquivo
componentes da teoria dos Conjuntos Fuzzy, a função de pertinência e as variáveis linguísticas.
Leia mais