método estatístico bayesiano de dados difusos

Transcrição

método estatístico bayesiano de dados difusos
CADERNO DE FÍSICA DA UEFS 11 (01 E 02): 77-91, 2013
MÉTODO ESTATÍSTICO BAYESIANO DE DADOS DIFUSOS
BAYESIAN STATISTICAL METHOD OF FUZZY DATA
Péricles César de Araújo1, Sonia Barbosa Camargo Igliori2
1
2
Docente da Universidade Estadual de Feira de Santana, Doutor em Educação Matemática pela Pontifícia
Universidade Católica de São Paulo. E-mail: [email protected].
Docente da Programa de Estudos Pós-Graduados em Educação Matemática da Pontifícia Universidade Católica de
São Paulo. E-mail: [email protected].
Este artigo tem por tema a investigação sobre a metodologia de pesquisa em Educação Matemática e por foco as
questões da variabilidade e da imprecisão dos dados dessa área de investigação. O objetivo, então é apresentar uma
proposta metodológica em que se realiza a combinação de métodos com vistas à ampliação do grau de confiabilidade
dos resultados das pesquisas. O estudo tem por pressuposto que a variabilidade, aspecto aleatório dos dados, tem sido
tradicionalmente analisada por meio de métodos quantitativos utilizando a Estatística Clássica, e a imprecisão tem
sido geralmente analisada por meio de métodos qualitativos. O que se propõe aqui é um método misto (quantitativos
e qualitativos) com duas alterações fundamentais: a utilização da Estatística Bayesiana para abordar a variabilidade
ou aspecto aleatório, e da Lógica dos Conjuntos Difusos para tratar a imprecisão. O resultado, o Método Estatístico
Bayesiano Difuso, está em acordo com o que vem sendo discutido pela comunidade da Educação Matemática, da
necessidade do uso dos métodos mistos computacionais, possivelmente pelo avanço da computação, e pela exigência
do rigor na pesquisa.
Palavras chave: Pesquisa em Educação Matemática, Variabilidade e Imprecisão dos Dados, Método Estatístico
Bayesiano, Conjuntos Difusos.
The theme of this article is the methodologies in Mathematics Education and focuses the questions about the
variability and inaccuracy of data in this area of research. The purpose is to seek ways to increase the degree of
reliability of the results of research in Mathematics Education. The study is assumed that the variability data of the
random aspect, has traditionally been quantitative methods using the Classical Statistics, and has been generally the
inaccuracy is analyzed by qualitative methods. What is proposed here is a (quantitative and qualitative) mixed
method with two fundamental changes: the use Bayesian Statistics to address the variability or random aspect, and
the Logic Fuzzy Sets to treat imprecision. The result, the Bayesian Statistical Method Fuzzy, is in accordance with
what has been discussed by the community of Mathematics Education, the need for the use of computational methods
mixed, possibly by the advance of computing and the requirement of rigor in research.
Keywords: Research in Mathematics Education, Data Variability and Uncertainty, Bayesian Statistical Method,
Fuzzy Sets.
INTRODUÇÃO
Iniciamos destacando vantagens de uma combinação de métodos científicos com vistas à
ampliação do grau de confiabilidade dos resultados de pesquisas.
Para Strauss e Corbin (2008, p. 40) “a combinação de métodos pode ser feita por razões
suplementares, complementares, informativas, de desenvolvimento e outras”. Nós a assumimos por
razões de desenvolvimento, e também como possibilidade de obter a complementaridade.
A razão de desenvolvimento tem a perspectiva da metáfora conceitual de Lakoff e Johnson (2003)
levando-se em consideração as críticas de Otte (2008), e a de complementaridade apoia-se em (Otte,
2003) que a considera adequada devido à variabilidade e imprecisão dos dados da Educação Matemática,
sendo a imprecisão decorrente da relação de pertinência definida na Teoria Clássica dos Conjuntos.
A perspectiva da metáfora conceitual para o desenvolvimento se justifica, pois, conforme Leite
(2010) ocorreu uma notável evolução dessa concepção culminando com o reconhecimento da função
epistemológica da metáfora para Ciência e para a Matemática, com está ilustrado na Figura 1.
77
Araújo e Igliori
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
Figura 1: Metáfora e Matemática – distanciamentos e aproximações. Fonte: Leite (2010, p.100).
O tratamento da variabilidade, aspecto aleatório dos dados, tem sido tradicionalmente efetivado
por meio da Estatística Clássica, e a imprecisão dos dados tem sido geralmente analisada por métodos
qualitativos. Neste artigo essas duas condições são abordadas por meio da utilização de métodos mistos
(quantitativos e qualitativos) com duas alterações fundamentais: a utilização da Estatística Bayesiana para
abordar a variabilidade ou aspecto aleatório, e da Lógica dos Conjuntos Difusos para tratar a imprecisão.
A Figura 2, como apresenta Ross (2010, p. 26), citado por Baleeiro (2007, p.7), ilustra de forma
comparativa a relação de pertinência elemento/conjunto na Teoria Clássica dos conjuntos (lado esquerdo
da Figura) e na Teoria dos Conjuntos Difusos (Fuzzy) (lado direito da Figura).
Figura 2: Conjunto Clássico e Conjunto Difuso. Fonte: Ross (2010, p. 26), citado por Baleeiro
(2007, p.7).
Abar (2010, p. 2) afirma que: “A teoria dos conjuntos ‘fuzzy’ se baseia no fato de que os conjuntos
do mundo real não possuem limites precisos”. Essa teoria nasce de forma alternativa à Teoria Clássica de
Conjuntos, com a noção de conjunto difuso (fuzzy) e uma relação entre elemento e conjunto de graus de
associativismo e não de pertinência, como no caso da Teoria Clássica. A utilização de conjuntos difusos
também é feita nas representações artísticas. É o caso do quadro Metamorphosis II, representado na
Figura 3, de Maurits Cornelis Escher, um artista gráfico holandês conhecido pelas xilogravuras,
litografias e meios-tons. Nesse quadro há exemplos de conjuntos difusos expressos quando nas mudanças
de uma ilustração para outra há transição difusa, quando se observa uma mistura da gravura seguinte
como a anterior, ou seja, padrões geométricos entrecruzados que se transformam gradualmente em formas
completamente diferentes.
78
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
Método Estatístico Bayesiano...
Figura 3: Metamorphosis II e M.C.Escher. Fonte: Hofstadter (1999, p.14).
É fato que os pesquisadores, em Educação Matemática, têm ultimamente privilegiado o uso de
metodologias qualitativas para analisar conjuntos de dados difusos. A título de exemplo citamos a
pesquisa de Zucco (2010) na qual, variáveis linguísticas difusas, isto é, as variáveis “Incorreta”, “Correta”
e “Incompleta”, são utilizadas para construção de um índice de acertos por meio de um método
qualitativo. No âmbito da Teoria dos Conjuntos Difusos (fuzzy), ou na utilização da Lógica Fuzzy, não se
precisa de um valor exato definido por uma variável, como é o caso.
A Estatística Bayesiana, que tem como base a definição subjetiva de probabilidade atualizada por
meio do Teorema de Bayes, é um suporte teórico para um método quantitativo na análise da variabilidade
dos dados que leva em conta os aspectos subjetivos da pesquisa. A Lógica dos Conjuntos Difusos, que
tem como base a generalização da relação de pertinência elementos/conjunto, é adequada para tratar a
imprecisão dos dados, porque os objetos observados, no âmbito da pesquisa em Educação Matemática,
não satisfazem de modo preciso aos critérios de pertinência da Teoria Clássica de Conjuntos.
Cada vez mais vem sendo defendido, pela comunidade científica, o uso dos métodos mistos
computacionais, possivelmente pelo avanço da computação, e pela exigência do rigor na pesquisa
(LESTER JÚNIOR, 2005, p. 67).
No que tange à teoria das probabilidades pode-se citar várias interpretações de probabilidades
como está detalhado em Araújo e Igliori (2013) no artigo desse mesmo caderno: O Problema
Epistemológico da Probabilidade. Entre essas a interpretação de probabilidade por meio da frequência
relativa e a probabilidade subjetiva, isto é, o grau subjetivo de crença racional. As pesquisas que utilizam
os métodos quantitativos, em Educação Matemática, geralmente, utilizam o paradigma da Estatística
Clássica ou Estatística Convencional, baseada na interpretação de probabilidade por meio da frequência
relativa. Esse paradigma teve uma grande importância para o avanço da ciência, como afirmam Kins e
Andrade (2010, p. 1):
O paradigma convencional dominou as análises estatísticas na maior parte do século
passado. Em boa medida isto se deve aos brilhantes estatísticos que desenvolveram os
seus fundamentos teóricos e os popularizaram nas universidades, criando uma
ferramenta poderosa, que foi responsável, por boa parte dos avanços científicos nos
últimos 150 anos.
79
Araújo e Igliori
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
No âmbito da pesquisa em Educação Matemática, a importância do paradigma convencional está
defendida no artigo de Utsumi et al (1999): “Questões metodológicas dos trabalhos de abordagem
quantitativa” apresentados no GT19-ANPED. Nesse artigo é apresentado um inventário de procedimentos
estatísticos clássicos ou convencionais. Para nós a Estatística Bayesiana apresenta outra perspectiva para
a análise, pois não se atém apenas aos dados, já que ela é baseada na interpretação subjetiva de
probabilidade. E dessa forma leva em consideração o ponto de vista do pesquisador, formalizando o ponto
de vista de Kant de que o conhecimento nunca se dá de maneira neutra.
A LÓGICA DOS CONJUNTOS DIFUSOS E A COMPLEMENTARIDADE ENTRE
PROBABILIDADE E GRAU DE ASSOCIATIVIDADE
As aplicações operacionais das Teorias Objetivas, (POPPER, 2003 e 1993) estão associadas à
Estatística Clássica enquanto as Teorias Subjetivas têm aplicações operacionais nos Métodos Estatísticos
Bayesianos (PAULINO et al, 2003). A Estatística Clássica é caracterizada, no âmbito, das Ciências
Sociais como um procedimento expresso por fórmulas matemáticas e dados observados; isto é, uma
coleção de ferramentas misteriosas.
Métodos Estatísticos Bayesianos são fundamentados no Teorema de Bayes que revisa as
estimativas de probabilidade inicias. Segundo Lakatos (1999, p. 99), o Método Bayesiano é
revolucionário. Os Métodos Estatísticos Bayesianos preservam aspectos de falseacionismo sofisticado ou
metodológico, segundo Popper, Lakatos e Gelman, e revisão de probabilidades, segundo Bayes e Kuhn.
Os problemas observados, no âmbito das Ciências Humanas, em particular na Educação Matemática, são
de natureza inter/transdisciplinar. Portanto há adequação do uso dos Métodos Bayesianos nos tratamentos
de problemas com tais caracterizações, possibilitando, assim, responder à questão de relevância científica
nas análises, como proposto por Popper, e não tornar a análise estatística somente como uma coleção de
ferramentas.
Na Lógica Difusa a relação entre elementos e conjuntos (difusos) é estabelecida por meio de graus
de associativismo a eles, diferentemente da Teoria Clássica em que a relação entre elementos e conjunto é
binária, ou seja, na relação de pertinência, um dado elemento pertence ou não pertence ao conjunto. Na
teoria de conjuntos difusos há uma avaliação gradual da pertinência do elemento ao conjunto. A Lógica
de Conjunto Difuso, ou simplesmente Lógica Difusa, tem como objetivo representar o pensamento
humano, ou seja, uma representação mais aproximada, ou melhor, ligada à linguística e à inteligência
humana, porque muitos conceitos são melhores definidos por palavras ou como Zadeh (1995) definiu,
variáveis linguísticas.
A partir da noção de conjuntos difusos Zadeh vai estender o conceito de probabilidade para um
evento difuso (fuzzy). Ele diz que nas experiências do dia a dia com frequência encontram-se situações
para as quais um “evento” é antes difuso do que um conjunto de pontos bem delimitados. E exemplifica
com os eventos em que há imprecisão nos significados das palavras e, portanto difusos: “É um dia
quente” “x é aproximadamente igual a 5”, “em vinte jogadas de uma moeda há mais caras que coroas”
(ZADEH, 1968, p.421). Para Zadeh a extensão dos conceitos de evento e probabilidade para os conjuntos
difusos alarga o campo de aplicações da teoria das probabilidades. Zadeh (1995) propõe que a Lógica do
Conjunto Difuso não é concorrente à Teoria de Probabilidades, mas complementar.
80
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
Método Estatístico Bayesiano...
A noção de complementaridade foi definida em Bohr (1995), ao introduzir a ideia de que a
natureza humana é dotada de duas imagens, assim como, a onda e a partícula são consideradas aspectos
complementares da matéria. Otte (2003) interpreta essa definição de Bohr no âmbito da Educação
Matemática, indicando que a complementaridade faz referencia a símbolos e conceitos, em um duplo
sentido, que se reajustam reciprocamente e que se integram para capturar os aspectos essenciais do
desenvolvimento cognitivo e epistemológico do conhecimento científico e conceitos matemáticos.
Moraes e Torre (2004, p.27) associam a complementaridade levando em conta o princípio da incerteza de
Heisenberg quando afirmam:
Associando o princípio da incerteza às descobertas relacionadas ao princípio da
complementaridade onda/partícula formulado por Niels Bohr, que explicou a natureza
complementar da matéria e a existência de superposição de estados quânticos, a física
quântica reforçou ainda mais a impossibilidade de se determinar como uma situação
experimental se apresentará até o momento da interferência do observador.
Descobriu-se que o cientista já não podia distanciar-se do objeto para descrever os
mecanismos da natureza e que não era possível se eliminar o observador, mas sim
reintegrá-lo em sua intersubjetividade e restabelecer o seu diálogo com a natureza.
Neste estudo nos interessa essa perspectiva da complementaridade na combinação de
probabilidade com a intensidade de pertinência. Isso porque o universo da pesquisa na Educação
Matemática é caracterizado por uma acentuada heterogeneidade, dessa forma, faz sentido uma partição
difusa deste universo, em que cada dado, informação ou indivíduo pode ser membro parcial de mais de
um subconjunto deste universo (SULEMAN, 2009).
Na Lógica dos Conjuntos Difusos define-se a função associativismo, uma função que assume
valores no intervalo [0; 1], grau de pertinência. Não se trata de uma probabilidade, representa sim, uma
medida matemática da proporção da intensidade de pertinência.
No Cálculo de Probabilidade existe a função de densidade de probabilidade que é diferente da
função associativismo, porque mede o grau de incerteza de tal pertinência. Outro aspecto diferente, entre
a função de densidade de probabilidade e a função de associativismo, do ponto de vista matemático, é que
a função de densidade de probabilidade é normalizada, isto é, multiplicada por uma constante, para que a
área da região limitada pelo eixo das abscissas e a curva de densidade de probabilidade, seja 1. Com isso,
a função f de densidade de probabilidade satisfaz: a)
, b)
.
Definimos a função de densidade de probabilidade e função de associativismo assim: Sejam f a função de
densidade probabilidade Normal, definida por
Gaussiana, definida por
constante
e fA a função de associativismo
. A função densidade de probabilidade é normalizada pela
. As funções f e fA apresentam o mesmo núcleo, a parte principal da função, a parte que
permanece quando constantes são desconsideradas (CASELLA e BERGER, 2010, p.58).
Exemplos
Um conjunto difuso e a sua função de grau de associatividade A: o conjunto difuso dos números
reais que são muito maiores do que 1. Pode-se dar uma precisão, embora subjetiva, de uma caracterização
de uma fA definida em
;
. Os valores respectivos de tal função podem ser:
;
;
81
;
. (ZADEH, 1965, pp. 339-340);
;
Araújo e Igliori
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
Uma empresa de imobiliária pretende classificar as casas que disponibiliza aos seus clientes. O
indicador de conforto é o número de quartos. Seja o universo
de tipologia de
o respectivo número de quartos, isto é, uma coleção de objetos (pontos). Assim, o
casas e
conjunto dos pares ordenados
é um conjunto difuso e a função fA é
função do grau de associatividade, ou simplesmente função de associativismo. De acordo com a empresa
o conjunto difuso “tipologia de conforto para casal com dois filhos” a sua respectiva função do “grau de
associatividade” é representado por:
Com a análise a empresa considera: uma casa de 4 quartos é ideal para uma família de quatro
pessoas, o que é expresso pelo grau de associatividade
quartos é superdimensionada com
zero.
, enquanto que uma casa de sete
. Sete quartos é um elemento incompatível, pois o grau é
(SULEMAN, 2009, p.41). Observamos que
, indicando que não se trata,
portanto, de uma probabilidade.
Por meio de um gráfico, podemos representar o conjunto difuso A. Assim, o gráfico representado
0.6
0.4
0.0
0.2
G
raudeassociatividade
0.8
1.0
pela Figura 4 facilita uma visualização dos dados.
1
2
3
4
5
6
7
Universo(u)
Figura 4: Representação do conjunto difuso A. Os autores, por meio do programa R (www.rproject.org).
Ragin (2000) considera que a ideia básica, subjascente à lógica fuzzy, é a de permitir o
dimensionamento dos escores de adesão o que permite uma adesão parcial ou difusa. Um escore de
adesão 1 indica a plena adesão de um elemento a um conjunto; pontuação próxima de 1 (por exemplo, 0,8
ou 0,9) indica a associação forte, mas parcial em um conjunto; pontuação inferior a 0,5 mas superior a 0
(por exemplo, 0,2 e 0,3) indica que os objetos são mais “fora” do que “em” um conjunto, mas ainda
elementos mais fracos do conjunto; uma pontuação de 0 indica uma não associação ao conjunto. Assim, a
lógica fuzzy combina a avalição qualitativa e quantitativa: 1 e 0 são atribuições qualitativas
(“plenamente” e “totalmente fora”, respectivamente); valores entre 0 e 1 (não inclusivo) indicam grau de
adesão, uma valiação quantitativa. Para esse pesquisador os cientistas sociais enfrentam um dilema
quando realizam pesquisa social quanto ao método de pesquisa diretamente relacionado tanto à
profundidade quanto à amplitude do método. Os métodos de pesquisa qualitativos têm a propriedade da
82
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
Método Estatístico Bayesiano...
profundidade, enquanto os métodos quantitativos a propriedade da amplitude. Ele considera que o método
de pesquisa etnográfico, um método qualitativo para determinar a dimensão sócio – cultural da Educação
Matemática, conforme Gurgel (2012, p.1), é uma estratégia de profundidade. Nesse sentido, por meio da
lógica fuzzy, Spagnolo (2003) tenta compreender como é possível analisar e estudar os fenômenos do
ensino/aprendizagem da Matemática em situação multiculturais.
A ENGENHARIA DIDÁTICA CLÁSSICA E O MÉTODO DA ESTATÍSTICA BAYESIANA
A Engenharia Didática um método de pesquisa qualitativo criado no âmbito da pesquisa da
Didática da Matemática francesa, foi elaborada numa analogia com o trabalho de um Engenheiro. Isto é:
A noção de engenharia didática emergiu em didática da matemática no início dos anos
1980. Tratava-se de etiquetar com esse termo uma forma de trabalho: aquele
comparável ao trabalho do engenheiro que, para realizar um projeto preciso, apoia-se
sobre os conhecimentos científicos de seu domínio, aceita, submeter-se a um controle
de tipo científico, mas, ao mesmo tempo, se encontra obrigado a trabalhar sobre
objetos muito mais complexos que os objetos depurados da ciência e, portanto de se
atacar, praticamente com todos os meios que ele dispõe problemas que a ciência não
deseja ou não pode ainda se encarregar. (ARTIGUE, 1988, p. 283).
Em Araújo e Igliori (2009) é apresentado um exemplo de método de pesquisa misto como
agregação de um método quantitativo ao método qualitativo da Engenharia Didática. O método
quantitativo utilizado foi o representado pelo Teste Wilcoxon (antes e depois) da Estatística Não
Paramétrica da Estatística Clássica. Essa agregação foi feita ao utilizando a função wilcox.tes, um
algoritmo presente no programa livre R (www.r-project.org). Observamos que a definição de Engenharia
Didática utilizada em Araújo e Igliori (2009) é a “Engenharia Didática Clássica (amplamente conhecida)
ou também denominada Engenharia Didática de 1ª Geração” (ALMOULOUD e SILVA, 2012, p. 22).
Neste artigo se pretende aprimorar o estudo introduzindo como método quantitativo Bayesiano
acrescido da utilização da Lógica Fuzzy. E para isso os autores tomam a Engenharia Didática Clássica
como uma metáfora conceitual do Método Estatístico Bayesiano, conforme:
[...] metáfora na Matemática e na Educação Matemática, partindo da premissa de que
muitas equações A=B são metáforas, isto é, são construções teóricas somente
possíveis de serem concebidas a partir de uma perspectiva particular e inusitada de
estabelecimento de semelhança entre desiguais, de modo que a criatividade
matemática consiste em representar um objeto A como um outro objeto B para, desta
maneira, resolver um problema. Discutir a representação e comunicação com foco na
metáfora pode contribuir para uma compreensão diferente de como se desenvolvem as
idéias matemáticas, as particularidades de sua gênese, e particularmente o modo como
se dá a intercomunicação de tais idéias em contextos educativos. (LEITE, 2010, p.87).
E buscamos, no que segue, justificar essa condição de metáfora, destacando alguns elementos
essenciais dos fundamentos da Estatística Bayesiana.
A Estatística Bayesiana é uma teoria que tem como base a definição subjetiva de probabilidade
que é atualizada por meio do Teorema de Bayes (BAYES, 1958). O Teorema de Bayes para variáveis
aleatórias discretas por Bussab e Morettin (2002, p.311) se estabelece como: Suponha que
valores
com probabilidades a priori
tenha os
; independente
da experiência ou das informações dos dados obsevados. Chamamos de
a nova informação sobre , que
é obtida de um modelo discreto. Então o teorema de Bayes pode ser escrito:
83
Araújo e Igliori
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
,
Então, temos que
.
é uma constante de normalização, e as verossimilhanças
, e as
dependentes da experiência ou das informações dos dados observados são
probabilidades a posteriori determinadas pelo teorema de Bayes são
essa distribuição a posteriori de
estimar
, dada a nova informação da observação
. Obtida
, podemos, por exemplo,
como sendo a média dessa distribuição ou a moda (o valor que maximiza
).
Schoner (2000) observa que Immanuel Kant (1724-1804) nunca chegou a conhecer Thomas Bayes
(1702-1761), e certamente não chegou a conhecer o Teorema de Bayes (1763), nem também, Thomas
Bayes escreveu sobre epistemologia, isto é, tomar a ciência como objeto de investigação ou criticar o
conhecimento científico. No entanto, no livro “Crítica da Razão Pura” publicado pela primeira vez em
1781, Kant (2010, p. 36 e 37) afirma que:
Se, porém, todo o conhecimento se inicia com a experiência isso não prova que todo
ele derive da experiência. Pois bem poderia o nosso próprio conhecimento por
experiência ser um composto do que recebemos através das impressões sensíveis e
daquilo que a nossa própria capacidade de conhecer (apenas posta em ação por
impressões sensíveis) produz por si mesma, acréscimo esse que não distinguimos
dessa matéria-prima, enquanto a nossa atenção não despertar por um longo exercício
que nos torne aptos a separá-los.
Há pois, pelo menos, uma questão que carece de um estudo mais atento e que não se
resolve à primeira vista; ser esta: se haverá um conhecimento assim, independente da
experiência e de todas as impressões dos sentidos. Denomina-se a priori esse
conhecimento e distingue-se do empírico, cuja origem é a a posteriori, ou seja, na
experiência. (apud SCHONER, 2000, p.16).
Schoner (2000) afirma que Kant expressa uma ideia muito semelhante a de Bayes, na medida em
que postula que tem de haver alguma habilidade a priori, intelectual ou conhecimento, a fim de adquirir
novos conhecimentos a partir da observação.
A Estatística Bayesiana é um método quantitativo para analisar a variabilidade de dados levando
em conta o aspecto subjetivo. Kins e Andrade (2010, p.1) apresentam uma comparação entre o Método
Estatístico Bayesiano ou o paradigma bayesiano com o paradigma convencional ou Método da Estatística
Clássica:
Diferentemente da estatística convencional, em que somente se admite probabilidade
num contexto restrito a fenômenos que podem ser medidos por frequências relativas,
no paradigma bayesiano entende-se que probabilidade é uma medida racional e
condicional de incerteza. Uma medida do grau de plausibilidade de proposições
quaisquer, as quais não precisam necessariamente estar associadas a fenômenos
medidos por frequência relativa.
Do ponto de vista de Gelman (2011) a abordagem clássica ou frequentista da Estatística, em que a
inferência é centrada nos testes de hipóteses, está associada a uma filosofia em que a ciência é dedutiva e
segue a doutrina de Popper de falsificação.
Popper fez objeções ao paradigma bayesiano por conta da intepretação subjetiva de probabilidade,
mas, como afirma Hammerton (1968), Popper estava enganado, porque o paradigma bayesiano está de
acordo com a espistemologia científica dele, pricipalmente, “a de que uma hipótese deve ser testável”
(HAMMERTON, 1968, p. 111). A esse respeito, Bussab e Morettin (2002, p.310) afirmam que:
84
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
Método Estatístico Bayesiano...
A crítica que se faz à teoria frequentista é a possibilidade de ‘replicar dados’, bem
como o recurso à teoria assintótica. Uma teoria que não faz uso de tais argumentos é a
inferência bayesiana, cujos fundamentos foram estabelecidos por Thomas Bayes em
1763. Outros expoentes dessa corrente foram Bernoulli (1713), Laplace (1812) e
Jeffreys (1939).
A inferência bayesiana é comumente associada ao raciocínio indutivo e à ideia de que um modelo
pode ser destronado por um modelo concorrente, mas nunca pode ser diretamente falsificada por um teste
de significância. Gelman (2011) considera incorretos os argumentos que fazem associações da inferência
bayesiana só ao raciocínio indutivo, o que foi prejudicial à prática da Estatística Bayesiana. Por meio de
sua experiência, no uso e desenvolvimento de Métodos Bayesianos na área social e ciências ambientais,
Gelman (2011) tem encontrado maneiras para verificação do modelo e falsificação, segundo Popper.
A distribuição a priori e a distribuição a posteriori são os fundamentos do Método Bayesiano.
Assim como análise a priori e análise a posteriori são os fundamentos da Engenharia Didática Clássica.
Também, podemos observar as considerações sobre análise a priori e análise a posteriori, segundo
Almouloud, respectivamente:
O objetivo de uma análise a priori é determinar como as escolhas efetuadas (as
variáveis que queremos admitir como pertinentes) permitem controlar os
comportamentos dos alunos e explicar seu sentido. A análise a posteriori de uma
sessão é o conjunto de resultados que se pode tirar da explicação dos dados recolhidos
e que contribui para a melhoria dos conhecimentos didáticos que se têm sobre as
condições da transmissão do saber em jogo. Ela não é a crônica da classe, mas uma
análise feita à luz da análise a priori, dos fundamentos teóricos, das hipóteses e da
problemática da pesquisa [...]. (ALMOULOUD, 2007, p.175-177).
O aspecto subjetivo dos dois paradigmas, Método Bayesiano e Engenharia Didática Clássica,
como os seus fundamentos de distribuição a priori e distribuição a posteriori e análise a priori e análise a
posteriori, respectivamente, são elementos semelhantes nos dois métodos. No âmbito da Estatística
Bayesiana, há criticas ao Método Bayesiano Empírico porque se trata de um método que utiliza dados
empíricos para determinar a distribuição a priori, informações externas. Como afirma Artigue (1988), a
validação da Engenharia Didática Clássica é essencialmente interna, fundada no confronto da análise a
priori da análise a posteriori. Nesse sentido a Engenharia Didática, também, critica o uso do método
empírico.
A Engenharia Didática Clássica expressa uma ideia que está de acordo com os argumentos de
Kant, assim como Kant expressa uma ideia muito semelhante aos argumentos de Bayes, como afirma
Schoner (2000). Portanto, há um vínculo de similaridade semântica entre os fundamentos do Método
Bayesiano e da Engenharia Didática Clássica. Nesse sentido, consideramos que a Engenharia Didática
Clássica é uma metáfora conceitual segundo o que apresenta Leite (2010, p. 71-72):
Nesse sentido, segundo a teoria da metáfora conceitual, ‘a essência da metáfora é
compreender e experienciar uma coisa em termos de outra’ (LAKOFF & JOHNSON,
2002, p. 48) a partir de uma rede conceitual, que lembra um mapeamento ou um
morfismo entre coisas distintas.
Assim, observamos que a Engenharia Didática Clássica, com relação ao Método Bayesiano, é uma
metáfora conceitual porque a Engenharia Didática Clássica é potencial heurístico, pois pode agregar
aspectos da inferência do Método Bayesiano, no sentido de Leite (2010, p. 58), quando observa: “[...]
potencial heurístico proporciona à metáfora uma importância cognitiva, visto que ela se torna relevante
para a geração de um novo conhecimento”.
85
Araújo e Igliori
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
Os aspectos subjetivos dos dois métodos nos remetem à teoria do conhecimento de Kant, que o
conhecimento nunca se dá de maneira neutra, como afirma Silveira (2002, p. 28):
A teoria do conhecimento de Kant – a filosofia transcendental ou idealismo
transcendental – teve como objetivo justificar a possibilidade do conhecimento
científico dos séculos XVII e XVIII. Ela partiu da constatação de que nem o
empirismo britânico, nem o racionalismo continental explicavam satisfatoriamente a
ciência. Kant mostrou que, apesar de o conhecimento se fundamentar na experiência,
esta nunca se dá de maneira neutra, pois a ela são impostas as formas a priori da
sensibilidade e do entendimento, características da cognição humana.
E também remetem a Popper (2006) quando se refere à procura de padrões de regularidade em
pesquisa, correspondente à ideia de casualidade de Kant, ou seja:
Esta expectativa inconsciente de encontrar padrões de regularidade, que é
psicologicamente a priori, corresponde muito aproximadamente à lei da casualidade,
que Kant acreditava fazer parte do nosso aparelho mental e ser a priori válida.
Poderíamos, assim, sentir-nos inclinados a dizer que Kant não soube distinguir entre
formas psicologicamente a priori de pensar ou reagir e crenças válidas a priori. Mas
eu não creio que o seu erro tenha sido crasso. E isso na medida em que a expectativa
de encontrar padrões de regularidade não é só psicologicamente a priori, mas também
logicamente a priori: é logicamente anterior a toda a expectativa de observação, dado
que é, tal como vimos, anterior a qualquer reconhecimento de semelhança; e toda
observação envolve o reconhecimento de semelhanças (ou dessemelhanças).
(POPPER, 2006, p.74).
Assumindo-se a condição da Engenharia Didática Clássica como metáfora ao Método Estatístico
Bayesiano, complementamos com a adoção da Lógica Fuzzy como meio de abordagem da imprecisão dos
dados.
MÉTODO ESTATÍSTICO BAYESIANO E A LÓGICA DOS CONJUNTOS DIFUSOS
Neste estudo vamos propor a análise da imprecisão dos dados por meio da Lógica dos Conjuntos
Difusos.
Para isso, considerando Viertl (2011), por meio do argumento do Método Estatístico Bayesiano
com Dados Difusos, podemos atualizar a probabilidade condicional P(t/e) de Popper, agregando a
probabilidade subjetiva e grau de pertinência entre os elementos de um conjunto.
Assim, corrigindo o erro de Popper, é proposta uma solução alternativa ao grau de corroboração,
isto é, grau de pertinência por meio do Teorema de Bayes.
Na Figura 5 é apresentado um mapa conceitual referente ao percurso feito neste estudo. Esse mapa
foi construído por meio do programa ATLAS.ti (http://www.atlasti.com/index.html). Ele expressa as
respostas às questões que surgiram antes e durante o desenvolvimento da pesquisa.
86
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
Método Estatístico Bayesiano...
Figura 5: Mapa conceitual referente ao percurso feito no estudo. Fonte: Os autores - programa
ATLAS.ti.
Exemplos de Aplicação
As aplicações da Lógica do Conjunto Difuso e do Método Estatístico Bayesiano têm sido
observadas em várias áreas do conhecimento. Apresentaremos a seguir alguns exemplos de aplicação.
Ragin (2000) considera que as declarações teóricas em pesquisa social, na maioria das vezes
podem ser formuladas como declarações sobre conjuntos. Os métodos qualitativos e quantitativos têm
como propriedades a profundiade e amplitude, respectivamente. Ragin (2000) observa que há um meio
termo entre elas e propôs uso de Lógica Difusa ou conjuntos difusos como um caminho alternativo para
análise de dados observados em pesquisas das Ciências Sociais.
Spagnolo (2003) tenta compreender como é possível analisar e estudar os fenômenos do
ensino/aprendizagem da Matemática em situações multicuturais.
Spagnolo e Gras (2004) propõem a utilização da Lógica Difusa no âmbito da Análise Estatística
Implicativa. No préfacio da edição digital do 5º Colóquio da A.S.I. (Analyse Statistique Implicative) é
respondida a seguinte pergunta: Análise Estatística Implicativa: uma vez mais, o que é?
Na busca da essência da questão da origem do desenvolvimento da Análise Estatística
Implicativa, Régis Gras e Jean-Claude Régnier consideram que ‘neste momento (ela)
designa um campo teórico central sobre o conceito da implicação estatística ou mais
precisamente sobre o conceito de quase – implicação para destingi-la da implicação
da lógica de domínio da lógica e da matemática. O estudo da concepção de quase –
87
Araújo e Igliori
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
implicação e tanto um objeto matemático, dentro de campo das probabilidades e da
estatística, que permitem construir os objetos teóricos que instrumentalizam um
método de análise de dados’ (GRAS et al 2009, p. 6 apud RÉGNIER et al, 2010, p.
4).
Spagnolo e Gras (2004) consideram importante tornar adequada a Análise Estatística Implicativa a
uma nova epistemologia por meio da representação implicação fuzzy. Essa nova perspectiva está
implementada no software CHIC 3.1. Análise Estatística Implicativa é um método de classificação de
dados fundamentada na Estatística Clássica. Assim, a variabilidade, o aspecto aleatório da incerteza, no
âmbito da Análise Estatística Implicativa, segue a abordagem da Estatística Clássica. A Estatística
Clássica está fundamentada na interpretação de probabilidade por meio da frequência relativa. Por outro
lado, Spagnolo e Gras (2004) propõem utilizar a implicação fuzzy na imprecisão dos dados, o aspecto
difuso da incerteza. Portanto, software CHIC 3.1 utiliza a Estatística Clássica e a implicação fuzzy para
fazer a classificação dos dados por meio de árvores de classificação e grafos de implicação.
Suleman (2009) expõe duas aplicações do Método Estatístico Bayesiano com Dados Difusos,
utilizando a Análise Bayesiana Empírica para dados observados em Portugal. Já foi observado que há
criticas ao Método Bayesiano Empírico porque é um método que utiliza dados empíricos para determinar
a distribuição a priori. Mas, alguns pesquisadores, como Suleman (2009), utilizam a Análise Bayesiana
Empírica pela facilidade computacional por conta do software GoM desenvolvido pela DSISOFT
(www.dsisoft.com). As duas aplicações apresentadas por Suleman (2009, p. 213-259) são: acidentes
domésticos e perfis de competência bancária. A competência bancária é exemplo que apresenta alguma
relação com a pesquisa em Educação Matemática devido à variável Grau de Escolaridade. A variável,
Grau de Escolaridade, comporta três categorias: 1 - “Formação inferior ao 12º ano”; 2 - “Formação igual
ao 12º ano”; 3 - “Formação superior ao 12º ano”. Assim, o universo é então particionado em três classes
caracterizadas inicialmente pela formação acadêmica dos seus membros. Suleman (2009, p. 258) afirma
que:
Os dados analisados não são conclusivos quanto a Educação como promotora de
competências. Os aspectos relativos ao papel da instituição no aproveitamento de
capacidades não puderam ser contabilizados. O debate entre qualificação e
competência mantém assim toda a atualidade.
CONSIDERAÇÕES FINAIS
A combinação de métodos não é novidade. Mas o que torna a proposta apresentada neste artigo
inédita é o fato de tratar o problema no âmbito da pesquisa em Educação Matemática por meio da sua
própria linguagem, a Matemática, utilizando as mais novas ferramentas, a Lógica dos Conjuntos Difusos
e o Método da Estatística Bayesiana. Nesta proposta se considera o aspecto dual dos dados observados no
âmbito da pesquisa em Educação Matmática, isto é, a variabilidade e a imprecisão dos dados. Com isso, a
Lógica dos Conjuntos Difusos e o Método da Estatística Bayesiana podem agregar aspectos quantitativos
aos métodos qualitativos que são utilizados na pesquisa dos fenômenos ou problemas reais da Educação
Matemática, problemas caracterizados por representações epistemológicas, histórico-epistemológicas e
comportamentais. Por conseguinte, o Método Estatístico Bayesiano é uma boa prática estatística que tem
interseção com as ideias de Popper, Kuhn e Lakatos. Com esta proposta pensamos contribuir com a
melhoria da confiabilidade dos resultados da pesquisa em Educação Matemática.
88
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
Método Estatístico Bayesiano...
REFERÊNCIAS BIBLIOGRÁFICAS
ABAR, C. A. A. P. O conceito Fuzzy. Disponível em: <http://www.pucsp.br/~logica/Fuzzy.htm>.
Acesso em: 22/10/2010.
ALMOULOUD, S. A. e SILVA, M. J. F. Engenharia didática: evolução e diversidade. R. Eletr. de
Edu. Matem., v.07, n.2, p.22-52, Florianópolis, 2012.
ALMOULOUD, S. A. Fundamentos da didática da matemática. Ed. UFPR, 2007.
ARAÚJO, P. C.; IGLIORI, S. B. C. O Problema Epistemológico da Probabilidade. Caderno de Física
da UEFS, Vol. 11 (01 e 02), p 57-75, Feira de Santana, 2013.
ARAÚJO, P. C.; IGLIORI, S. B. C. Engenharia Didática como uma Estatística Não-Paramétrica.
Caderno de Física da UEFS, Vol. 07 (01 e 02), p 133-142, Feira de Santana, 2009.
ARTIGUE, M. Ingénierie didactique. Recherches en Didactique des Mathématiques. La Pensée
Sauvage, Grenoble, v. 9, n. 3, p. 281-307, 1988.
BALEEIRO, G. B. Modelagem neuro-fuzzy estimativa de volume de eucalytus sp. Monografia,
Departamento de Ciências da Computação. UFLA - Universidade Federal de Lavras, Lavras,
2007.
BAYES, T. An essay towards solving a problem in the doctrine of chances. Phil. Trans. Roy. Soc., 53,
370-418, 54, 296-325, reprinted in Biometrika, 45, 293-315, 1958.
BOHR, N. Física atômica e conhecimento humano: ensaios 1932-1957. Rio de Janeiro, Contraponto
Editora LTDA, 1995.
BUSSAB, W. O. e MORETTIN, P. A. Estatística Básica. Editora Saraiva, 5ª Edição. São Paulo. 2002.
CASELLA, G.; BERGER, R. L. Inferência Estatística. Tradução Solange A. Visconte. São Paulo:
Cengage Learning, 2010.
GELMAN, A. Induction and Deduction in Bayesian Data Analysis. Special Topic: Statistical Science
and Philosophy of Science. Edited by Deborah G. Mayo, Aris Spanos and Kent W. Staley. RMM
Vol. 2, 67–78, 2011.
GURGEL, C. M. A. Pesquisa etnográfica e educação matemática: processo, contextualização e
construção. http://www.periodicos.udesc.br/index.php/linhas/article/viewFile/1257/1069. Acesso
em 04/08/2012.
89
Araújo e Igliori
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
HAMMERTON, M. Bayesian Statisties and Popper’s Epistemology. Oxford University Press on
behalf of the Mind Association. Mind, New Series, Vol. 77, No. 305 (Jan., 1968), pp. 109-112.
http://www.jstor.org/stable/2252603. Acesso em 22/08/2012.
HOFSTADTER, D. R. Gödel, Escher, Bacher: an Eternal Golden Braid. New York: Basic Books,
1999.
KANT, I. Crítica da Razão Pura. Tradução baseada no original alemão intitulado KRITIK DER
REINEN VERNUNFT, Edição da Fundação Calouste Gulbenkian, Lisboa, 2010.
KINS, P. G. e ANDRADE, H. A. Introdução à análise bayesiana (com R). Ed. maisQnada, Porto
Alegre, 2010.
LAKATOS, I. The methodology of scientific research programmes. Philosophical Papers, Volume I,
Cambridge University Press, Paperback edition, Cambridge, 1999.
LAKOFF, G. & JOHNSON, M. Metaphors: We Live By. Chicago: University of Chicago Press, 1980.
LESTER JÚNIOR, F. The place of theory in Mathematics Education research. Bloomington: Indiana
University, 2005. p. 172-178.
LEITE, K. G. Metáfora e Matemática: A contingência em uma disciplina escolar considerada exata.
2010, 135 f. Dissertação (Mestrado em Educação) Programa de Pós-Graduação em Educação do
Instituto de Educação da Universidade Federal de Mato Grosso, Cuiabá, 2010.
MORAES, M. C. e TORRE, S. Sentir pensar: Fundamentos e estratégias para reencantar a
educação. Editora Vozes, Petrópolis, RJ, 2004.
OTTE, M. Complementarity, Set and Numbres. Educational Studies in Mathematics, 53: 203-228,
Printed in the Netherlands: Kluwer Academic Publisher, 2003.
OTTE, M. F. Metaphor and Contingency. In: RADFORD, L.; SCHUBRING, G.; SEEGER, F. (Orgs.).
Semiotics in Mathematics Education: Epistemology, History, Classroom, and Culture. Rotterdam:
Sense Publishers, 2008.
PAULINO, C. D.; TURKMAN, M. A. A.; MURTEIRA, B. Estatística Bayesiana. F. Calouste
Gulbenkian, 2003.
POPPER, K. A Lógica da Pesquisa Científica. Editora Cultrix, São Paulo-SP, 1993.
POPPER, K. Conjecturas e Refutações. Tradução de Benedita Bettencourt. Coimbra: Livraria
Almedina, 2006.
RAGIN, C. C. Fuzzy-set social science. Chicago: University of Chicago Press, 2000.
90
CADERNO DE FÍSICA DA UEFS 11, (01 E 02): 77-91, 2013
Método Estatístico Bayesiano...
RÉGNIER, Jean-Claude; GRAS, R.; BAILLEUL, M. 6º Colóquio Internacional sobre Análise
Estatística
Implicativa
-
A.S.I.
Caen
(França),
2010.
https://sites.univ-
lyon2.fr/asi6/lang/br/Appel_ASI6_PT_BR.pdf. Acesso em 15/08/2012.
SCHONER, B. Probabilistic Characterization and Synthesis of Complex Driven Systems. Doctor of
Philosophy, MIT, 2000.
SILVEIRA, F. L. A Teoria do Conhecimento de Kant: O Idealismo Transcendental. Caderno
Brasileiro de Ensino de Física, v.19, p. 28-51, Florianópolis, 2002.
SPAGNOLO, F. Fuzzy Logic, Fuzzy Thinking and the teaching/learning of mathematics in
multicultural situations. The Mathematics Education into the 21º Conference and the
Undecidable in Mathematics Education Brno, Czech Republic, September 2003.
SPAGNOLO, F.; GRAS, R. A. New approach in Zadeh’s classification: fuzzy implication through
statistic implication. In NAFIPS-IEEE 3rd Conference of the North American Fuzzy Information
Processing Society, p. 425-429, June 2004.
STRAUSS, A. e CORBIN, J. Pesquisa qualitativa: Técnicas e procedimentos para o desenvolvimento
de teoria fundamentada. Tradução Luciane de Oliveira da Rocha. 2ª Ed. Artmed, Porto Alegre,
2008.
SULEMAN, A. Abordagem Estatística de Conjuntos Difusos. Edições Sílabo, Lisboa, 2009.
UTSUMI, M. C.; CAZORLA, I. M.; VENDRAMINI, C. M. M.; e MENDES, C. R. Questões
metodológicas dos trabalhos de abordagem quantitativa apresentado no GT19-ANPED.
Educação Matemática e Pesquisa: Revista do Programa de Estudos Pós-Graduação em Educação
Matemática/PUC-SP, São Paulo-SP, 1999.
VIERTL, R. Statistical methods for fuzzy data. John Wiley & Sons, New Delhi, India, 2011.
ZADEH, L. A. Discussion: Probability Theory and Fuzzy Logic Are Complementary Rather Than
Competitive. Technometrics, 37, 271–276, 1995.
ZADEH, L. A. Fuzzy sets. Inf Control, 8:338-53, 1965.
ZADEH, L. A. Probability measures and fuzzy events. J.Math. Anal Appl, 23:421-7, 1968.
ZUCCO, J. Funções Monotônicas: Alunos da 3ª série do ensino médio frente às Olimpíadas de
Matemática das escolas públicas. 2010, 117 f. Dissertação ( Mestrado Profissional em Ensino de
Matemática) – Programa de Pós-Graduação em Educação Matemática, Pontifícia Universidade
Católica de São Paulo, 2010.
91