Modelo de recuperación de datos no estructurados para la

Transcrição

UNIVERSIDADE FEDERAL DE SANTA CATARINA
CENTRO TECNOLÓGICO
DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO
MODELO DE RECUPERAÇÃO DE DADOS NÃO ESTRUTURADOS PARA
SUSTENTAÇÃO Á ESTRATÉGIA DE COMPETITIVIDADE ORGANIZACIONAL
ANTÔNIO PEREIRA CÂNDIDO
FLORIANÓPOLIS, SC
2005
SUSTENTAÇÃO Á ESTRATÉGIA DE COMPETITIVIDADE ORGANIZACIONAL
Tese apresentada ao Programa de PósGraduação em Engenharia de Produção da
Universidade Federal de Santa Catarina, como
requisito parcial para obtenção do título de
Doutor em Engenharia de Produção.
Orientador: Prof. Fernando Álvaro Ostuni
Gauthier, Dr.
FLORIANÓPOLIS, SC
2005
SUSTENTAÇÃO À ESTRATÉGIA DE COMPETITIVIDADE ORGANIZACIONAL
Esta tese foi julgada e aprovada para obtenção do título de doutor em Engenharia de
Produção no Programa de Pós-Graduação em Engenharia de Produção da Universidade
Federal de Santa Catarina.
Florianópolis, 29 de julho de 2005.
Prof. Edson Pacheco Paladini, Dr. Eng.
Coordenador do PPG em Engenharia de Produção
BANCA EXAMINADORA:
____________________________________
_______________________________
Prof. Fernando Álvaro Ostuni Gauthier , Dr.
Orientador - UFSC
Ana Maria Bencciveni Franzoni, Dra.
Moderadora: UFSC
___________________________________
__________________________________
Profa. Edis Mafra Lapolli, Dra.
Examinadora - UFSC
Jorge Luiz Silva Hermenegildo, Dr
Examinador Externo – CEFET - SC
___________________________________
Prof. Marco Antônio Neiva Koslosky, Dr.
Examinador Externo – CEFET - SC
DEDICATÓRIA
Dedico este trabalho primeiramente a Deus. Por vezes sinto que Ele, através do meu
espírito, me ajuda, instigando-me a conhecer, convidando-me a me completar como ser
humano, estimulando-me a fazer de mim uma expressão de Sua criação.
Dedico este trabalho também a você, que está percorrendo estas linhas agora. Por
algum motivo, estamos agora em contato. Dou esta forma a esta dedicatória para lhe dizer que
a vida é fantástica. Através dela podemos realizar muitas coisas.
Esta tese exigiu muito de mim. Tive que saber ouvir, refazer, repensar. Tive que
aprender a conhecer os meus limites e a pedir ajuda. Aprendi também, a ser ajudado com
dignidade, sabendo que a ajuda é parte da vida.
Penso que se pude fazer você sentir o quão grato eu sou a todos os que me ajudaram
atingi meu objetivo.
Há outra coisa ainda: Cultive a gratidão, ela é uma credencial que habilita o ser
humano para evoluir.
AGRADECIMENTOS
Refazendo a trajetória que culminou com a finalização desta tese, sinto-me muito feliz
e recompensado. Durante este período pude fazer e consolidar grandes amizades. Foram anos
de trabalho e dedicação. Quantos finais de semana, quantas madrugadas...
Tenho certeza de que somente pude chegar a este resultado porque fui muito ajudado.
Algumas pessoas tiveram participação direta, outras indiretas, porém todas foram
fundamentais para a conquista deste objetivo.
Inicialmente, gostaria de agradecer a Universidade Federal de Santa Catarina, em
especial ao Programa de Pós-Graduação, através do qual pude ampliar meus conhecimentos e
adquirir habilidades fundamentais para o melhor exercício de minha profissão.
Faço registro especial aos profissionais, funcionários públicos federais, daquele
departamento que sempre atuaram com muita eficácia nos encaminhamentos dos temas
burocráticos e regimentais.
Especial gratidão dedico ao meu orientador, Prof. Dr. Fernando Álvaro Ostuni
Gauthier, pelo tempo e dedicação dispensados a este projeto. Foi ele quem teve a idéia do
tema da tese.
Especial também foi a participação do Prof. Dr. Jorge Luiz Silva Hermenegildo, que
muito me ajudou com sua visão e experiência na organização das idéias e como companheiro
de pesquisas. Sua paciência e comprometimento foram fundamentais em alguns momentos do
projeto.
Sou grato também aos colegas do Núcleo de Informática e Sistemas do CEFETSC, em
especial aos professores Dr. Marco Antônio Neiva Koslosky e Dr. Hamilcar Boing. Estes
professores me estimularam oferecendo aportes para o encaminhamento de questões do
trabalho.
Deixei para mencionar por último os dois principais fatores de êxito nesta empreitada.
O primeiro é minha família, esposa e filhas. Minha esposa foi incansável no atendimento a
questões que facilitaram o caminho. Seu amor, sua dedicação e seu exemplo muito me
alentaram e me estimularam. Minhas filhas compõem com ela o mais sublime recanto onde
por vezes me recolhia e buscar forças para continuar. O Segundo é Deus. Ele me deu a vida, a
inteligência e a sublime sensação de existir, que serão a essência viva de tudo o que fiz, faço e
farei.
RESUMO
CÂNDIDO, Antônio Pereira. Modelo de recuperação de dados não estruturados para
sustentação à estratégia de competitividade organizacional. Florianópolis. 2005. 204 f.
Tese (Doutorado em Engenharia de Produção) – Programa de Pós-Graduação em Engenharia
de Produção, UFSC, Florianópolis.
As organizações, de modo geral, têm um volume de informações presentes em seus
computadores das quais fazem pouco uso, por não conseguirem uma forma eficiente de
acesso às mesmas. A dificuldade maior em fazer acesso a estes dados se dá pela característica
da sua estruturação. Trata-se de dados não estruturados. Tendo presente esta questão, a
presente pesquisa tem por objetivo encontrar uma solução para favorecer o acesso a dados não
estruturados. Para encaminhar o trabalho, busca-se aplicar uma estratégia de competitividade
como fator de indexação destes dados. Sendo assim, elegeram-se as cinco forças competitivas
de Porter (PORTER, 1996) e, através da utilização de ontologias, construiu-se um modelo que
permite a estruturação destes dados, tornando-os acessíveis por meios computacionais. O
resultado da pesquisa evidencia que é possível transformar dados não estruturados em
semi-estruturados e, a partir daí, aplicar recursos computacionais já existentes para
disponibilizá-los para a organização. A modelagem do domínio do conhecimento contido no
referencial teórico das cinco forças competitivas de Porter favoreceu o desenvolvimento do
trabalho dando ao mesmo um caráter prático. A aplicação do modelo proposto permite às
organizações realinhamento estratégico, definição clara de funções sobre o foco da pesquisa
em questão e automatização de um processo inerente a estratégia de competitividade eleita
que permite a identificação, seleção e ação com base nos dados não estruturados que chegam
à organização. A pesquisa mostrou a viabilidade do modelo, bem como evidenciou a
contribuição que modelos deste tipo podem representar para o avanço das organizações na
otimização dos recursos computacionais de que dispõem. Na medida que seja possível a
aplicação de modelagens de domínio e que estas modelagens possam ser representadas e
processadas em meios computacionais, a organização se habilita para resgatar dados e
informações não estruturados, muito importantes para atingir seus objetivos.
Palavras-Chave: Recuperação de dados, Ontologia, Competitividade Organizacional
ABSTRACT
CÂNDIDO, Antônio Pereira. Modelo de recuperação de dados não estruturados para
sustentação à estratégia de competitividade organizacional. (A model for the recuperation
of non-structured data for the sustentation of a strategy for organizational competitiveness).
Florianópolis. 2005. 204f. Tese (Doutorado em Engenharia de Produção) – Programa de PósGraduação em Engenharia de Produção, UFSC, Florianópolis.
Organizations generally have a bulk of information in their computers out of the which
they may make little use, because they do not possess an efficient form to access those
information. The major difficulty in having access to those data is caused by their structuring
nature. They are non-structured data. Considering this fact, this research aims to find a
solution to permit the access to non-structured data. A strategy of competitiveness is adopted
as a factor for the indexation of those data. Thus, Porter’s five competitive forces (PORTER,
1996) were chosen and, by means of the application of ontologies, a model was built that
allows for the structuring of those data, making them accessible for computational processing.
The results suggest that it is possible to transform non-structured data into semi-structured
data, and then apply existing computational facilities to make those data available for the
organization. The modeling of the domain of the knowledge included in the theoretical basis
of Porter’s competitive forces permitted the development of the work, giving it a practical
characteristic. The application of the proposed model allows for to the strategic realignment
of the organization, clear definition of functions on the focus of the present research, and
automation of a process inherent to the chosen strategy of competitiveness, which permits
identification, selection and action, based on the non-structured data that enter the
organization. The research proved the viability of the model and evidenced the contribution
that models of this type can bring to the progress of the organizations, by optimizing the
available computational resources. As far as the application of a domain modeling is possible,
as well as its computational representation and processing, the organization is able to rescue
non-structured data and information, which may be very important for the organization to
reach its objectives.
Key words: Data recovery, Ontology, Organizational competitiveness
SUMÁRIO
1 INTRODUÇÃO ..................................................................................................................... 1
1.1 DEFINIÇÃO DO PROBLEMA DE PESQUISA.............................................................4
1.2 JUSTIFICATIVA ............................................................................................................. 5
1.3 AS HIPÓTESES DA PESQUISA .................................................................................... 8
1.4 OBJETIVOS DA PESQUISA ..........................................................................................9
1.4.1 Objetivo geral............................................................................................................... 9
1.4.2 Objetivos específicos .................................................................................................... 9
1.5 RELEVÂNCIA, CONTRIBUIÇÃO E INEDITISMO.....................................................9
1.6 METODOLOGIA........................................................................................................... 11
1.6.1 Características da metodologia aplicada ................................................................. 11
1.6.2 Validação do modelo e limitações............................................................................. 12
1.6.3 Estrutura do trabalho................................................................................................ 12
2 FUNDAMENTAÇÃO TEÓRICA......................................................................................14
2.1 O PAPEL DA ENGENHARIA ......................................................................................14
2.2 DADOS, INFORMAÇÃO E CONHECIMENTO .........................................................15
2.3 BIBLIOTECAS OU REPOSITÓRIOS DE DADOS, UMA REALIDADE
PRESENTE.................................................................................................................... 17
2.4 COMPETITIVIDADE ORGANIZACIONAL............................................................... 19
2.5 SOBRE GESTÃO DO CONHECIMENTO ...................................................................25
2.6 RECUPERAÇÃO DE INFORMAÇÕES E CLASSIFICAÇÃO DE DADOS .............. 28
2.7 DOCUMENTO SEMI-ESTRUTURADO......................................................................37
2.8 ONTOLOGIAS............................................................................................................... 39
2.8.1 Aplicações ................................................................................................................... 40
2.8.2 Tipos de Ontologias ................................................................................................... 42
2.8.3 Engenharia de Ontologias......................................................................................... 43
2.8.4 Metodologias de desenvolvimento de ontologias..................................................... 46
2.8.5 Benefícios na utilização de ontologias ...................................................................... 50
2.8.6 Projeto e desenvolvimento de Ontologias. ............................................................... 51
2.8.7 Ferramentas para a construção de ontologias. ....................................................... 55
2.8.8 Linguagens para a construção de ontologias........................................................... 58
2.8.9 Roteiro para desenvolvimento de uma ontologia.................................................... 60
2.9 O PROTÉGÉ ..................................................................................................................62
3 O MODELO PROPOSTO.................................................................................................. 68
3.1 CONDIÇÕES DE CONTORNO ....................................................................................68
3.2 FATOR DELIMITATÓRIO PARA APLICAÇÃO DO MODELO .............................. 68
3.2.1 Grupo I – Organizações indiferentes ....................................................................... 72
3.2.2 Grupo II – Organizações em transição.................................................................... 72
3.2.3 Grupo III – Organizações alinhadas estrategicamente .......................................... 73
3.3 DESCRIÇÃO DO MODELO.........................................................................................74
3.3.1 Fase I: Localização ou Acoplamento........................................................................ 75
3.3.2 Fase II: Apropriação ou Posicionamento ................................................................ 76
3.3.3 Fase III: Construção do modelo do domínio ........................................................... 76
3.3.4 Fase IV: Construção do modelo computacional ..................................................... 77
3.4 UTILIZAÇÃO DO MODELO ....................................................................................... 77
3.5 VALIDAÇÃO DO MODELO........................................................................................ 79
4 CONSTRUÇÃO DA ONTOLOGIA.................................................................................. 81
4.1 SEQÜÊNCIA DE PASSOS – APLICAÇÃO DA METODOLOGIA ...........................82
4.1.1 Passo 1......................................................................................................................... 82
4.1.2 Passo 2......................................................................................................................... 96
4.1.3 Passo 3......................................................................................................................... 96
4.1.4 Passo 4......................................................................................................................... 98
4.1.5 Passo 5......................................................................................................................... 99
4.1.6 Passo 6....................................................................................................................... 100
4.1.7 Passo 7....................................................................................................................... 101
4.2 CONSTRUÇÃO DO ESBOÇO DA ONTOLOGIA ....................................................102
4.2.1 Nível 0 ....................................................................................................................... 103
4.2.2 Nível 1 ....................................................................................................................... 104
4.2.3 Nível 2 ....................................................................................................................... 107
4.3 DESENVOLVIMENTO DA ONTOLOGIA NO AMBIENTE PROTÉGÉ ................ 108
4.4 VERSÃO FINAL DA ONTOLOGIA .......................................................................... 119
4.4.1 Propriedades da ontologia projetada..................................................................... 130
4.4.2 Visão esquemática do estágio atual da ontologia .................................................. 143
5 VALIDAÇÃO DO MODELO ..........................................................................................144
5.1 PROCESSO DE VALIDAÇÃO DO MODELO .......................................................... 144
5.1.1 Situação..................................................................................................................... 144
5.2 CONCLUSÃO DA VALIDAÇÃO ..............................................................................154
6 RESULTADOS, CONTRIBUIÇÕES E CONCLUSÕES.............................................. 155
6.1 RESULTADOS OBTIDOS ..........................................................................................155
6.1.1 Compreensão e compartilhamento do referencial teórico a ser implementado. 157
6.1.2 Localização do modelo de competitividade à realidade da organização. ........... 157
6.1.3 Adequação dos recursos necessários à sustentação do projeto. .......................... 158
6.1.4 Modelagem do domínio do conhecimento presente no referencial teórico
que dá suporte à estratégia de competitividade. ..................................................... 158
6.1.5 Construção da ontologia e disponibilização de ferramentas para utilização
de recursos computacionais na operacionalização do processo............................. 158
6.2 CONTRIBUIÇÕES ...................................................................................................... 159
6.2.1 Incorporação de tecnologia nas organizações ....................................................... 159
6.2.2 Gestão de processos ................................................................................................. 160
6.2.3 Implantação de estratégia de competitividade...................................................... 160
6.2.4 Alinhamento estratégico da organização............................................................... 160
6.2.5 Estabelecimento de controle sobre a execução da estratégia............................... 160
6.2.6 Facilidade e baixo custo da implantação da solução ............................................ 161
6.2.7 Metodologia de análise e solução de problemas inerentes às questões da
organização ................................................................................................................. 161
6.2.7 Apropriação de conhecimentos pela organização................................................. 161
REFERENCIAL BIBLIOGRÁFICO .................................................................................163
ANEXO I – Listagem de projetos que envolvem ontologias............................................. 168
ANEXO II – Utilização de metodologia para definição de estratégia competitiva ........ 182
LISTA DE FIGURAS
Figura 2.1: Modelo das forças competitivas de Porter ............................................................. 21
Figura 2.2: Tipos de dados conforme sua estrutura.................................................................. 33
Figura 2.3: Grafo com um ciclo e sem raiz .............................................................................. 35
Figura 2.4: Grafo cíclico e com raiz ......................................................................................... 35
Figura 2.5: Árvore .................................................................................................................... 36
Figura 2.6: Representação de dados semi-estruturados por grafo ............................................ 36
Figura 2.7: Dado semi-estruturado ........................................................................................... 37
Figura 2.8: Grafo do dado semi-estruturado............................................................................. 38
Figura 2.9: Aplicação de ontologia em interoperabilidade.......................................................41
Figura 2.10: Parte dos atributos da Classe Documento Científico ........................................... 45
Figura 2.11: Parte da Ontologia KA......................................................................................... 46
Figura 2.12: Etapas de desenvolvimento e sua relação com as atividades de suporte ...............48
Figura 2.13:Guia “Classes” do Protégé .................................................................................... 64
Figura 2.14: Guia “Forms” do Protégé..................................................................................... 65
Figura 2.21: Guia “Instances” do Protégé ................................................................................ 66
Figura 2.22: Apresentação de elementos de uma ontologia no Protégé................................... 67
Figura 3.1: Estágios das organizações...................................................................................... 74
Figura 3.2: Fases do modelo proposto...................................................................................... 75
Figura 4.1: Taxonomia entre a classe Cliente, a empresa A e a propriedade “é integrante”.... 82
Figura 4.2: Domínio do conhecimento a ser modelado pela ontologia .................................... 83
Figura 4.3: Relação entre os elementos da ontologia ............................................................. 102
Figura 4.4: Visão macro do escopo que envolve a ontologia.................................................103
Figura 4.5: Classes e propriedades de Entrantes em Potencial...............................................104
Figura 4.6: Classes e propriedades de Concorrentes .............................................................. 105
Figura 4.7: Classes e propriedades de Produtos Substitutos ..................................................105
Figura 4.8: Classes e propriedades de Fornecedor ................................................................. 106
Figura 4.9: Classes e propriedades de Clientes ...................................................................... 106
Figura 4.10: Classes e propriedades de Comunicação ........................................................... 107
Figura 4.11: Discurso do domínio modelado para a teoria das Cinco Forças
Competitivas de Porter ...................................................................................... 109
Figura 4.12: Classes representando os elementos do referencial teórico ...............................110
Figura 4.13: Propriedades da ontologia.................................................................................. 111
Figura 4.14: Elementos constitutivos da ontologia, representando os dados referentes
às forças que integram o ambiente de competitividade de Porter ..................... 111
Figura 4.15: Modelagem da força competitiva Cliente .......................................................... 112
Figura 4.16: Representação da força Entrantes em potencial................................................. 112
Figura 4.17: Força competitiva Fornecedores ........................................................................ 113
Figura 4.18: Produtos substitutos em potencial......................................................................114
Figura 4.19: Querie elaborada para testar o funcionamento da ontologia.............................. 115
Figura 4.20: Resultado da avaliação do teste de consistência entre a ontologia proposta e a
ontologia inferida pelo aplicativo ...................................................................... 116
Figura 4.21: Resultado do teste de inconsistência da ontologia ............................................. 117
Figura 4.22: Esquema percebido pelo ambiente da construção da ontologia.........................118
Figura 4.23: As classes da atual fase da ontologia .................................................................119
Figura 4.24: Classe Cliente nível A........................................................................................ 120
Figura 4.25: Classe Cliente nível B ........................................................................................ 121
Figura 4.26: Classe Concorrentes na Indústria....................................................................... 122
Figura 4.27: Classe documentos............................................................................................. 123
Figura 4.28: Entrantes em potencial ....................................................................................... 124
Figura 4.29: Classe Fornecedores e algumas instâncias.........................................................125
Figura 4.30: Classe Produtos atuais........................................................................................ 126
Figura 4.31: Classe Produtos substitutos................................................................................ 127
Figura 4.32: Classe Tema dos documentos ............................................................................ 128
Figura 4.33: Classe Tipo de documento ................................................................................. 129
Figura 4.34: Propriedade “é ameaça entrante” .......................................................................130
Figura 4.35: Propriedade “é cliente remetente”...................................................................... 131
Figura 4.36: Propriedade “é fornecedor atual”.......................................................................132
Figura 4.37: Propriedade “é negociação com o cliente” ........................................................ 133
Figura 4.38: Propriedade “é negociação com fornecedor”..................................................... 134
Figura 4.39: Propriedade “é produção atual” ......................................................................... 135
Figura 4.40: Propriedade “é produto atual”............................................................................ 136
Figura 4.41: Propriedade “é produto similar” ........................................................................137
Figura 4.42: Propriedade “é produto substituto” .................................................................... 138
Figura 4.43: Propriedade É tipo documento........................................................................... 139
Figura 4.44: Propriedade É tipo tema documento .................................................................. 140
Figura 4.45: Propriedade “tem ameaça entrante”...................................................................141
Figura 4.46: Propriedade “tem nome”.................................................................................... 142
Figura 4.47: Visão esquemática do estágio atual da ontologia .............................................. 143
Figura 4.48: Classe produto atual bem como outras classes que com ela se relacionam.......145
Figura 4.49: Tela de validação da querie ............................................................................... 146
Figura 4.50: Tela com os indivíduos da classe Documento ................................................... 147
Figura 4.51: Clientes e as empresas ....................................................................................... 148
Figura 4.52: Correspondências que contêm reclamação e são dos clientes classe A.............149
Figura 4.53: Empresa que produz determinado tipo de produto para um cliente................... 150
Figura 4.54: Resultado de processamento de querie chamada Produtos atuais da
empresa 1........................................................................................................... 151
Figura 4.55: Funcionamento da querie que identifica todos os clientes ................................ 152
Figura 4.56: Identificação de todos os clientes da classe A ...................................................153
Figura 4.57: Queries identificando os clientes que enviaram correspondência com
reclamação ......................................................................................................... 154
LISTA DE QUADROS
Quadro 2.1: Resumo comparativo entre competitividade e sustentabilidade........................... 20
Quadro 2.2: Evolução do conceito de gestão do conhecimento ............................................... 26
Quadro 2.3: Metodologias para construção de Ontologias....................................................... 54
Quadro 2.4: Principais ferramentas para construção de ontologias.......................................... 56
Quadro 2.5: Tipos de linguagem para construção de ontologias.............................................. 58
Quadro 2.6: Sumário das principais diferenças entre metodologias de desenvolvimento de
ontologias ............................................................................................................. 60
Quadro 3.1: Resumo das características do controle................................................................ 69
Quadro 3.2: Contexto social no estabelecimento do controle organizacional......................... 70
Quadro 3.3: Características em termos de processo e infra-estrutura ...................................... 71
1 INTRODUÇÃO
Nos primeiros tempos da história das organizações, os objetivos organizacionais eram
eminentemente funcionais, explicavam-se com a existência da organização. Havia uma
relação direta entre a habilidade e o propósito do empreendedor com a natureza do
empreendimento.
Na medida que as organizações se desenvolviam, fazia-se necessário agregar mais
pessoas a elas. Esses colaboradores eram treinados e, assim, a empresa transferia-lhes
habilidades e competências. Como seus patrões, muitos colaboradores tinham o pensamento
empreendedor e, com o tempo, se desligavam das organizações que lhes haviam dado
emprego e capacitação e criavam outras empresas que desenvolviam os mesmos produtos.
Assim, passavam a disputar o mesmo mercado.
O conhecimento, que era um fator de monopólio, tornou-se motivo de concorrência. O
surgimento de produtos iguais a partir de habilidade iguais fomentou a competição pela
preferência. Com esse fenômeno, a direção da ação mudou de sentido: Inicialmente, o
mercado procurava algum fornecedor por ser o único a produzir o bem desejado. A partir do
momento em que mais de um produzia o mesmo bem, o mercado passou a ser objeto de
conquista. Desde então, as atenções têm-se voltado para o atendimento das necessidades do
mercado. E as organizações que têm dificuldade de identificar e atender essas necessidades,
encontram dificuldades para sobreviver.
Um fator inerente ao mercado, além de clientes, fornecedores e produtos, são os
concorrentes. É característica inerente ao mercado a existência concomitante de empresas que
disputam os mesmos clientes e que também entendem que devem atender as suas
necessidades. Como o mercado tem limitações de demanda, o aumento de fatia de mercado de
uma organização leva à conseqüente diminuição de fatia de mercado de outra. Esse jogo traz
como essência uma disputa que desafia as organizações a estarem sempre buscando mais
mercado, sabendo que outras organizações têm a mesma intenção. Esse fator leva,
naturalmente, à concorrência, e esta estabelece um movimento de competitividade.
2
Manter-se competitiva é o desafio maior para o qual deve capacitar-se toda a
organização. Competitividade, segundo Clark e Gury (1998), “é geralmente entendida como a
habilidade de uma empresa em aumentar seu tamanho, fatia de mercado e lucratividade”.
A organização deve ser capaz de manter um ritmo constante em seu crescimento,
como evidencia de competitividade. A habilidade de manter-se nessa constância depende de
estratégias de competitividade. A capacidade de uma organização em manter estratégias em
torno da concorrência é um fator de competitividade (ECIB 1994).
Estabelecendo um encadeamento de elementos, a competitividade é o resultado de
ações habilitadas, com o objetivo de fazer com que a organização cresça. Crescer, para a
organização, deve significar, entre outros aspectos, aumento de lucratividade, ou aumento de
fatia de mercado (PRADO 2004).
No passado, para uma organização gerar lucratividade e sustentar vantagens
competitivas, orientava sua ação gerencial para mão-de-obra barata, estratégias de
localização, utilização de recursos naturais e de capital (CORAL 2002). Atualmente, essa
realidade mudou. Além dos elementos citados, a influência das tecnologias nas comunicações,
no armazenamento, processamento e recuperação da informação e o novo cenário
estabelecido por uma realidade socioeconômica globalizada fizeram com que a sustentação de
uma posição competitiva constitua um desafio de dimensões complexas (ABREU 1999).
A nova ordem econômica fez com que alguns fatores pouco considerados no passado
passassem a ocupar lugar de destaque no presente. Nesse sentido, o conhecimento deixou de
ser um elemento de retórica e passou a constituir vetor estratégico de relevância para as
organizações. Segundo (DAVENPORT and PRUSAK 1998) “é o conhecimento a única fonte
sustentável de vantagem competitiva”.
O advento dos computadores favoreceu grandemente o processamento de dados. No
passado, o grande obstáculo para a o estabelecimento de cenários estava na computação dos
dados. Volumes de fichas e limitação de capacidade de processamento inviabilizavam muitos
trabalhos. Por vezes, chegava-se ao final de um processo com grande massa de dados para
serem processados. Porém o tempo que demandava tal atividade fazia com que as conclusões
a que se chegava não fossem mais interessantes por não serem mais informações atualizadas.
Essas limitações desencorajavam investimentos nesse tipo de atividade. Sem se
contestar a necessidade e viabilidade em termos de modelo, a questão da deficiência de
ferramentas para o trabalho computacional era o ponto crítico.
Atualmente, recursos computacionais não representam limitações para o trabalho de
processar dados e informações. As pesquisas em tecnologias da informação deram como
3
grande contribuição algoritmos que implementam tecnologias bastante eficientes para
tratamento dos dados. As tecnologias de banco de dados, redes de computadores e modelos
computacionais como redes conexionistas, além de um grande avanço de hardware,
simplificaram essas atividades, tornando-as presentes em qualquer processo de planejamento,
diagnóstico ou composição de cenários diversos.
Um aspecto a ser considerado, que se evidenciou grandemente com a facilidade de
acesso a computadores e tecnologias de compartilhamento de recursos computacionais, é a
capacidade de disseminação da informação. No passado, com as estruturas de mainframes e
por condição natural, em face do estágio de desenvolvimento dos recursos computacionais, os
desafios estavam em armazenar os dados e estabelecer formas de acessá-los para tratamento e
análise. Com isso, muito se avançou na tecnologia de processamento de dados estruturados.
Cadastros de clientes, fornecedores, empregados, produtos, dentre outros, eram inseridos nos
computadores através de estruturas de dados especializadas em administrar esses tipos de
dados.
Quando se analisa o comportamento estrutural do layout dos registros para armazenar
esses dados, conclui-se que tal estrutura não muda, independentemente do número de
ocorrências. O formato do registro para o cadastramento de um produto de estoque é o
mesmo, independentemente do volume de itens existentes nesse estoque. Para acessar
qualquer item desse cadastro basta ter um campo chave e o código do produto. O acesso às
informações desse item de estoque é possível em qualquer linguagem compatível.
Porém acessar dados para estabelecer controle sobre eles e, a partir deles, compor
cenários ou extrair informações, já não representa um desafio e não atende mais as
necessidades das organizações. O desafio está em fazer construir ou utilizar conhecimentos,
em estabelecer relações entre conteúdos existentes nos computadores que representem fontes
de conhecimentos.
Os computadores são máquinas com habilidades inatas para serem acessados e lidos.
Assim como os livros, basta abri-los e lê-los. Um fator relevante a observar é que, quando um
ser humano abre um livro e percorre suas linhas, o entendimento faz a identificação e filtra as
informações, classificando-as. Com este recurso as pessoas entendem o que estão lendo,
contextualizam e assim extraem a informação deste livro.
As pessoas contam intrinsecamente com uma estrutura conceitual que foram
desenvolvendo ao longo do tempo. E essa estrutura é que lhes possibilita extrair do livro lido
as informações e assim ampliar, alterar ou rejeitar a sua estrutura conceitual. Porém os
computadores não têm um processo de educação similar ao dos humanos, pois não contam
4
com a habilidade natural, existente nos humanos, para construção dessas estruturas
conceituais. Como os humanos, os computadores podem acessar outros computadores e ler o
conteúdo neles existente. Porém esses mesmos computadores não são providos de recursos,
como os seres humanos, para selecionar os conteúdos lidos.
Cada vez mais, o conhecimento é fundamental para a dimensão estratégica da
organização. Também é crescente a solicitação às pessoas para que desenvolvam mais
atividades e com mais agilidade, pois os cenários em que estas organizações então inseridas
são mais instáveis. Requerem ações em tempos cada vez menores.
É vital para qualquer organização ter uma estratégia de competitividade, a qual
estratégia envolve tarefas que devem ser executadas dentro de prazos e dimensões bem
definidas. Contar com recursos computacionais para desenvolver ações inerentes a uma
estratégia de competitividade é um fator critico nas organizações.
1.1 DEFINIÇÃO DO PROBLEMA DE PESQUISA
Para (O'BRIEN 2001)), a informação é o dado contextualizado. Portanto, a
manipulação do dado através de modelos que o contextualizem constitui uma forma de
construir informações, e estas são fundamentais na gestão do conhecimento ou em qualquer
atividade humana.
Em uma organização ou em um consórcio de empresas, a recuperação eficiente de
dados e informações se tornou fator estratégico. Ela é básica no planejamento, na
organização, na direção e controle de qualquer atividade. A elaboração de diagnósticos, a
disseminação de um conhecimento, o estabelecimento de estratégias, o desenvolvimento de
estudos e a composição de cenários são algumas destas atividades que necessitam de
conhecimento para serem executadas.
A recuperação eficiente dos dados, elemento básico da informação, contempla várias
dimensões que devem ser observadas como fatores essenciais para a construção de um
processo eficaz. Nesse sentido, o tempo e a precisão na ação de identificar, selecionar e
apresentar os resultados da pesquisa são atividades de suma importância. Sendo assim, a
recuperação de dados passa a ter importância estratégica no processo de gestão da
informação, dentro de uma organização.
5
Resgatando a origem das organizações, é importante considerar que:
as organizações e as empresas surgiram espontaneamente, como culminação
de uma atividade continua, “exigindo e regulando” o comportamento de
indivíduos e de grupos sociais na consecução de determinado objetivo.
(MIRANDA 1981)
Considerando que as informações presentes na organização emergem da
contextualização de seus dados (O'BRIEN 2001) e que uma estratégia de competitividade
encontra na informação a base de sustentação, tem-se na atividade de recuperação destes
dados a exegese da formulação da competitividade. A informação que resultará da
contextualização dos dados servirá de base para a formulação estratégica.
Grande parte dos dados de uma organização não se apresenta de forma estruturada, em
banco de dados, ou em arquivos com formato capaz de favorecer o acesso a seus dados de
forma clara e rápida (ATZENI, MECCA et al. 1997). É o caso de dados contidos em
relatórios, pareceres, notícias, etc. Neste caso, o acesso a esses dados, que estão contidos em
documentos denominados “não estruturados”, torna-se um desafio.
Considerando estes aspectos, apresenta-se como o problema da presente pesquisa:
•
Como acessar os dados presentes em documentos não estruturados de uma
organização, para dar sustentação a uma estratégia de competitividade?
1.2 JUSTIFICATIVA
A organização documental sobre as várias atividades da empresa apresenta uma
diversidade muito grande. As teorias existentes, a forma de implementá-las, o aporte das
tecnologias da informação, o comportamento de clientes, concorrentes, fornecedores e do
mercado e a evolução das práticas de gestão são alguns dos fatores geradores desta
diversidade. Nesse ambiente de idéias, estratégias, relatos, resultados, políticas, métodos e
procedimentos, muitas experiências estão narradas em artigos, apostilas, manuais, leis e
normas (ABITEBOUL 1997).
Por outro lado, verifica-se que há muita informação fragmentada, muito material para
pesquisa e muitas respostas já enunciadas – porém “perdidas” – nos computadores que
integram as redes, por falta de uma solução de acesso que os inclua em um acervo
bibliográfico, ou em um domínio específico.
6
Essas informações fragmentadas, parte presente em relatórios, parte em apostilas,
parte em artigos, muito contribuem para a composição do mosaico no qual se incluem e que
pode ser objeto de estudo para pessoas ou grupo de pessoas. Podem ser focos de interesse dos
mesmos.
O interesse por acessar informações na organização pode ter várias origens e
aplicações. Para a área jurídica, o interesse se volta para processos inerentes à área; para a
área de administração, outros são os interesses. Com base nestas informações, orientam-se
procedimentos, avaliam-se e definem-se metas, estabelecem-se reajustes, enfim, exerce-se a
gerência.
Para o caso da gestão estratégica, o enfoque não é diferente. Um aspecto a ser
considerado é que se alguma informação não for acessada, isso pode comprometer a
eficiência da gestão. Quando se estabelece um plano de ação, uma estratégia que tem nas
informações uma questão substancial, os colaboradores são peças fundamentais na detecção e
repasse das mesmas. Quando a informação pode ser facilmente controlada por computador, a
possibilidade de que se perca ou não seja considerada é bastante remota. Porém, quando a
possibilidade do computador controlar este informação é pequena, a estratégia fica totalmente
dependente da capacidade humana de executar esse controle. Considerando a possibilidade de
erro, ou de ausência do responsável pelo controle da informação, torna-se bastante importante
contar com recursos computacionais para controlar estes tipos de informações. O problema é
que o referencial a ser considerado para a sustentação da estratégia está na mente do
colaborador; exige algumas habilidades que não estão presentes nos computadores. Essas
habilidades requerem a compreensão de um ambiente que envolve conceitos e suas relações,
elementos que estabelecem regras com um grau de subjetividade bastante acentuado.
Quando se analisam processos como cálculo de folha de pagamento, contabilidade,
administração de estoque, entre outros, percebem-se claramente as regras de negócios e a
estabilidade destas regras. Essa característica possibilita a criação de modelos computacionais
relativamente simples que habilitam os computadores para o desenvolvimento dessas
atividades. Já a possibilidade de o computador manter o controle sobre as informações tornase bastante pequena quando se trata de questões mais abstratas, presentes em documentos não
estruturados como textos – por exemplo, a identificação de referências sobre um determinado
concorrente, feita em um relatório de sessão de licitação, ou o relatório de visita a um cliente
onde se cita o valor de um produto oferecido pela concorrência. Neste sentido, evidencia-se a
importância de construir um modelo que dê aos computadores habilidade para percorrer esses
documentos e identificar tais elementos.
7
A aplicação de uma solução para recuperação de dados baseada em um referencial de
competitividade libera a mente dos executivos da organização para outras atividades mais
importantes, deixando esta tarefa meramente mecânica para os computadores. Esta realidade
permite racionalizar recursos organizacionais e aperfeiçoar a capacidade competitiva da
organização.
É importante ter-se presente que o êxito organizacional tem relação com a gestão do
conhecimento, na medida em que se utiliza a tecnologia como meio para a conquista dos
objetivos da organização (YOGESH 2004). O conhecimento é a essência da organização. É o
fator critico de sucesso. A organização que não administra seus saberes está condenada a
viver sempre recomeçando (OLIVEIRA 2002).
Considerando que uma das funções básicas da administração é controlar, é
fundamental exercer tal função sobre as informações da organização. Segundo Jaques Rueff
(apud (OLIVEIRA 2002), “classificar prioridades e formular programas é fácil. Difícil é
balancear e monitorar expectativas.” Entende-se, então, que o afã de controlar deve estar
acompanhado da necessidade de balancear e monitorar demandas e recursos.
O balanceamento e monitoramento requerem ações continuadas e precisas, para
acompanhamento, medida e conciliação. A aplicação de modelos de gestão do conhecimento
auxilia os gestores nessas tarefas acima, na medida que permite constituir mecanismos que
executam a tarefa de localizar, identificar e selecionar as informações necessárias para o
trabalho de gestão do conhecimento de cada gestor. Ao repassar este trabalho para modelos
computacionais especializados, o gestor é auxiliado, pois grande parte das atividades
rotineiras voltadas para a gestão do conhecimento são desenvolvidas por computadores.
Segundo Oliveira (2002) “o grande problema é a definição das informações que
devem ser selecionadas e, principalmente a forma de integrá-las à organização”. Assim, a
aplicação de um modelo de gestão que envolva esse conhecimento poderá favorecer
grandemente a eficiência desta atividade.
O esforço se concentra em definir os conhecimentos que darão base para o modelo e,
com base nessas estruturas, prever como o modelo se comportará quando em operação. No
instante em que isto acontece, a visão compartilhada está presente, resultado do esforço
realizado anteriormente na aplicação de um arcabouço tecnológico que capacita este modelo
de gestão do conhecimento aa atuar dentro de conceitos que sustentam a organização.
Cabe observar também que o acesso ao acervo de conhecimentos gerados pela própria
organização é fator estratégico, pois favorece a disseminação da informação. Sendo assim, o
acesso a estes acervos é um fator de êxito para pesquisadores e grupos de pesquisa, na medida
8
que, através do acesso, está-se considerando o já produzido e encurtando distâncias entre o
ponto de partida e o de chegada para a pesquisa da realidade que se quer conhecer.
O acesso a dados e informações é uma atividade inerente ao processo de gestão do
conhecimento. Se o acesso a dados ou informações não estruturadas contar com uma
metodologia de indexação eficiente, eficiente será o processo como um todo.
1.3 AS HIPÓTESES DA PESQUISA
O compromisso da engenharia com o aperfeiçoamento de processos é a base para a
abordagem deste projeto de pesquisa. Considerando que a engenharia é "o conjunto de
conhecimentos e técnicas que permitem aplicar o saber científico à utilização da matéria e das
fontes de energia" (AURELIO 1994) e que o próprio conhecimento pode ser a matéria ou a
fonte de energia, ou seja, o alvo da aplicação do conhecimento de engenharia, tem-se um
enfoque bastante próprio à exegese do trabalho aqui apresentado.
Capacitar as organizações para acessar os dados de forma rápida e integrada,
independentemente de serem eles estruturados ou não, contribui para aumentar a segurança no
manuseio da informação, diminui retrabalho, possibilita a reusabilidade dos dados
(principalmente dos não estruturados), proporciona economia e aumento de produtividade,
garante maior controle sobre os dados existentes nos computadores da organização e contribui
para efetivar os recursos computacionais como elementos facilitadores no propósito de
conquistar os objetivos organizacionais.
As hipóteses que sustentarão o presente estudo o são as seguintes:
a) É possível modelar conceitos baseados em uma estratégia de competitividade.
b) É possível implementar o conceito modelado em um computador.
c) É possível, através do modelo implementado, identificar, selecionar e recuperar
documentos não estruturados, segundo critérios definidos no modelo de
competitividade.
9
1.4 OBJETIVOS DA PESQUISA
1.4.1 Objetivo geral
O presente trabalho de pesquisa tem por objetivo desenvolver um modelo para
recuperação de dados não estruturados, com base em um referencial de competitividade
organizacional.
1.4.2 Objetivos específicos
•
Modelar um domínio de conhecimento com base em uma estratégia de
competitividade.
•
Construir uma ontologia para representar o domínio do conhecimento modelado.
•
Implementar a ontologia
•
Executar testes em nível conceitual, para validar o modelo desenvolvido.
1.5 RELEVÂNCIA, CONTRIBUIÇÃO E INEDITISMO
A relevância e contribuição da pesquisa estão na possibilidade de oferecer às
organizações um ambiente similar a um Enterprise Information Sistem – E.I.S., composto por
dados de diferentes formatos e localizados em diferentes locais.
Segundo (FURLAN, IVO et al. 1994), “E.I.S. é uma tecnologia que visa integrar num
único sistema de informação todas as informações necessárias, para que o executivo possa
verificá-las de forma numérica, textual, gráfica ou por imagens.” O uso de tal tecnologia
auxilia grandemente a atividade dos gestores porque, segundo (LAUS, AZAMBUJA et al.
2002),
com a utilização do EIS, pode-se verificar informações desde o nível
consolidado até o nível mais analítico que se desejar, de forma rápida e
segura, possibilitando um melhor conhecimento e controle da situação e
maior agilidade e segurança no processo decisório.
O que se observa, no entanto, é que os E.I.S existentes estão habilitados a fazer acesso
a repositórios cujos dados estão armazenados em estruturas formais e homogêneas. A
proposta do trabalho de pesquisa em questão é habilitar um ambiente de Gestão da
10
Informação para recuperar dados, independentemente da forma, focado em uma estratégia de
competitividade. A recuperação dos dados tem significância a partir da estratégia de
competitividade eleita para dar sustentação ao modelo. Tal estratégia estabelecerá as diretrizes
e restrições para identificação e seleção das informações criticas, necessárias para dar
sustentação à estratégia de competitividade.
O modelo construído permite à organização ter acesso e controle sobre um conjunto de
dados que dão sustentação a sua estratégia de competitividade. O modelo atua segundo um
viés encapsulado no referencial teórico que orienta a estratégia escolhida. Este viés define
políticas e diretrizes que o modelo sustentará.
A estrutura operacional que dá seguimento às atividades vinculadas às diretrizes e
políticas tem no modelo proposto ações de identificação e seleção de documentos não
estruturados que, para serem repassados para os colaboradores, requereriam um nível de
treinamento bastante alto, exigindo também alto nível intelectual das pessoas envolvidas.
A aplicação dessa tecnologia permite maior sustentabilidade à gestão da organização,
na medida que disponibiliza informações selecionadas em um ambiente operacional fácil de
gerir, facilitando o suporte tecnológico necessário para a tomada de decisão dos gestores da
organização.
O ineditismo deste trabalho reside no fato de que o controle das informações não
estruturadas, presentes nos computadores da organização, no que se refere à estratégia de
competitividade, contará com uma ferramenta computacional que envolve um conhecimento
presente no modelo. Este conhecimento proverá inteligência à ferramenta, na medida que os
documentos semi-estruturados, presentes na organização, receberão um tratamento semântico.
Isso favorecerá a identificação das informações presentes nestes e assim propiciará o controle
sobre as mesmas.
O modelo utiliza uma ontologia que representa a estrutura de conhecimento presente
na proposta de Porter para a estratégia de competitividade baseada nas cinco forcas
competitivas. São consideradas as cinco forças competitivas e a relação entre elas, permitindo
ao gestor da estratégia de competitividade ampliar a sustentação a mesma, através da
utilização dos dados não estruturados anteriormente pouco utilizados, em função da
dificuldade de aplicar recursos computacionais para tratar esse tipo de dados.
11
1.6 METODOLOGIA
1.6.1 Características da metodologia aplicada
O projeto de pesquisa é de natureza tecnológica e aplicada. O foco é identificar um
conjunto de tecnologias e organizá-las de tal forma que um modelo possa ser construído e
testado com base na premissa de dotar a organização de condições de recuperar dados não
estruturados para dar sustentação a uma estratégia de competitividade organizacional.
O presente trabalho utilizará procedimentos experimentais. A partir de um referencial
teórico, será desenvolvido um modelo computacional que terá como procedimento de
validação a aplicação de ferramentas computacionais que constroem e validam ontologias.
A construção de ontologias requer um nível de nexo que, quando ausente, inviabiliza o
funcionamento das mesmas. Como a ontologia construída é a representação de um domínio de
conhecimento (CASTRO 2000), presente no modelo de Porter (PORTER 1996), a coerência
das respostas para as “perguntas” feitas à ontologia determinará seu grau de eficiência e
validade.
O comportamento dos processos de validação da ontologia baseia-se em preceitos
sustentados pela teoria dos conjuntos e pela lógica de predicados. O conjunto que conterá os
elementos, fruto da ocorrência de um axioma, representado em uma frase modelada na
ontologia, não poderá ser vazio. Se o for é porque o axioma não se aplica ao domínio do
conhecimento modelado ou há erro.
Com base no modelo teórico construído, pode-se elaborar afirmações capazes de
serem representadas no computador. Se o modelo sustentar essas afirmações e apresentar
como resposta elementos que dão eficiência ao modelo, comprova-se que o produto do
trabalho de pesquisa atende aos objetivos para os quais foi construído.
A pesquisa bibliográfica será realizada por meio de acessos a sites especializados,
livros, artigos científicos, dissertações e teses.
A pesquisa será direcionada às áreas de:
a) Competitividade organizacional;
b) Gestão do conhecimento;
c) Recuperação de informações e classificação do dado a partir do tipo de estrutura;
d) Ontologia.
As áreas acima mencionadas darão suporte teórico para o trabalho a ser desenvolvido.
O modelo a ser desenvolvido deverá contribuir com o aumento da competitividade
12
organizacional, na medida que promoverá eficiência no tratamento dos dados não estruturados
como fator de sustentação para a estratégia de competitividade em questão.
A etapa que aborda questões vinculadas à gestão do conhecimento resgata de que
forma o conhecimento, o dado e a informação se relacionam e de que forma o modelo poderá
contribuir para o melhoramento deste tipo de gestão.
A recuperação do dado é o objeto de pesquisa deste trabalho. O modelo a ser
construído constituir-se-á em uma ferramenta para a recuperação de informações não
estruturadas. A construção de uma ontologia, a partir da modelagem do domínio do
conhecimento presente no referencial teórico, permitirá atender a questão da pesquisa.
1.6.2 Validação do modelo e limitações
O modelo construído será validado teoricamente, a partir da aplicação em um modelo
conceitual. O suporte à validação das regras definidas no modelo dar-se-á com base na lógica
formal, na teoria dos conjuntos e nos axiomas presentes no domínio de conhecimento
modelado.
Um parâmetro fundamental de validação do modelo está calcado na habilidade para
tratar dados não estruturados a partir de regras de validação definidas por um referencial
teórico de competitividade.
A limitação do modelo será estabelecida pela premissa teórica que sustenta o modelo
de competitividade e por questões estruturais da organização onde o modelo for
implementado.
1.6.3 Estrutura do trabalho
A pesquisa está estruturada contemplando os seguintes focos:
•
definição do problema;
•
fundamentação teórica;
•
o modelo proposto;
•
construção da ontologia;
•
resultados, conclusões e contribuições;
•
anexos e elementos complementares.
13
O primeiro capítulo – Introdução – contém as considerações iniciais da pesquisa. Este
capítulo é composto por subitens que apresentam a definição do problema da pesquisa, a
justificativa, as questões da pesquisa e os objetivos, bem como limitações e a estrutura do
trabalho.
O segundo capítulo aborda a fundamentação teórica e apresenta os pilares referenciais
para o desenvolvimento do projeto de pesquisa. Esta parte está estruturada em subitens assim
denominados: O papel da engenharia; Dados, informação e conhecimento; Bibliotecas ou
repositórios de dados, uma realidade presente; Competitividade organizacional; Gestão do
Conhecimento; Recuperação de informações e Ontologias.
O terceiro capítulo aborda o modelo proposto. Esta parte do projeto de pesquisa
apresenta o modelo de competitividade escolhido como referencial, a modelagem do domínio
do conhecimento que o envolve, a construção da ontologia que representa este domínio e o
modelo computacional que suportará a ontologia.
O quarto capítulo apresenta o processo de construção da ontologia a partir da
metodologia selecionada e do referencial de competitividade de Porter.
Os resultados e conclusões da aplicação do modelo proposto são apresentados no
quinto capitulo.
2 FUNDAMENTAÇÃO TEÓRICA
A abordagem proposta para o presente trabalho de pesquisa considera quatro linhas de
conhecimento que, combinadas, favorecerão a conquista dos objetivos propostos. A
combinação dessas linhas de conhecimento poderá validar a posição de que a competitividade
organizacional tem sustentação em uma gestão de conhecimento que, contando com uma
estrutura para a recuperação dos dados da organização, permita transformá-los em
informações, a partir da contextualização dos mesmos.
A contextualização é favorecida pela construção de um cenário que represente a
realidade em estudo. Considerando esta premissa, a aplicação de um modelo de
competitividade ao âmbito organizacional, permitirá a construção desse cenário, que
favorecerá a identificação da informação presente no dado.
Sendo assim, o processo de revisão bibliográfica caminha nas áreas de gestão do
conhecimento, ontologias, recuperação de informações e competitividade organizacional.
2.1 O PAPEL DA ENGENHARIA
A necessidade de aplicar inteligência aos processos é uma característica universal. A
natureza a todo instante convida-nos a buscar uma forma mais inteligente de realizar as
atividades, uma forma mais econômica de utilização dos recursos.
A gestão do conhecimento, a realidade da tecnologia da informação e a necessidade de
recuperar dados estruturados ou não estruturados com rapidez e maior precisão são
sustentadas por processos que podem ser aperfeiçoados.
De acordo com (CARDOSO 1993), é necessário "racionalizar os sistemas produtivos
através do desenvolvimento das melhores formas dos métodos de trabalho, visando a
produtividade e qualidade do sistema como um todo”. Considerando que a idéia de sistemas
produtivos pode ser aplicada a todos os processos, nas mais diversas atividades, temos como
resultado conhecimentos, culturas, hábitos e procedimentos. Esses elementos, como produtos
15
de um processo, necessitam ser identificados e utilizados para que possam gerar formas e
métodos de trabalho visando a produtividade e a qualidade.
Quando se observa a realidade das organizações, percebe-se a importância de dados e
informações para o desenvolvimento de seus processos. Para algumas, o conhecimento que se
pode extrair dos dados é fator substancial; para outras, vinculadas à pesquisa e educação, é
substancial o resultado final da execução de seus processos produtivos. Entretanto, para todas,
o próprio conhecimento é fator estratégico.
2.2 DADOS, INFORMAÇÃO E CONHECIMENTO
O objetivo de abordar questões relacionadas com dados, informações e conhecimento
é o de estabelecer uma relação sob o foco de ciência da computação para o tema. Nesse
sentido, o processamento dos dados, da informação e, mais recentemente, do conhecimento é
uma questão de modelo computacional suportado por recursos de hardware e software. Sob
este enfoque devem ser consideradas as questões aqui abordadas.
O conhecimento é a base de toda ação humana. Quanto maior o conhecimento, mais
profícua e fecunda é a ação por ele exercida (PECOTCHE 1985).
As organizações são criadas e mantidas por ações humanas. Logo a mesma relação
que se estabelece entre o ser humano e suas ações pode ser utilizada para as relações entre as
organizações e suas ações.
As pessoas dentro das organizações, por questões de custos e, conseqüentemente, de
competitividade, nem sempre dispõem do tempo que seria necessário para monitorar os dados
presentes na própria organização. Esta limitação faz com que haja retrabalho em alguns casos
ou desconhecimento de dados importantes para o encaminhamento de ações estratégicas
(MELLO, Dorneles et al. 2000).
As organizações estão cada vez mais conscientes da importância do conhecimento
para entender o próprio negócio e assim atender as necessidades de permanência no mercado
cada vez mais competitivo. A gestão do conhecimento é uma atividade cada vez mais
estratégica nas organizações. Este tipo de gestão “é um conjunto de processos que define a
criação, disseminação e utilização do conhecimento para atingir plenamente os objetivos da
organização” (ALVES 2002).
A partir do exposto, é possível inferir que a competitividade requer conhecimento e
este está calcado nos dados. Assim, obter a capacidade de acesso pleno aos dados da
16
organização e dispor deles orientado por uma metodologia de competitividade é municiar a
organização, para que esta mantenha a sua capacidade competitiva.
Nos computadores da organização, temos dados estruturados, presentes em banco de
dados, por exemplo, e dados não estruturados ou semi-estruturados, presentes em diversos
documentos como textos e páginas web. Ter o acesso pleno aos dados da organização é poder
acessar os dados estruturados e os não estruturados.
Revisemos os conceitos de dado, informação e conhecimento, segundo especialistas:
Para (DRUCKER 2001) e (DAVENPORT and PRUSAK 1998), o dado é
simplesmente o fato capturado de uma entidade qualquer, que, passa por um processo de
organização e interpretação para geração da informação, que por sua vez, passa por um
processo de análise/reflexão para geração do conhecimento (discernimento, experiência ou
habilidade aplicável a um processo empresarial).
Já a informação, para (O'BRIEN 2001), resulta da contextualização do dado. Requer a
elaboração de cenário, a identificação dos elementos que atuam nesse cenário, a localização
do dado nesse contexto e a avaliação das relações entre o dado em questão e ambiente onde
ele está inserido.
Por fim, conhecimento, segundo (Serrano 2004), “é a informação que muda algo ou
alguém, quer por se transformar em base para as ações, quer por fazer um indivíduo ou uma
organização ser capaz de ações diferentes e mais efetivas. O conhecimento é o resultado de
um processo entre o saber acumulado e a informação adquirida e é diferenciado, devido a
peculiaridade de cada um.”
Mello (2000) alerta para o fato de que “a Web vem se tornando um vasto repositório
eletrônico de dados” e ressalta que o acesso a estes dados não é tarefa fácil, já que “grande
parte destes dados não estão mantidos em bancos de dados por terem uma organização
bastante heterogênea, que pode variar de um texto informal até um conjunto de registros bem
formatados”. Portanto, capacitar as organizações para acessar esses dados de forma rápida e
integrada, independentemente de serem ou não estruturados, tornou-se fator estratégico.
Com o aperfeiçoamento dos processos de telecomunicação e dos recursos
computacionais, sobreveio um aumento significativo na capacidade de gerar documentos e
informações. Tamanho volume de documentos e informações existentes nas organizações,
quer nos computadores pessoais, quer na Web acessível a estes computadores pessoais, acaba
por trazer problemas no momento de acessá-los. Este problema é caracterizado por Chen
(1994) como "sobrecarga de informações", pois o usuário, ao estabelecer um procedimento de
17
pesquisa junto a estas fontes de documento, obtém muitos dados e, em geral, não consegue
tratá-los, tendo dificuldade de encontrar o conhecimento procurado.
2.3 BIBLIOTECAS OU REPOSITÓRIOS DE DADOS, UMA REALIDADE
PRESENTE
Outro fator a considerar, vinculado à engenharia e aos processos produtivos, são as
modificações sofridas pelas estruturas destinadas ao armazenamento das informações. No
passado, essas estruturas, representadas pelas bibliotecas, tinham uma dimensão
eminentemente física. Havia prateleiras, tomos, e uma forma indexada de acessá-los. Com o
advento das tecnologias de informação, mais precisamente das redes de computadores e da
Internet, as bibliotecas tornaram-se menos físicas e limitadas, para assumirem a condição de
intangíveis, virtuais e com características ilimitadas.
Antigamente, o acesso ao acervo das bibliotecas se dava por meio da entrada em um
ambiente físico que tinha um endereço físico e, fisicamente, se acessava o veículo que
continha o dado e a informação. Atualmente, acessa-se um endereço virtual, em um local
também virtual. Nesse local virtual, acessa-se o veículo que contém a informação, que pode
ser um livro, um artigo, uma planilha ou qualquer outro elemento armazenador de
informação, existente nestes ambientes virtuais.
Com o advento das tecnologias que transformaram em virtuais os espaços das
bibliotecas, estabeleceu-se um paradoxo desafiador. Antes os ambientes físicos de bibliotecas
permitiam acesso determinado e controle efetivo sobre a geração de novos volumes, veículos
de dados, informações e conhecimentos. Embora localizáveis visualmente e com
tangibilidade, as informações estavam restritas a quem, fisicamente, pudesse ter acesso ao
ambiente. Atualmente, a intangibilidade do ambiente e a virtualidade de sua localização
fazem com que ocorra de forma mais fácil o acesso a esses veículos que contêm as
informações e conhecimentos. Porém o controle sobre o produzido, em termos de dados,
informações e conhecimentos, torna-se cada vez mais difícil.
A disseminação da informação e do conhecimento através de artigos, livros, sites,
planilhas e outras formas existentes em meios eletrônicos tem trazido como grande desafio o
estabelecimento de mecanismos de acesso e controle destes documentos. A realidade das
organizações já não contempla o conhecimento apenas como um insumo em seus processos.
Este transformou-se em riqueza, em diferencial de competitividade (DAVENPORT and
PRUSAK 1998; ALVES 2002). É crescente o número de organizações que vêem no
18
conhecimento um elemento estratégico, que têm no capital intelectual o valor intangível que,
mais que integrar o seu patrimônio, estabelece vantagens competitivas.
Considerando o dado como a base da informação e esta como um elemento a ser
analisado e também como a base para o conhecimento, vem-se consolidando de maneira
efetiva, como fator preponderante nas organizações, a evolução no trato com o os dados, as
informações e o conhecimento.
Dar aporte para quem necessita da informação e do conhecimento – como elementos
substanciais e, ao mesmo tempo, produtos finais – é uma tarefa de demanda crescente e
continuada. As organizações, de maneira geral, têm no conhecimento um de seus insumos
mais importantes.
Com a maior presença de recursos computacionais e de novas e mais eficientes
tecnologias o "praticar o que se estuda e estudar o que se pratica".(PECOTCHE 1994), tem se
tornado uma busca diária em muitas organizações.
Importante é observar que esta prática estabelece desafios. A prática do que se estuda
parte da teoria para a ação, e tem, como principal fator de origem, a base teórica existente em
bibliotecas. E o estudo do que se pratica tem como origem à análise, avaliação e conclusão
dos resultados alcançados que compõem, artigos, manuais, pareceres e recomendações que
nem sempre estão organizados em bibliotecas, já que se trata de documentos gerados no
escopo das organizações, por vezes inerentes a necessidades pessoais, de setores e
departamento que nem sempre está disponibilizado de maneira formal para toda a
organização.
Considerando que nas organizações pode haver mais de um grupo de pesquisa, cada
grupo pode gerar seu próprio acervo. Se não houver uma metodologia e ferramentas
adequadas para administrar esta realidade, tem-se redundância e discrepância de dados e
informações que podem gerar prejuízos, tais como grupos de trabalho elaborando pesquisas já
feitas por outros grupos, decisões incorretas por falta de conhecimentos presentes em outras
áreas que poderiam ser de domínio da empresa como um todo e divulgação de dados e
informações com valores diferentes para a mesma questão, entre outras.
Quando se lida com dados estruturados a construção de indexadores favorece o acesso
a estas informações. Geralmente contemplam dados cadastrais, resultados de exercícios
contábeis, resultados físicos e financeiros de projetos, saldos em estoques, e similares. Porém,
quando o dado ou a informação está em um parágrafo, presente em um título de texto ou em
um site, as técnicas para a indexação destes conteúdos assumem relevante grau de dificuldade.
19
A relevância está no fato de que não é tarefa fácil e simples a indexação destes tipos de dado
ou informação.
2.4 COMPETITIVIDADE ORGANIZACIONAL
Entende-se por competitividade, “a habilidade de uma empresa em aumentar seu
tamanho, fatia de mercado e lucratividade" (CLARK and GURY 1998). Neste sentido,
percebe-se que há uma relação bastante estreita entre gestão do conhecimento e
competitividade organizacional, na medida em que conhecer o mercado e estabelecer
estratégias para lidar com ele é a forma de atender o objetivo da organização que, dentre
outras metas, busca aumentar seu tamanho de fatia de mercado.
Considerando os fatores que determinam a sustentação de estratégias de
competitividade, pode-se avaliar a importância da gestão do conhecimento para estabelecer
tais estratégias. (CORAL 2002), destaca alguns fatores que são determinantes para
competitividade das organizações:
•
Eficiência: produtividade do trabalho e de capital;
•
Qualidade: valor percebido pelo consumidor;
•
Flexibilidade: produto, volume, produção, maquinário, processo e materiais;
•
Rapidez: inovação, produtos novos em relação ao total de produtos, atendimento
das necessidades dos consumidores;
•
Sinergia interna e relacionamentos com clientes, fornecedores, institutos de
pesquisa públicos e privados;
•
Capacidade de Pesquisa e Desenvolvimento (P&D);
•
Capacidade de gestão na área de inovações.
Um fator primordial na gestão da competitividade organizacional está no desafio de
manter a sustentação da vantagem competitiva. A capacidade que a empresa tem em manterse inovadora contribui sobremaneira para estabelecer vantagens. Sendo assim, associar
metodologias e combinar competências essenciais favorece a criação de uma ação ímpar de
competitividade, dificultando o entendimento e replicação de estratégias, no curto prazo,
pelos concorrentes. Para tanto, investir em pesquisa buscando aportes de tecnologia deve
constituir ação continuada e rotina a ser estabelecida na organização.
Estabelecer ações que propiciem sustentabilidade, portanto, é uma ação fundamental
na definição da estratégia de competitividade organizacional. Para (SACHS 1993), a
20
sustentabilidade possui dimensões que podem ser analisadas individualmente ou
coletivamente. Os fatores de sustentabilidade, segundo o autor, são os seguintes:
•
Sustentabilidade social: Significa contribuir para a eqüidade na distribuição de
renda entre os habitantes do planeta.
•
Sustentabilidade ambiental: Utilizar os recursos naturais que são renováveis e
limitar o uso dos recursos não renováveis.
•
Sustentabilidade econômica: Reduzir os custos sociais e ambientais.
•
Sustentabilidade espacial: Atingir uma configuração de equilíbrio ente as
populações rural e urbana.
•
Sustentabilidade cultural: Garantir a continuidade das tradições e pluralidade dos
povos.
O Quadro 2.1 apresenta um resumo relacionando competitividade e sustentabilidade
das organizações.
Quadro 2.1: Resumo comparativo entre competitividade e sustentabilidade (CORAL 2002)
Competitividade
Baseada em fatores econômicos e
operacionais
Sustentabilidade
Baseada em fatores econômicos, sociais e
ecológicos
Visão de mundo restrita – empresas contra as Visão de mundo mais ampla – parcerias para
forças competitivas
obter vantagens competitivas
Legislação ambiental = aumento dos custos
de produção
Legislação ambiental = promoção da
inovação
Uso de tecnologias de produção tradicionais
Uso de tecnologias limpas de produção
Questões do meio ambiente natural
geralmente são vistas como ameaças
Questões do meio ambiental geralmente são
vistas como novas oportunidades
Foco na redução e eficiência operacional
Foco na inovação
Individualista
Cooperação
A competitividade organizacional tomou outra dimensão com os estudos realizados
por Porter e outros pesquisadores. Antes desses estudos, entendia-se que a competitividade
existia entre fornecedores do mesmo produto ou serviço. Atualmente, entende-se que em um
sistema de forças, interno ou externo a um setor de indústria, há a influência de forma coletiva
sobre a natureza e a intensidade com que os elementos que integram este setor se relacionam.
21
Observou-se que há um sistema de forças que interfere no potencial de lucratividade
(MONTGOMERY and PORTER 1998). Na constituição de um setor de indústria, estão
presentes clientes, fornecedores, novos entrantes em potencial, produtos substitutos. E todos
esses elementos, em conjunto, estabelecem um sistema de forças. Assim, dependendo da
habilidade e das estratégias estabelecidas para interagir com este sistema, um integrante
desses grupos de economia em interação influi na lucratividade de todos os demais.
O sistema acima delineado é conhecido como “as cinco forças competitivas de Porter”
(PORTER 1996). A Fig. 2.1 apresenta os elementos integrantes desse sistema e suas relações.
Figura 2.1: Modelo das forças competitivas de Porter (PORTER, 1996)
Esse ambiente da indústria, seja ele nacional ou internacional, envolva produtos ou
serviços, sempre propiciará situações em que os compradores exercerão pressão sobre as
empresas, influenciando no comportamento dos preços que poderão ser praticados.
O poder dos compradores poderá exercer influência sobre os custos e investimentos,
na medida em que compradores poderosos influenciem no perfil dos produtos ou serviços a
serem oferecidos.
Os fornecedores poderão influenciar nos preços, na medida que se organizem ou sejam
forçados por fatores diversos. A rivalidade entre empresas poderá gerar diminuição de custos,
modificação nas vendas. A ameaça de entrada de produtos substitutos pode gerar
movimentações nas empresas, fazendo com que haja investimentos em novas áreas de
pesquisa ou modificação no perfil do serviço ou produto ofertado.
22
A ameaça da entrada de novas empresas concorrentes pode alterar o perfil da indústria,
fazendo com que práticas de negociação, associação de concorrentes e outras operações
possam ocorrer.
A relação estabelecida por Porter indica que fornecedores e clientes devem se
relacionar com a indústria, representando negociação. Já produtos substitutos e entrantes em
potencial se relacionam com a indústria como ameaça.
Dentro desse ambiente, considerando as forças competitivas e o relacionamento entre
elas, os clientes, fornecedores, entrantes em potencial, produtos substitutos e a relação entre
todos esses elementos devem ser considerados por cada empresa para compor sua estratégia
de competitividade. Para cada elemento constitutivo, um conjunto de estratégias e políticas
deve ser desenvolvido, com o objetivo de deter o avanço dos concorrentes e consolidar e
ampliar a posição que a empresa ocupa dentro do sistema.
a) Fornecedores e compradores poderosos
Os fornecedores podem exercer pressão no ambiente da indústria alterando o
comportamento das variáveis vinculadas a matéria-prima e insumos. O aumento de preço,
bem a variação na quantidade e qualidade do insumo/matéria-prima fornecida podem influir
poderosamente no sistema.
b) Entrantes em potencial
A ameaça de entrada de novas empresas no mercado deverá ser motivo de atenção
constante para as que já atuam neste mercado. A ocupação destas organizações é estabelecer
barreiras que minimizem a possibilidade de essas entradas ocorrerem. Os fatores a serem
considerados nesse enfoque são:
•
Economia de escala: com isto se consegue declínio no custo em decorrência da
otimização
de
áreas
funcionais,
integração
vertical
e/ou
horizontal
e
compartilhamento de recursos.
•
Necessidade de capital: envolvendo definição de necessidades, disponibilidade,
quantidade e risco de negócio.
•
Definição do produto a ser comercializado: envolve, entre outros aspectos, marca
identificada e qualidade no serviço ao cliente.
•
Custo de mudanças: custo a ser aceito ou vencido em decorrência da decisão de
mudança de fornecedores.
23
•
Desvantagem de custo independente de escala: este aspecto considera a curva de
aprendizado, subsídio, localização e tecnologias.
•
Política governamental: através das licenças e acessos à matéria-prima e à
legislação.
c) Concorrentes na indústria
A dimensão da rivalidade entre os concorrentes gera disputas de posições e influi
sobre os seguintes fatores, sendo também por eles influenciada:
•
Crescimento lento da indústria,
•
Altos custos com estocagem e armazenamento,
•
Concorrentes em grande número ou com um bom equilíbrio,
•
Ausência de custos de mudanças ou de diferenciação,
•
Grandes interesses estratégicos,
•
Foco e aumento da capacidade em grandes incrementos (supercapacidade e
redução de preços),
•
Divergência entre concorrentes: Este aspecto estabelece regras de competição e
diferenciação de regras
•
Elevadas barreiras de saída integradas por ativos especializados, interrelacionamentos estratégicos, custos fixos de saída, barreiras emocionais,
restrições de governos etc.
d) Produtos Substitutos
Este fator representa a ameaça de novos produtos ou produtos alternativos com custos
menores, ocupando o espaço no mercado em detrimento dos produtos já existentes.
e) Clientes
A pressão exercida pelo poder de negociação dos compradores influi no
comportamento dos preços, exigindo mais qualidade ou aumento da gama de serviços e faz
com que um concorrente dispute com o outro, estabelecendo e acirrando a concorrência. Para
este fator, é necessário ter presente que o poder do cliente aumenta quando:
•
Os produtos que se quer adquirir representam uma significativa fração de seus
próprios custos;
•
Enfrenta poucos custos com as mudanças;
•
Adquire grandes volumes ou está concentrado em apenas um vendedor;
24
•
Os produtos que ele adquire tem diferenciações, ou seguem um padrão;
•
Ele consegue baixos lucros;
•
A importância do produto para a qualidade dos produtos ou serviços do comprador
não é significativa;
•
Tem acesso a informação;
•
Possibilita a integração para trás.
f) Fornecedores
Este elemento integrante das cinco forças competitivas de Porter, considera o poder
dos fornecedores em relação à elevação do preço de produtos e serviços e/ou redução da
qualidade dos bens ou dos serviços. Os elementos que influem no comportamento desta
dimensão da proposta de Porter são:
•
É dominado por um pequeno número de organizações, havendo mais concentração
do que para a indústria cliente;
•
Há ausência de concorrência com produtos substitutos;
•
Há diferenciação de produtos ou o conjunto desenvolveu custos de mudança;
•
O grupo de fornecedores é uma ameaça concreta de integração para frente;
•
O produto do fornecedor é um importante insumo para o negócio do comprador.
É importante que a empresa conheça as forças que atuam sobre a sua realidade
competitiva. Com isto ela será capaz de se posicionar frente às mesmas. O governo, por
exemplo, é um fator que não está contemplado como elemento direto do modelo. Porém
através de incentivos e subsídios e ele pode influir poderosamente nas variáveis do modelo
proposto por Porter. Com base nisso, o governo deve ser analisado considerando cada uma
das cinco forças separadamente.
A organização deve ser capaz de identificar, estudar e conhecer profundamente todas
as forças que atuam sobre si e quais destas forças ela tem efetivo domínio. O resultado desse
posicionamento se reflete na capacidade que a empresa terá para elaborar sua estratégia de
competitividade.
Os sistemas de informação jogam papel fundamental nesse processo de ação estrutural
para o posicionamento estratégico de competitividade. Nas organizações, os dados
estruturados já estão inseridos nesses sistemas, fazendo parte de bancos de dados ou de
processos de busca e recuperação já dominados e amplamente divulgados. O projeto desta
tese amplia a ação do sistema de informação, agregando os dados não estruturados e os dados
25
semi-estruturados ao processo de análise para o estabelecimento e sustentação de estratégias
de competitividade.
Optou-se por inserir este capitulo no trabalho por se constatar na bibliografia uma
forte vinculação entre conhecimento organizacional, competitividade e gestão.
2.5 SOBRE GESTÃO DO CONHECIMENTO
Não sendo a área de pesquisa deste trabalho, aborda-se o tema por considerá-lo
interligado ao escopo do projeto, pois o conhecimento é fundamental para qualquer atividade
que envolve o ser humano. No que se refere às organizações, é notória a importância da
gestão do conhecimento para transformar talentos em diferencial competitivo.
Segundo Serafim (1999), o resultado final de um processo ou produto está diretamente
vinculado à forma de confeccioná-lo e à relação entre esta forma o os saberes humanos. Nos
tempos modernos, cada vez mais, evidencia-se a importância do diferencial humano como
fator de competitividade. Para (FALBO and NATALIA 2003),
atualmente, as organizações têm se conscientizado de que o conhecimento é
um de seus principais ativos e fator decisivo na competitividade das mesmas.
Dada a sua importância, o conhecimento não pode estar centrado somente
nos membros da organização, pois se um indivíduo deixa a organização, o
seu conhecimento é perdido. Tampouco o conhecimento pode existir
somente em documentos e registros em papel, pois essa forma de
representação dificulta o acesso, a pesquisa e a atualização. Neste cenário,
muitas organizações, e em especial as organizações de software, têm adotado
a gerência de conhecimento como forma de melhorar o fluxo de
conhecimento entre seus membros, capturar conhecimento organizacional,
assegurar a disponibilidade de conhecimento e promover o surgimento de
conhecimento novo.
Entende-se que muitos são os desafios a serem vencidos pela organização, os quais
atuam como fatores catalisadores das mudanças. Um desses desafios é o comportamento do
mercado, com o surgimento de novas organizações e a conseqüente concorrência.
Com o aperfeiçoamento das organizações e a crescente competitividade, o tema da
gestão do conhecimento vem sendo cada vez mais valorizado. Comprova-se isto através do
crescente número de matérias, jornais e revistas especializadas abordando essa questão. Tais
publicações acompanham e publicam artigos sobre gestão e talentos humanos. Os textos
ostentam títulos que mencionam “inteligência competitiva”, “capital intelectual”, “engenharia
do conhecimento”, “gestão do conhecimento”, “gestão do talento humano” etc.
26
A gestão do conhecimento, segundo (SERAFIM F. 1999),
passa essencialmente pelo compartilhamento dos conhecimentos individuais
para a formação do conhecimento organizacional. Sendo assim, a pessoa que
detém o conhecimento é que decide se o compartilha ou não.
Resgatando a trajetória do pensamento que deu origem à gestão do conhecimento,
consegue-se estabelecer um horizonte abrangendo desde a década de 20 até os dias atuais.
Como o tema está em desenvolvimento e muitas questões ainda são pontos a serem
consolidados, (Serrano 2004) apontam para um limiar que deverá alcançar toda a primeira
década deste século.
O Quadro 2.2 apresenta um resumo da evolução do conceito de gestão do
conhecimento.
Quadro 2.2: Evolução do conceito de gestão do conhecimento (SERRANO and FIALHO
2004)
Passado
Presente
Futuro
Gestão de Produto
Gestão de Processos
Gestão do Conhecimento
1920 _____ 1950 _________________ 1980 _________________________ 2010
Diante do quadro apresentado acima, é possível destacar dois grandes desafios para as
organizações. O primeiro é ter consciência dos conhecimentos de que dispõe, e o segundo é
organizar-se através destes conhecimentos.
Os conhecimentos presentes na organização podem ser classificados em tácitos e
explícitos. A gestão do conhecimento, dentre outros aspectos, deve prover a organização com
recursos para que o conhecimento tácito se transforme em conhecimento explícito
(GUIZZARDI, AROYO et al.).
Considerando as organizações, de forma geral, Serafim (FILHO 1999) aponta para as
seguintes pontos que delineiam a prática da Gestão do Conhecimento:
a) Criação do conhecimento
Consiste em transformar o conhecimento tácito em conhecimento explicito, ou seja,
transformar os conhecimentos individuais em conhecimentos coletivos. O objetivo deste foco
é criar oportunidades de reflexão no dia-a-dia na organização, buscando evidenciar o saber
27
que se encontra na ação de cada colaborador. Neste sentido, as atividades de cunho
colaboracionista desempenham papel fundamental. A prática de atividades em equipe
favorece a observação mútua e assim a possibilidade de identificação de conhecimentos
tácitos até então desconhecidos pelo possuidor e pelos demais (GUIZZARDI, AROYO et al.
2002).
O resultado final de processos com o foco na gestão do conhecimento é a criação de
novos modelos conceituais a serem utilizados pela organização.
b) Utilização do conhecimento
As organizações necessitam desenvolver um ambiente voltado à pesquisa que propicie
o resgate dos conhecimentos já produzidos. Por vezes, os resultados de seminários, cursos e
palestras são esquecidos ou não são considerados, por falta do hábito da pesquisa ou por
ineficiência no armazenamento dos conhecimentos advindos destes eventos.
A organização deve ser capaz de construir e implementar soluções para garantir que o
conhecimento seja reaproveitado.
c) Retenção do conhecimento
Esta atividade inerente à gestão do conhecimento pode ser dividida em duas atividades
específicas. Reter a informação para assimilá-la ou reter para preservá-la. Para o caso de se
reter o conhecimento para assimilá-lo, a criação de modelos conceituais é importante para
estabelecer metodologias que permitam a recuperação da informação de forma consistente.
Outro aspecto favorecido pelo desenvolvimento de modelos é a possibilidade de
compartilhamento do conhecimento através da aplicação de modelos. A capacidade de
compartilhamento da informação é fator de economia e de dimensão estratégica.
d) Medição do conhecimento.
Este aspecto da Gestão do Conhecimento apresenta dois grandes desafios. O primeiro
é a capacidade de reconhecer o conhecimento que a organização já possui e a segunda é a
capacidade de identificar novos conhecimentos e armazená-los.
Um fato cada vez mais evidente é que a diferença entre o valor de mercado de uma
organização e seu valor patrimonial é estabelecido pelo conhecimento que ela possui.
Medir o que conhece a organização através do conhecimento explicito não é tão
complicado como identificar e medir o conhecimento tácito ou implícito. Este é um desafio
que deve ser vencido para garantir melhor condição estratégia para a organização.
28
Para (NATALI and FALBO 2003), é necessário ter-se em conta quais são e quem
alimenta os repositórios da organização. Outros fatores apresentados pelos autores se referem
ao reuso e recuperação de itens de conhecimento, bem como ao controle e expansão da
memória organizacional.
A gestão do conhecimento determinará novas práticas organizacionais que
representarão um novo estágio nas relações entre grupos e pessoas, empresas, clientes e
fornecedores. Para (DIEGN 2000),
a gerência de conhecimento visa compartilhar o conhecimento dentro da
organização, transformando o conhecimento individual em coletivo. Esse
compartilhamento pode ser feito de diversas formas, tais como:
disseminação de melhores práticas, melhorias em processos, apoio a novos
membros etc.
A disseminação de conhecimentos em torno de uma estratégia de competitividade
define e identifica um grupo de colaboradores que se caracterizarão por necessidades de
manuseio de conhecimentos comuns. Uma gestão eficaz destes conhecimentos garante ao
grupo uma melhor perspectiva de atingir seus objetivos e, conseqüentemente, de garantir à
organização mais coesão no atendimento das suas necessidades.
2.6 RECUPERAÇÃO DE INFORMAÇÕES E CLASSIFICAÇÃO DE DADOS
Com a facilidade de aquisição e operação de recursos computacionais, estes proliferam
em residências, organizações e na sociedade em geral. Cada vez mais os computadores
ocupam espaços, executando tarefas no auxílio ao ser humano e assim vão-se integrando ao
cotidiano de forma a passarem despercebidos. Tem-se computador no celular, no palm, no
relógio, no semáforo, no automóvel etc. Atividades controladas por computadores, como a
identificação por cartão ou por digital para acesso a locais e serviços, já se tornaram mera
rotina e não mais merecem atenção especial.
Por outro lado esta “invasão” da Tecnologia da Informação apresenta um grande
desafio para as organizações que querem implantar tecnologias para suportar a Gestão do
Conhecimento. A quantidade de dados e informações disponíveis nos computadores assume
proporções incalculáveis. Esta condição torna cada vez mais difícil o acesso a esses dados e
informações (BONIFACIO and Heuser 2002).
Um aspecto a considerar no desafio de dominar os dados e informações para
estabelecer a Gestão do Conhecimento é a dificuldade de buscar esses elementos.
29
Independentemente de tecnologia, de complexidade ou de meio de armazenamento, o acesso a
repositórios de dados e informações necessita de uma forma de indexação para que se tenha
algum mecanismo de controle sobre o processo de recuperação.
Considerando a realidade das organizações, percebe-se que todas necessitam de
conhecimentos para o desenvolvimento de seus processos. Para algumas, o conhecimento é
fator substancial, para outras é o resultado final da execução de seus processos produtivos.
Organizações vinculadas à pesquisa e à educação apresentam de forma contundente a
necessidade de conhecimentos. Independentemente da atividade fim da organização, o
problema se apresenta da mesma forma: O grande volume de documentos e informações
existentes na organização, quer nos computadores pessoais, quer na Web acessível a estes
computadores pessoais, acaba por trazer problemas no momento de acessá-los.
Este problema, se caracteriza como "sobrecarga de informações" (CHEN 1994), pois o
usuário, ao estabelecer um procedimento de pesquisa junto a estas fontes de documento,
obtém muitas informações das quais não consegue tratar, não podendo encontrar o
conhecimento procurado, existente nestes documentos. Muita pesquisa se tem desenvolvido
para resolver esse problema. A seguir, apresentam-se algumas das técnicas pesquisadas:
a) Indexação semântica. Esta técnica considera basicamente dois parâmetros: o
interesse do usuário, que é descrito apenas pelos termos de entrada da consulta, e o contexto
dos documentos em que o termo está contido. (CHEN 1994)
b) Buscas no espaço conceitual do documento. Nesta técnica, define-se um conjunto
de palavras como pertencentes a um assunto ou área do conhecimento e, com base neste
arcabouço, motores de pesquisa realizam seus procedimentos.
c) Freqüência relativa e freqüência inversa como pontos de partida para o
desenvolvimento de técnicas de pesquisas. Através destas freqüências, define-se que termos
melhor definem um contexto. Se um termo aparece muitas vezes em um documento, seu grau
de discriminação será alto; se o termo aparece em muitos documentos, seu grau de
discriminação será baixo, pois o resultado da pesquisa envolvendo este termo terá como
resultado um grande número de documentos recuperados. Os termos que aparecem em muitos
documentos normalmente não são recuperados. Estes termos são chamados stop-words e
geralmente são preposições, artigos, pronomes e conjunções.
30
d) Expansão semântica de palavras. A expansão semântica de uma palavra se
operacionaliza encontrando outras palavras relacionadas com ela. Com base nesse conjunto de
palavras, executa-se o processo de recuperação de documentos. Nessa técnica, é utilizado um
dicionário para encontrar as palavras relacionadas. Desta forma, eliminam-se as stop-words.
Também se utiliza a modelagem semântica das palavras relacionadas, através de redes
semânticas criadas manualmente. O grande problema nesta técnica é o de estabelecer as
palavras relacionadas. Algumas metodologias utilizam modelagem de contextos alternativos.
Isso permite que contextos diferentes possam ser explorados em paralelo. Segundo Chen
(1994), neste tipo de metodologia de recuperação, "a lógica fuzzy é utilizada para diminuir as
incertezas advindas do uso de termos lingüísticos e para melhor detalhar a importância dos
termos em relação à consulta, a relevância dos documentos para a consulta e o grau em que
um termo caracteriza um documento".
e) Rede semântica fuzzy. Através desta técnica, representa-se o conhecimento do
especialista no processo de expansão semântica da consulta. São usados valores fuzzy para
representar pesos, como forma de expressar o quanto um termo está vinculado a outro.
Através de valores fuzzy, também se expressa o grau de satisfação dos documentos em relação
à consulta.
Para avaliar as técnicas de recuperação de documentos, dois conceitos são
fundamentais: precisão e abrangência. No quesito precisão, avalia-se se somente documentos
relevantes foram recuperados. No quesito abrangência, avalia-se se todos os documentos
relevantes foram recuperados.
Considerando a questão do desafio do acesso às informações para suportar a gestão do
conhecimento, é importante considerar que:
atualmente os sistemas convencionais de busca, usam técnicas de base
sintática sobre uma forma de adequação léxica mais do que uma aplicação
da base de conhecimento do campo de interesse. Em muitos domínios, o
usuário está interessado em encontrar informações onde a relevância dos
documentos não pode ser medida através do uso de sistemas de busca por
palavras chaves (KeyWords). A relevância deve ser preferencialmente
estimada num nível de conhecimento profundo do domínio de conhecimento
do problema em questão. (BONIFACIO and Heuser 2002)
Para resolver esta questão, algumas propostas envolvem a criação de metadados a
partir da construção de ontologias. Uma ontologia é um conjunto de termos hierarquicamente
31
estruturados para a descrição de um domínio que pode ser utilizado como uma estrutura, um
esqueleto fundamental para uma base de dados.
Através da representação computacional desse esqueleto, pode-se estabelecer índices
de acessos que transformam o paradigma léxico em uma condição semântica de acesso a
banco de dados.
A recuperação eficiente dos dados contempla várias dimensões que devem ser
observadas como fatores básicos para a construção de um processo eficaz. Nesse sentido, o
tempo e a precisão na ação de identificar, selecionar e apresentar os resultados da pesquisa
são duas das dimensões mais importantes.
São muitos os esforços que buscam desenvolver técnicas para recuperação de dados,
que aumentem a precisão e otimizam o tempo de busca, permitindo aos usuários atuarem de
maneira mais simples, obtendo resultados melhores. Ter uma visão clara e compartilhada do
domínio de conhecimento onde o dado está inserido é uma das possibilidades para o
desenvolvimento de técnicas de recuperação de informações. Esse processo passa por uma
etapa que consiste em dar uma visão conceitual para o domínio do conhecimento em foco.
Segundo (GUIZZARDI 2000),
a conceituação tem uma importância fundamental em qualquer atividade de
modelagem do conhecimento, pois é impossível representar o mundo real,
ou mesmo uma parte dele, em sua completa riqueza de detalhes. Todo
modelo de conhecimento é, portanto, comprometido com alguma
conceituação, implícita ou explicitamente.
O desafio está, portanto, em compor uma estrutura conceitual que represente o
domínio dos dados e, através desta estrutura, conceber e implantar uma forma de indexação
que permita a recuperação eficiente desses dados.
Quando se considera a recuperação eficiente dos dados, alguns fatores passam a ter
relevância. Dentre estes se pode destacar a quantidade de dados existentes na base, o tempo
para o acesso, o quão estruturados são os dados e a qualidade do acesso a esses repositórios de
dados.
Nas organizações, o conhecimento é fator substancial, e, pelo comportamento inerente
a ele, a geração, disseminação, recuperação, comparação e construção de novas estruturas de
conhecimento se realizam com uma velocidade muito intensa.
Geralmente os conhecimentos estão presentes em dados estruturados e não
estruturados. Como já mencionado, tais dados encontram-se em computadores pessoais,
laptops e estruturas centrais de uma rede local ou na Web. Esses dados fazem parte de uma
32
comunidade cujos integrantes interagem com o domínio de conhecimento ao qual pertencem
incrementando esses dados, completando-os, excluindo-os, consultando-os para gerar novos
conhecimentos.
Se todos os dados presentes nesses domínios fossem estruturados, a implementação de
chaves de acesso estabeleceria uma forma prática, simples e segura de recuperá-los. Através
dessa chave, estabelecer-se-iam consultas dentro de uma estrutura sintática e semântica que
poderia garantir a eficiência requerida.
Como se trata de um conjunto de dados heterogêneo, como dados estruturados e não
estruturados, é necessário encontrar uma forma que permita indexá-los. A modelagem do
domínio a que estes dados pertencem favorece a construção de uma visão semântica, e tal
visão pode-se constituir em uma base para o desenvolvimento de uma solução para indexálos.
Com a ampliação dos recursos computacionais, a questão do processamento de dados
tomou dimensões universais. A Internet possibilitou que o armazenamento, recuperação e
publicação de dados atingisse dimensões pessoais em amplas faixas etárias. Desde crianças
em idade de alfabetização até pessoas de idades avançadas acessam a Internet. O material
acessado varia de jogos até resultados de exames médicos.
A forma através como os dados se apresentam é um fator importante a ser
considerado, pois da forma com que o dado se apresenta depende o esforço computacional
para tratá-lo. Segundo (ABITEBOUL, BUNEMAN et al. 2000), pode-se dizer que os dados se
apresentam em três formas distintas:
a) Dados estruturados:
Apresentam uma representação estrutural homogênea, tipada. O esquema de
representação é feito de forma documentada, através de descrição de lay-out
presente na documentação do aplicativo. Nestes dados inclui-se o cadastro
de funcionários, clientes, produtos, tabelas dos bancos relacionais dentre
outros.
b) Dados semi-estruturados:
Apresentam representação estrutural heterogênea, não são completamente
estruturados, tipados, porém com alguma estrutura. Neste tipo de dados
enquadram-se os publicados na Web. Em determinados casos os dados
possuem uma descrição uniforme como catálogos de produtos, em outros
casos os dados possuem formato que podem ser identificados como artigos e
contratos. Neste tipo de dado a descrição do formato está implícito ao
documento.
33
c) Dados não estruturados:
São dados em que é impossível ou muito difícil encontrar a forma de
representação. Enquadram-se neste tipo de dado as imagens. Neste caso não
há informação descritiva associada.
A medida que se trata o dado, aperfeiçoa-se sua forma de representação. De acordo
com a Fig. 2.2, o aperfeiçoamento da estrutura do dado caminha da forma não estruturada
para a estruturada, passando por um processo de semi-estruturação.
Dados não
Dados semi-
Dados
estruturados
-estruturados
estruturados
Textos Livres
Páginas Html
E-mail
Banco de dados
relacionais
Figura 2.2: Tipos de dados conforme sua estrutura
Considerando o propósito deste trabalho de pesquisa, tem-se, nos dados não
estruturados, uma fonte de informação importante. Mas, em função da forma como esses
dados se apresentam, torna-se pesado o processamento computacional para extraí-los, levá-los
a uma condição de semi-estruturação e poder incluí-los em ambientes apropriados para o
tratamento computacional de forma mais leve. Um aspecto importantes a considerar neste
ponto é que existem passos que se pode dar para levar um dado não estruturado à condição de
semi-estruturação. (ABITEBOUL, BUNEMAN et al. 2000) apresentam alguns desses passos:
a) Definição a priori:
Após a existência dos dados, com base em uma investigação de suas estruturas
preliminares e da análise de similaridades e diferenças, pode-se definir esquemas para dados
semi-estruturados.
b) Estrutura irregular:
Tendo presente que não existem informações completas sobre a estrutura de um
determinado documento e que estas podem ser encontradas em diversos documentos de
mesma natureza, coleções de dados poderão estar organizadas de maneiras diferentes, e um
estudo analítico poderá identificar um padrão que atenda as várias formas, tornando possível
semi-estruturação.
34
c) Estrutura parcial:
Para esta questão, deve-se considerar que nem sempre todas as informações esperadas,
do ponto de vista semântico, estão completas. Neste caso, apenas parte dos dados que estão
disponíveis têm alguma estrutura. Como exemplo, pode-se citar componentes de objetos que
são arquivos bitmap. Neste caso, a semi-estruturação é parcial para a parte dos dados
possíveis de terem sua estrutura identificada implícita ou explicitamente.
d) Estrutura implícita:
Há dados cuja estruturação está implícita; essa estruturação básica existe, mas não é
evidente. Neste caso, é necessário utilização de recursos computacionais para identificá-la e
explicitá-la.
e) Estrutura extensa:
Esta estrutura existem quando ocorre união de atributos significativos em
determinados formatos. Para exemplificar, pode-se supor um conjunto de atributos diferentes
para um curriculum vitae. Para este caso, a ordem de magnitude da estrutura existente dos
dados é elevada.
f) Estruturas descritivas e não prescritivas:
Um sinônimo para este tipo de estrutura é estrutura indicativa, devido à natureza
evolucionaria e sem regularidade dos dados semi-estruturados. Estas estruturas resumem-se
em definir o estado corrente dos dados, com pouca ocorrência e com pouca similaridade. Em
decorrência, a possibilidade de prescrever esquemas fechados e restrições de integridade é
muito pequena.
g) Estrutura evolucionária:
Para estes casos, as estruturas de dados se modificam com muita freqüência. Como
exemplo, apresenta-se o caso dos dados da Web, que têm a necessidade de variar não apenas
o conteúdo, mas também a forma. Para estes casos, as linguagens de marcação dão suporte, e
a etapa de semi-estruturação ocorreu anteriormente, para que se pudesse publicar os dados em
páginas Web.
h) A distinção entre estrutura e dados não é clara:
Quando a descrição da estrutura está implícita no dado, é mais trabalhoso separar o
dado da estrutura que o representa, ficando para uma análise do conteúdo a possibilidade de
compreender e estabelecer esta diferenciação. O exemplo para o caso é um endereço
35
embutido em uma variável string. A identificação do número da casa ou apartamento, quando
houver, somente é possível após uma análise do conteúdo da variável.
Com relação à modelagem dos dados semi-estruturados, a forma mais atual de
executar esta tarefa é utilizando grafos direcionados rotulados (SZWARCFITER, 2004).
Neste tipo de representação, os vértices representam objetos identificáveis e as arestas
representam os arcos para ligação com outros objetos participantes da estrutura. Um grafo
G(V,E) trata-se de um conjunto finito, não vazio V e um conjunto E de pares não ordenados
de elementos distintos de V. Os elementos em V são os vértices do grafo e os elementos em E
são as arestas. Cada aresta “e”, pertencerá a E, e será representada pelo par de vértices ou nó
“e” que será igual a (v,n).
Existem vários tipos de grafos, dentre os quais destacam-se:
a) Grafo com um ciclo e sem raiz
Figura 2.3: Grafo com um ciclo e sem raiz
b) Grafo cíclico e com raiz
aresta
nó
Figura 2.4: Grafo cíclico e com raiz
36
c) Árvore
Figura 2.5: Árvore
A Fig. 2.6 representa dados semi-estruturados utilizando grafos. Para melhor visão da
representação de um conjunto de dados semi-estruturados simples em uma lista associada a
grafos, apresenta-se um documento tipo artigo na Fig. 2.7.
{instituição:”INSTITUIÇÃO”,autor:”nome_do_autor_um”,
e-mail:”nome_do_autor_um@INSTITUIÇÃO.br}
Figura 2.6: Representação de dados semi-estruturados por grafo
37
Nome_autor_um
Nome_autor_dois
INSTITUIÇÃO
e-mail: {nome_autor-um,nomeautor_dois@instituição.Br
Resumo
------------------------------------------------------------------1 Introdução
------------------------------------------------------------------n Conclusão
------------------------------------------------------------------Bibliografia
-------------------------------------------------------------------
Figura 2.7: Dado semi-estruturado
2.7 DOCUMENTO SEMI-ESTRUTURADO
Para a representação do dado semi-estruturado contido na Fig. 2.7, apresenta-se o
grafo da Fig. 2.8. A construção do grafo pode ser conduzida por um conjunto de pessoas ou
por uma única pessoa. Atualmente, através de mapas conceituais, pode-se organizar trabalhos
colaborativos que agregam pessoas em diferentes áreas geográficas e com diferentes idiomas,
comunicando-se através de uma linguagem gráfica suportada por grafos. Este tipo de
representação é utilizado para ontologias.
38
documentos
artigos
Seções
Título
“Dados SemiEstruturados”
Autor
Autor
Resumo
Introdução
“nome_autor_um”
Resumo.txt
“nome_autor_dois”
e-mail
Conclusão
e-mail
Introdução
Bibliografia
Introdução
Nome_aoutor_
um@instituição
Instituição
Nome_aoutor_dois
@instituição.br
Introdução.txt
Conclusão.txt
Bibliografia.txt
Figura 2.8: Grafo do dado semi-estruturado
Este tipo de representação favorece o entendimento e, através de linguagens de
marcação, como XML, é possível representar computacionalmente o dado semi-estruturado.
A complexidade de um determinado modelo a utilizar para representar o dado depende
do quão complexa é a forma em que o dado está representado. Para os casos de dados
estruturados, há toda uma tecnologia desenvolvida e dominada que não requer maiores
esforços computacionais. Portanto, um modelo que consiste em valor-atributo, nome-atributo
dificulta a representação em ambientes baseados em relacionamentos encontrados em
sistemas de arquivos como os existentes na Internet, que são heterogêneos. Para estes casos, o
modelo de dados complexo é mais apropriado. Esse modelo é baseado em grafos. Quando se
consegue representar estes dados através de grafos, torna-se mais fácil o acesso e manuseio
destes, pois algoritmos para navegar em grafos já existem e são amplamente conhecidos e
39
estudados. Sendo assim, sua adoção facilita sobremaneira o desenvolvimento de sistemas
automatizados.
2.8 ONTOLOGIAS
Um grande desafio para a área de Tecnologia da Informação é o de propiciar às
organizações, ferramentas e mecanismos que, além da geração, armazenamento e recuperação
eficaz das informações, garantam a formação de comunidades de trabalho em torno de
conceitos que transcendam as unidades de negócio e propiciem a unificação em torno de um
arcabouço de conhecimento organizacional, bem como que contribuam para a formação de
comunidades de trabalho. Para tornar possível esta realidade, novos elementos entram em
cena para. Um deles é o conceito de Domínio do Problema. Para (ARANGO and PRIETODÍAZ 1994),
o domínio do problema representa um conjunto de itens de informação
presentes em um certo contexto do mundo real, inter-relacionados de forma
bastante coesa, e que desperta o interesse de uma certa comunidade.
Tendo presente a definição acima, o elemento substancial do domínio do problema é o
conhecimento. Ele dá sustentação aos conceitos que dele recebem base para se manterem
presentes e ativos. O conhecimento está presente nas pessoas que integram as organizações.
Na medida que a organização interage com as pessoas e estas entre si na mesma organização,
o conhecimento vai-se explicitando e formando o valor intelectual da mesma. Por outro lado,
é necessário considerar que as pessoas são diferentes, pensam e se comportam diferentemente.
Neste sentido, segundo Alves (2002),
as ferramentas tecnológicas de suporte ao conhecimento devem ser flexíveis
e de fácil utilização, dando a maior autonomia possível aos membros das
comunidades de trabalho, com um mínimo de interferência da área.
As tecnologias úteis para a gestão do conhecimento são aquelas que permitem criar
redes globais para o compartilhamento de conhecimentos e assim favorecer a criação de bases
de conhecimentos compartilhadas. Para tanto, é necessário identificar e modelar domínios de
conhecimento para que sejam compartilhados.
A formalização do conhecimento começa com uma conceituação. Segundo Guizzardi
et al. (2002), a conceituação “consiste num conjunto de entidades sobre o qual o conheci-
40
mento é expresso bem como a relação entre estas entidades. A explicação desta conceituação
é chamada de Ontologia. Uma Ontologia consiste de termos, suas definições e seus axiomas”.
Segundo (FERREIRA 1999), ontologia é substantivo feminino a deriva do grego
ont(o) + log(o) + ia – que, pode significar entes tomados como objetos de conhecimento ou
estudo filosófico dos entes, ou ainda investigação dos conceitos que permitem determinar as
modalidades ônticas.
De acordo com Kraemer et al. (2005), a ontologia estuda, “a essência dos entes ou
seres antes de serem transformados em conceitos das ciências e depois que nossa experiência
sofreu o espanto, o estranhamento de que eles sejam ou não como parecem.”
No campo da Inteligência Artificial, segundo Uschold “ontologia é o termo usado para
compartilhamento do entendimento de algum domínio de conhecimento usado para resolver
um problema de compartilhamento do sistema” (USCHOLD apud (KRAEMER,
CARVALHO et al. 2004).
Com esta abordagem, pode-se entender ainda uma ontologia como sendo um conjunto
de termos que descrevem um domínio, estruturado hierarquicamente, podendo ser usado para
uma base de conhecimento.
A linha básica de pesquisas em I.A. tem descrito ao longo dos anos uma trajetória que
evidencia a atenção que esta área do conhecimento atribui a simular inteligência através de
programas de computadores, cuja característica principal é o conhecimento e a sua
representação. Segundo Branchman,
a maioria dos trabalhos em I.A. estão baseados na crença de que os sistemas
inteligentes podem ser construídos do explícito, base de conhecimento
declarativo, que por sua vez são operadores gerais, mecanismos de
raciocínio formal. Esta hipótese fundamental de I.A. significa que a
representação de conhecimento e o raciocínio (o estudo de maneiras formais
de extração de informações do conhecimento representado simbolicamente),
é de central importância para a área (BRANCHMAN apud CASTRO, 2000).
2.8.1 Aplicações
As ontologias têm aplicação na solução de compartilhamento de conhecimentos, no
aumento da clareza no nível de comunicação em ambientes colaborativos, na minimização das
dificuldades em encontrar as necessidades de um sistema e na definição clara de suas
especificações. Permitem também definição clara de métodos de modelagem, estabelecendo
41
paradigmas, propiciando maior clareza no entendimento e facilitando a inter-operabilidade, o
potencial para reusabilidade e o compartilhamento de conhecimentos.
A utilização de ontologias reduz ou elimina questões vinculadas às terminologias ou
aos conceitos pouco claros e favorece a explicitação e compartilhamento de conceitos, à
medida que são apresentados de forma clara e unívoca.
As ontologias são mas bem indicadas para utilização em aplicações que envolvam
comunicação entre pessoas e organizações, em engenharia de sistemas, pela capacidade de
favorecer a reusabilidade de componentes, confiabilidade e especificação.
Na aplicação em comunicações entre pessoas e organizações, as ontologias favorecem
a redução de conceitos e terminologias confusas, facilitando o entendimento. Neste sentido,
caracterizam aplicações deste tipo: modelos normativos; redes de relacionamento;
consistência e falta de ambigüidade; e usuários interagindo entre si, integrando perspectivas
diferentes.
O esquema abaixo representa a aplicação de Ontologias em interoperabilidade atuando
como uma estrutura inter-língua. As siglas PT, ING, FR e JP signifiocam, respectivamente,
português, inglês, francês e japonês.
Figura 2.9: Aplicação de ontologia em interoperabilidade.
Na engenharia de sistemas, as ontologias são utilizadas para favorecer o
desenvolvimento de sistemas, ao permitirem o aperfeiçoamento da comunicação no ambiente
colaborativo, inerente ao desenvolvimento do trabalho. Assim, permitem a representação de
um domínio do conhecimento bem como de todos os elementos que o integram, a
especificação, a confiabilidade e a reusabilidade.
Muito embora a palavra ontologia possa denotar uma teoria sobre a natureza ou
existência do ser, ela pode ser interpretada em I. A., segundo Gruber (apud FREITAS, 2004)
como “o conjunto de entidades com suas relações, restrições, axiomas e vocabulário”. Para o
autor, “uma ontologia define o ato de conceituar acerca do domínio estudado para tal fim”.
42
Geralmente, uma ontologia é organizada a partir da hierarquia de conceito
(taxonomia). Pode-se considerar a ontologia como sendo “a materialização do conhecimento”
(FREITAS 2004) pelo fato de, em um nível ideal, não refletir nenhum formalismo específico
e de freqüentemente representar um vocabulário comum entre os sistemas e os usuários.
Studer et al. (1998) consideram que “uma ontologia é uma especificação explícita e
formal de uma conceituação compartilhada”. Entendem-se por especificação explícita, as
definições de conceitos, instâncias, relações, restrições e axiomas. Por especificação formal,
entendem-se as definições que contêm uma declaração definida, sendo assim compreensíveis
para agentes e sistemas. O aspecto de conceituação compartilhada está contemplado em um
modelo abstrato de uma área de conhecimento ou de um universo limitado de discurso.
O compartilhamento, por se tratar de um conhecimento consensual, implica o uso de
uma terminologia comum da área modelada, ou acordada entre os agentes envolvidos no
processo (FREITAS and KLADIS 1995).
As ontologias pré-construídas com base em domínios restritos têm tido bastante
reutilização e podem se tornar representantes de uma função fundamental, como fornecedoras
de conhecimento para a inferência dinâmica realizada por agentes.
2.8.2 Tipos de Ontologias
O tipo de ontologia depende do grau de abrangência que assume o delineamento da
aplicação (GOMESZ-PERES 1994). Assim, segundo (FREITAS 2004), pode-se classificar as
ontologias em 7 tipos:
a) Ontologias de representação: definem as primitivas de representação – como
frames, axiomas, atributos e outros – de forma declarativa. Essa idéia abstrai os formalismos
de representação, porém traz desvantagens (FREITAS 2004);
b) Ontologias gerais (ou de topo): trazem definições abstratas necessárias para a
compreensão de aspectos do mundo, como tempo, processos, papéis, espaço, seres, coisas etc;
c) Ontologias centrais (core ontologies) ou genéricas de domínio: definem os ramos de
estudo de uma área/ou conhecimento mais genérico e abstratos desta área. (VALENTE and
BREUKER 1996) criaram uma ontologia central do Direito, que inclui conhecimentos
normativos, de responsabilidade, reativos, de gerencias legais, comportamentos permitidos
etc. A ontologia agrupou esses conceitos e conhecimentos para servir de base para a
construção de ontologias de ramos mais específicos do Direito, como direito tributário, de
família e outros.
43
d) Ontologias de domínio: tratam de um domínio mais específico de uma área genérica
de conhecimento, como direito tributário, microbiologia etc.
e) Ontologias de aplicação: procuram dar solução a problemas específicos de um
determinado domínio. Para exemplificar, uma ontologia de domínio de cardiologia.
Normalmente, ontologias de aplicação referenciam termos de uma ontologia de domínio.
As ontologias acima citadas foram apresentadas em ordem decrescente de
genericidade. A construção de uma aplicação quase nunca utiliza todos os tipos de ontologia.
Deve-se cuidar para que se mantenha a ontologia construída com capacidade de reusabilidade.
Para tanto, deve-se ficar atento para que uma ontologia em um nível acima da ontologia em
uso esteja ligada a esta ou evitar relacionamentos com uma ontologia específica.
Quanto ao teor da ontologia, pode-se aplicar outra classificação.
a) Ontologia de tarefas: descreve tarefas de um determinado domínio, como, por
exemplo, processos, planos, metas, escalonamentos etc. Esta tem uma visão mais funcional,
embora declarativa, de um domínio.
b) Ontologia de domínio propriamente dita: tem uma visão mais epistemológica do
domínio, focando nos conceitos e objetos do universo de discurso.
2.8.3 Engenharia de Ontologias
A concepção e construção de ontologias necessita ser conduzida como um outro
projeto qualquer. Deste o início da atividade, há que se ter presente o objetivo, o plano do
projeto, definindo com clareza as etapas a serem vencidas, e uma metodologia que favoreça o
controle e manutenção de cada etapa a ser executada.
Na engenharia de software, estabelecem-se alguns critérios que também são válidos
para o desenvolvimento de ontologias. Estas devem ter eficiência, legibilidade, portabilidade,
extensibilidade, interoperabilidade e possibilitar o reuso. Para tanto, o projeto em foco deverá
basear-se em seu futuro emprego, evitando-se considerar apenas os aspectos filosóficos do
conhecimento acerca do domínio representado.
Do ponto de vista da engenharia, o projeto de construção de uma ontologia deve gerar
como conseqüência um produto ou serviço. Durante esta etapa serão tomadas decisões de
projetos. Para (GRUBER 1995), as decisões devem primordialmente considerar:
a) Clareza: todas as definições devem ser claras e objetivas. Para tanto uma definição,
sempre que possível deve ser declarada através de axiomas lógicos. Deve-se tomar cuidado
44
para que esta definição seja completa com condições necessárias e suficientes. Isso é melhor
que uma definição parcial, com condições de apenas necessárias ou suficientes. É importante
que todas as definições sejam registradas em linguagem natural.
b) Extensibilidade: O vocabulário existente, a partir do qual se elaboram os termos a
serem definidos não pode estabelecer contradição se novos termos tiverem que ser definidos,
gerando a necessidade de rever as definições previamente existentes. Isto é, deverá
possibilitar a inserção de novos termos baseados no vocabulário existente, sem que haja a
necessidade de modificar o que anteriormente já foi definido para o projeto como um todo.
c) Coerência: Haverá incoerência na ontologia em construção se uma sentença inferida
a partir de um axioma contradisser uma definição ou exemplo dado informalmente. Esta
contradição fará com que o projeto tenha aplicações circunstanciais e restritas, contrariando o
quesito Coerência.
d) Minimização com o compromisso de implantação: O nível simbólico ou de
codificação não deve interferir na conceituação. Esta deve ser especificada em nível do
conhecimento, sem depender de uma codificação em particular.
e) Minimização do compromisso com ontologia: Com o objetivo de facilitar o reuso,
apenas o conhecimento essencial deve ser incluído. Uma ontologia deve requerer o mínimo
suficiente para dar suporte às suas atividades de compartilhamento e de conhecimento
desejadas. Para tanto, deve-se ter presente a necessidade de gerar a menor teoria possível
acerca de cada conceito. O projeto deve permitir também a criação de novos conceitos, mais
especializados ou estendidos.
A metodologia para a construção de ontologias começa em 1995, com a metodologia
de Uschold e King intitulada “Enterprise Ontology”. Ela trata de modelagem de processos
empresariais, e o mais importante sistema desenvolvido por esta metodologia é o “Enterprise
Toolset”, que usa arquitetura em agentes para integrar ferramentas avulsas em um conjunto
“plug-and-play” (JADE 2004).
Também no ano de 1995, surge a metodologia entitulada “TOVE Project Ontology”,
de Guininger e Fox, que se baseia no modelamento dos processos e atividades comerciais.
Essa metodologia tem importantes aplicações no “Enterprise Design Workbench”, sendo
utilizada para explorar os vários processos de uma empresa e compará-los com as outras.
Também é usada no “Integrated Supply Chain Management Project Agents”, utilizado para
organizar a cadeia de fornecedores numa rede de empresas em cooperação.
45
Em 1996 Berneras propõe uma metodologia para integrar ontologias existentes para
construção de uma nova metodologia. A metodologia apresentada identifica especialmente
quais são as atividades necessárias para a construção de uma ontologia. Algumas das
ontologias mais importantes que foram construídas com a metodologia foram: Chemicals,
para a área de elementos químicos e estruturas cristalinas; KA Ontology, própria para ser
utilizada pelas unidades de pesquisa, cientistas, universidades e por todos que lidam com
aquisição de conhecimentos; The Reference-Ontology, que descreve os relacionamentos entre
ontologias a partir de uma organização lógica, como um catálogo de páginas amarelas da
Ontologia.
Recentemente, surgiu a metodologia Sensus. Trata-se de uma ontologia que usa
linguagem natural na definição de uma estrutura conceitual para o desenvolvimento de
tradutores automatizados. Esta aplicação utiliza duas Ontologias prontas e as categorias
semânticas de um dicionário em inglês.
Abaixo se apresenta uma visão esquemática de parte da Ontologia construída no
projeto KA, com o objetivo de criar uma organização virtual de pesquisadores, universidades,
projetos e publicações entre outros itens, envolvidos como a sub-área de Inteligência Artificial
conhecida como Aquisição de Conhecimento.
Para exemplificar apresenta-se a definição da classe Documento Científico na Fig.
2.10.
Documento científico
Ano de publicação
Instância
Ano
Palavra-chave
String
URL da Publicação
String
Título da publicação
String
...
Figura 2.10: Parte dos atributos da Classe Documento Científico (FREITAS)
46
A Fig. 2.11 representa uma parte da Ontologia, salientando as Classes, Eventos e
Publicações, bem como suas subclasses e heranças.
Figura 2.11: Parte da Ontologia KA (FREITAS 2004)
2.8.4 Metodologias de desenvolvimento de ontologias
Com relação à ontologia e as metodologias de aplicação, um ponto a ser considerado é
que os modelos apresentados ainda não demonstram um processo suficientemente estruturado
a ponto de suportar a construção de ontologias com a formalidade de uma disciplina de
engenharia. Falbo et al. (1998) descrevem uma metodologia que une as principais
características das metodologias existentes. Discutem também as várias atividades do
processo de construção da ontologias e apresentam orientações sobre como proceder durante
o desenvolvimento e execução de um projeto.
Com o objetivo de estruturar uma metodologia para avaliação da qualidade e
documentação do desenvolvimento de uma ontologia, é importante considerar que o processo
como um todo pode ser visto como macroatividades. Estas macroatividades podem ser
desdobradas em tarefas e assim se torna mais acessível o domínio de todo o projeto
47
envolvendo a construção da ontologia. Segundo (GUIZZARDI 2000/4), “as atividades
descritas são organizadas em um ciclo altamente interativo no qual os processos de avaliação
da qualidade e documentação se desenvolvem em atividades macro”.
As atividades macro propostas por Guizzardi são:
•
Identificação de propósito e especificação de requisitos;
•
Captura da ontologia;
•
Formalização da ontologia;
•
Integração com ontologias existentes;
•
Avaliação;
•
Documentação.
Outra metodologia de desenvolvimento é apresentada por (FREITAS 2004). Ambos os
autores apresentam a necessidade de aperfeiçoamento nas metodologias, que são inseridas em
um processo iterativo que requer revisões constantes. Outro fator a ser observado é que as
metodologias propostas apresentam critérios de desenvolvimento similares aos da engenharia
de software, a saber: Especificação, conceitualização e implementação (GÓMEZ-PÉREZ,
FERNANDEZ et al. 1996).
Para (FREITAS 2004), o desenvolvimento de ontologias envolve duas etapas, o
desenvolvimento propriamente dito e atividades que ele denomina de suporte. As atividades
de desenvolvimento compreendem:
•
Especificação;
•
Conceitualização;
•
Implementação.
As atividades de suportem compreendem:
•
Aquisição, que corresponde à elicitação de conhecimentos necessários para a
construção da ontologia;
•
Avaliação, para verificar se a ontologia atende aos requisitos e propósitos
planejados.
•
Documentação, que envolve todo o registro de requisitos, cenários e motivação, as
descrições textuais da conceituação, a ontologia forma e os critérios de projeto
adotados.
•
Integração com ontologias existentes, que é executada durante a fase de
formalização ou de captura da ontologia em construção. Nesta etapa, deve-se
sugerir ou avaliar a possibilidade de integrá-la com outras ontologias já existentes.
48
A Fig. 2.12 apresenta um modelo esquemático que representa o acima exposto:
Figura 2.12: Etapas de desenvolvimento e sua relação
com as atividades de suporte (FREITAS 2004)
Com relação ao desenvolvimento do projeto de uma ontologia, apresentam-se as
seguintes fases a serem consideradas:
•
Especificação – determina o propósito e escopo da ontologia a ser confeccionada.
Esta fase considera uma análise preliminar, para evitar a aplicação de recursos em
atividades desnecessárias ou equivocadas. Durante esta fase, deve-se considerar se
é possível, necessário ou adequado o reuso de ontologias já existentes. Com
relação ao escopo, indica-se a elaboração de uma lista questões de competência
(USCHOLD and M. 1996). Essa lista servirá para avaliar a ontologia durante o
desenvolvimento. Neste sentido, a questão “até que ponto jornais científicos são
considerados eventos científicos?” pode ser considerada um exemplo de avaliação
de competência.
•
Fase de conceitualização – é a fase mais crítica, pois é a mais ligada à definição do
conhecimento. Nela ocorrem a maior parte das atividades de suporte de aquisição e
avaliação. Nesta fase, alguns procedimentos retirados do tutorial do Protégé (NOY
and C.D. 1997) devem ser tidos em conta. São eles:
o Enumerar os temos do domínio, sem se preocupar com similaridades,
repetições e relação entre eles. Costuma-se usar processo de brain storming
para este fim.
49
o Definir as classes. É necessário não confundir nomes de um conceito com o
próprio conceito. Existem até sistemas que permitem a inclusão de sinônimos e
termos associados a conceitos de uma ontologia;
o Definir a hierarquia das classes. Este passo ocorre juntamente com o anterior.
Constitui o passo mais precioso do desenvolvimento, devido às sutilezas das
hierarquias. A clareza e consistência deve ser preocupação constante quando se
definem as classes e subclasses. Por vezes uma classe pode apresentar muitas
subclasses. Neste caso, pode-se lançar mão de classes intermediárias.
o Definir os atributos e facetas de cada classe. Por ser o responsável pela
definição de novas classes, este passo deve interagir com os dois anteriores,
exceto em classes terminológicas, como no caso de aplicações em medicina.
o Criar as instâncias, tendo como lema que são os conceitos mais específicos de
uma ontologia, isto é, os elementos separados pelo menor escopo possível, sem
perder a identidade do elemento (granulidade). Se estes conceitos possuem
uma hierarquia natural, é necessário revisar a definição das classes.
o Convencionar
nomes.
Estes
devem
ser
facilmente
compreensíveis,
recomendando-se convenções diferentes para classes, atributos e instâncias. As
abreviações que possam confundir os usuários devem ser evitadas. É
importante considerar que a ontologia deve ser legível para os que a consultam.
•
Fase de implementação – transformará a ontologia em algo computável. Fará com
que o conhecimento nela representado possa contar com o concurso de máquina
para ser identificado e considerado para vários fins. Esta etapa corresponde à
geração de arquivos em uma determinada linguagem de representação do
conhecimento.
•
Fase de avaliação – Nesta fase, verifica-se se a ontologia atende aos requisitos
especificados na fase de especificação. Mudanças na ontologia podem ocorrer a
partir da interação destas duas últimas fases, o que é normal e atende ao caráter
iterativo da implantação.
50
2.8.5 Benefícios na utilização de ontologias
Considerando a necessidade de ampliar a capacidade das organizações e grupos de
pessoas de gerirem conhecimentos e que a ontologia efetivamente pode representar os
conceitos e demais elementos presentes em um domínio de conhecimento, apontam-se como
benefícios os abaixo citados.
•
A possibilidade de reuso de ontologias pelos desenvolvedores, mesmo com
adaptações e extensões. A construção de bases de conhecimento redunda na tarefa
mais cara de um projeto de sistemas especialistas e/ou agentes. Com a
possibilidade de reuso, esta fase pode ter significativa redução de custos. Outro
benefício é a possibilidade de realizar consultas, comparações e checagem de
consistência, permitindo a aplicação da ontologia para recuperação de informações
e conhecimentos sob conotação de indexação semântica.
•
O desenvolvimento de ontologias permite que se lance mão de “ontologias de
prateleira” para uso e reuso por pessoas e agentes. Algumas ontologias, já com alto
grau de maturidade, em certos casos com mais de 2.000 definições (FREITAS
2004), incluem metadados de imagens de satélites e integração de bases de dados
de genoma, catálogos de produtos, osciloscópio, robótica, semicondutores,
terminologia médica, etc.
•
Outro benefício da utilização de ontologias é a aplicação desta tecnologia em
tradução para diversas línguas e formalismos de representação do conhecimento.
Esta possibilidade concretiza um ideal perseguido por gerações de pesquisadores
de Inteligência Artificial. A ontologia favorece a reutilização de conhecimentos.
•
Manutenção da integridade do conhecimento compartilhado entre grupos de
empresas ou de pessoas, através do acesso on-line a servidores de ontologias,
capazes de armazenar milhares de classes e instâncias.
•
A possibilidade de comunicação de agentes diferentes, através do estabelecimento
de um mapeamento entre formalismos de conhecimentos diferentes, mediante a
aplicação de interfaces inter-operáveis, permitindo o acesso comum a dois
formalismos diferentes.
51
2.8.6 Projeto e desenvolvimento de Ontologias.
O consorcio W3C, através do Guia (PROTÉGÉ 2004) apresenta uma metodologia
para o desenvolvimento de ontologias e o faz através do desenvolvimento de uma ontologia
para representar o domínio do conhecimento em uma aplicação de definição de tipos de base,
cobertura e os ingredientes que envolvem a elaboração de pizzas. Outras aplicações com a
mesma metodologia representam o domínio do conhecimento que envolve vinhos e os pratos
que combinam com cada tipo de vinho. Essas ontologias podem ser localizadas nos endereços
http://www.co-ode.org e http://ontolingua.stanford.edu/doc/chimaera/ontologies/wines.daml,
respectivamente.
A metodologia descrita no documento “A practical guide to building OWL ontologies
with the protege-OWL plugin, apresenta as seguintes etapas.
O desenvolvimento de uma ontologia é gerado pela necessidade de compartilhamento
de entendimentos comuns sobre uma estrutura de informação entre pessoas e agentes de
softwares, para disponibilizar recursos de conhecimento sobre um domínio, para fazer
suposições sobre um determinado domínio, para distinguir domínios de conhecimento através
de conhecimentos operacionais ou para analisar domínios de conhecimento.
Para o processo de desenvolvimento de uma ontologia a posição dos pesquisadores
converge nas seguintes afirmações:
•
Não há um único caminho correto para fazer a modelagem do domínio; há vários
caminhos possíveis. A melhor solução quase sempre depende da aplicação que se
possa ter em mente e do alcance da mesma.
•
O desenvolvimento de uma ontologia quase sempre obedece a um processo
interativo.
•
Conceitos em uma ontologia devem ser como relacionamentos entre objetos de um
determinado domínio. Estes serão, na sua maioria, substantivos ou verbos em
sentenças que descrevem o domínio em questão.
Para o caso em questão, seguir-se-á a metodologia proposta por (HORRIDGE 2004),
que propõe um conjunto de sete passos.
•
Passo 1 – Determine o domínio e o escopo da ontologia. Os autores sugerem
iniciar pela definição do domínio e do escopo da ontologia. Estas definições
podem ser facilitadas com a resposta às seguintes perguntas:
o Que domínio a ontologia deverá contemplar ou considerar?
o Para que estamos desenvolvendo a ontologia?
52
o Que tipos de questionamentos ou informações a ontologia deve responder?
o Como será a utilização e a manutenção da ontologia?
Estas perguntas devem durar enquanto se estiver na fase de definição e entendimento
do domínio e do escopo que a ontologia deverá atender.
•
Passo 2 – Considere a reutilização de ontologias existentes. É importante
considerar que outra pessoa já pode ter feito um trabalho com ontologias no
mesmo enfoque. Neste caso, o refinamento da ontologia existente pode atender a
necessidade que se tenha e assim economizar recursos. Existem vários servidores
de ontologias e projetos que as utilizam. Uma pesquisa nesses projetos pode
favorecer a identificação e o reuso de ontologias. Existem várias bibliotecas de
ontologias que podem ser acessadas. Um exemplo está no endereço:
“http://www.ksl.stanford.edu/software/ontolingua”
•
Passo 3 – Enumere importantes condições para a ontologia. Que questões
gostaríamos de apresentar para o usuário da ontologia, que pontos importantes ele
poderia obter ou oferecer com a utilização da ontologia? Neste sentido,
o Sobre quais questões gostaria de falar com eles?
o Que propriedades dessas condições tem-se que considerar?
o Que propriedades têm as condições apresentadas pela ontologia?
o O que se poderia afirmar a respeito das condições presentes na ontologia
desenvolvida, com relação ao domínio do qual ela faz parte?
•
Passo 4 – Defina a classe e suas hierarquias. Existem diversas possibilidades para
desenvolver uma hierarquia de classes. No desenvolvimento top-down, o processo
inicia-se com a definição dos conceitos mais gerais e depois parte-se para os mais
específicos. No desenvolvimento bottom-up, segue-se o caminho oposto, a partir
do específico chega-se ao conceito geral. É possível também a combinação dos
dois modelos anteriores, caminhando ora no sentido do específico para o genérico,
ora no sentido do genérico para o específico. Com base na lista criada no passo
anterior, organizam-se os elementos identificados e estabelece-se a hierarquia
através de taxonomias. Sendo assim, se um conjunto de elementos em A tem
características que estão presentes na classe B, então a classe A será uma
superclasse da classe B.
•
Passo 5 – Defina as propriedades das classes – slots. Somente a classe não é o
suficiente para disponibilizar informações para responder a questões especificas
53
definidas no passo 1. Na medida que se define alguma classe, deve-se descrever a
estrutura interna do conceito representado por essa classe.
•
Passo 6 – Defina as facetas do slots. Os slots podem ter diferentes facetas,
descrevendo diferentes tipos de valores, valores permitidos, número de valores e
outras características que um slot pode ter.
Com relação à cardinalidade, um slot pode ter cardinalidade simples, permitindo um
valor no máximo, ou cardinalidade múltipla, permitindo vários valores.
Com relação aos tipos de valores do slot, estes podem ser string, número, booleano,
enumerado ou instância.
Para definir um slot, além da definição dos elementos acima citados, necessita-se
definir também o domínio e a imagem do slot (HORRIDGE 2004).
•
Passo 7 – Crie instancias. O último passo é criar as instâncias individuais das
classes. Definir as instâncias individuais de uma classe requer, primeiramente
escolher uma classe, depois criar uma instância individual para representar um tipo
especifico de objeto e por último preencher os valores do slot.
Com a utilização de ontologias, conhecimentos podem ser mais explicitados
permitindo maior compreensão dos conceitos intrínsecos, bem como compartilhamento e
trabalhos colaborativos na construção destes conhecimentos.
A Internet deverá ter nova dimensão com a aplicação de ontologias. A estrutura
ontológica, entre outros benefícios, permite a inserção de conotação semântica no
processamento da informação. Isto permite considerar um domínio de conhecimento na
gestão do conhecimento e utilizar computadores para a utilização desses conhecimentos em
aplicações de diversas características e objetivos. Essa característica dotará a Internet de
habilidades semânticas, aperfeiçoando seus mecanismos de busca.
Segundo Noy e Hafner (1997), para vários fins, pode-se desenvolver projetos de
ontologia. Pode-se utilizar ontologias com forma de representar um domínio de conhecimento
para compartilhá-lo com uma comunidade interessada, para explicitar fatos consensuais,
como forma de separar o domínio do conhecimento do conhecimento operacional, para
estabelecer análise sobre um determinado domínio, para reutilização da modelagem de um
domínio, ou para tornar disponível e compartilhar estruturas de informação entre pessoas ou
disponibilizar para manuseio por agentes presentes em ambientes computacionais.
As ontologias ganham cada vez mais espaço nas mais variadas áreas do conhecimento
científico. Várias comunidades científicas utilizam ontologias em suas aplicações. Em Ciência
da Computação, as ontologias estão sendo utilizadas em aplicações relacionadas à melhoria da
54
eficiência na recuperação de informação, através de estudos e utilização de dados sobre os
dados. Esse processo é também conhecido como análise de metadados.
Na área de Inteligência Artificial, as ontologias estão sendo aplicadas ao
desenvolvimento de sistemas baseados em conhecimento. Nas aplicações vinculadas ao
estudo das linguagens naturais, elas estão sendo aplicadas à caracterização do sentido e do
significado de palavras. Em estudos sobre recuperação de informações, as ontologias estão
sendo utilizadas para permitir abordagens semânticas. E nos estudos sobre banco de dados,
aplicam-se ontologias como esquema conceitual e na busca de interoperabilidade semântica.
Vários grupos no mundo estão trabalhando para definir um conjunto de preceitos
metodológicos para a construção de ontologias. Estes esforços apresentam resultados através
da criação de várias metodologias para a construção de ontologias. O quadro abaixo apresenta
um estudo realizado por (CORCHO, FERNÁNDEZ-LÓPEZ et al. 2001) sobre os vários tipos
de metodologias existentes atualmente.
Quadro 2.3: Metodologias para construção de Ontologias
Sigla
Descrição
CO4
Permite que o conhecimento introduzido em bases de conhecimentos seja
discutido por vários usuários. O conhecimento somente é aceito quando
ratificado por todos. Através do compartilhamento da visão conceitual
expressa na ontologia, é possível discutir o conhecimento candidato e inserilo com um grau de aperfeiçoamento, fruto da contribuição de toda
comunidade envolvida. Quando uma alteração é proposta, todos são
notificados, e o processo de discussão e aperfeiçoamento se repete.
Cyc
Quando um nível de conhecimento é alcançado pela ontologia, através de
codificação de conhecimentos das fontes, utilizam-se ferramentas de
linguagem natural para obter um novo conhecimento. (LENAT E GUHA,
1990)
Gruninger
Metodologia que utiliza linguagem natural para determinar o escopo de uma
ontologia, através de identificação de cenários de uso de uma ontologia.,
também extrai dados sobre conceitos, propriedades, relações e axiomas, os
quais são formalmente definidos em Prolog (GRUNINGER E FOX, 1995)
(KA)2
Utilizando ontologias definidas por comunidade integrada por pessoas de
diferentes localidades, modelam-se formas de aquisição do conhecimento.
Para coordenar as atividades, bem como as comunicações entre os membros
da comunidade, são utilizados agentes inteligentes.(KIETZ et al., 2000)
55
KACTUS
Trata-se de uma metodologia que, utilizando recursividade, apresenta uma
proposta inicial para uma base de conhecimento. Através da generalização de
uma base inicial, atende-se a necessidade de uma nova base de domínio
similar. A generalização da ontologia é uma conseqüência do aumento do
número de aplicações (BERNARAS et al., 1996)
Metontology
Com base em preceitos de reengenharia, constrói uma ontologia sobre outra
ontologia. A construção utiliza o conhecimento do domínio. São atividades
principais a especificação, a formalização, a conceitualização, a
implementação e a manutenção. (FERNÁNDEZ-LOPEZ et al., 1999)
Maedche
É convertida em modelo uma ontologia que é genérica. A partir das fontes
disponíveis, especificam-se textos e se obtêm conceitos do domínio com base
nas fontes disponíveis. Removem-se conceitos genéricos, de maneira que
apenas os conceitos específicos do domínio permaneçam. A estrutura de
conceitos da ontologia está estabelecida e obtêm-se as relações. Novas
relações conceituais são utilizadas com base em aprendizado (KIETZ et al.,
2000).
On-ToKnowledge
Através da identificação de metas para as ferramentas de Gestão do
Conhecimento, utiliza cenários e contribuições dos provedores e dos clientes
de informação da organização. Auxilia na formação de conceitos na
organização (STAAB et al , 2001).
Sensus
Através da identificação de termos relevantes para o domínio, os quais são
ligados a outras ontologias mais abrangentes, são selecionados os termos
relevantes, e um algoritmo monta a estrutura hierárquica do domínio. Desta
forma, a abordagem deriva ontologias a partir de outras existentes
(SWARTOUT et al., 1996)
Unschold
Identifica o propósito, os conceitos e o relacionamento entre eles. Também
identifica os termos utilizados para codificar a ontologia e, em seguida,
documentá-la (UNSCHOLD E KING, 1996)
2.8.7 Ferramentas para a construção de ontologias.
Existem várias ferramentas para a construção de ontologias. A maioria delas é fruto de
trabalho de cooperação desenvolvido em várias comunidades científicas distribuídas pelo
planeta. A construção de uma ontologia requer canalização de muitos recursos. A ajuda que as
ferramentas de desenvolvimento oferecem facilita sobremaneira o desenvolvimento das
ontologias. No Quadro 2.4, apresenta-se uma relação das principais ferramentas encontradas
na bibliografia.
56
Quadro 2.4: Principais ferramentas para construção de ontologias
Sigla
Descrição
IKARUS
(Intelligent Knowledge
Acquisition and Retrieval
Universal System)
Através do ambiente Web, Utiliza uma representação hierárquica
gráfica que permite herança múltipla. Com predicado, sintaxe e
semântica definidos ou com fragmentos sem estrutura,
representam-se as declarações que contêm as informações
(SKUCE, 1996).
APECKS
(Adaptive Presentation
Environment for
Collaborative Knowledge
Structuring)
Trata-se de um servidor de ontologia que permite, mediante um
trabalho cooperativo, a criação de ontologias pessoais pelos
próprios usuários. Através da comparação entre elas é possível
discutir diferenças e similaridades (TENNISON E SHADBOLT,
1998).
CODE4
(Conceptually Oriented
Description Environment)
É uma ferramenta de propósito geral, com interface gráfica de
fácil utilização, um modo de hipertexto para navegação, e
utilitário para leitura de documentos e gerenciamento lexical
(SKUCE, 1995).
GKB-Editor
Ferramenta suportada por sistema de representação baseado em
(Generic Knowledge Base frames para navegação e edição de ontologias. Dispõe de
Editor)
interface gráfica através da qual o usuário pode editar
diretamente a base de conhecimento e selecionar a parte que é de
seu interesse (PALEY E KARP, 1997).
JOE
(Java Ontology Editor)
Esta ferramenta serve para construção e visualização de
ontologias. Permite o gerenciamento do conhecimento em
ambientes abertos, heterogêneos e com vários usuários. As
ontologias podem ser visualizadas através de diagramas de
entidades e relacionamentos, mediante de ferramentas do MS
Windows, ou como uma estrutura de arvores (MAHALINGAM
EHUHNS, 1997).
Ontolíngua
Conjunto de serviços que permite a construção de ontologias
compartilhadas entre grupos. Dá acesso a uma biblioteca de
domínio, a tradutores para linguagens e a um editor para criar e
navegar pela ontologia. Através de protocolos, editores remotos
podem acessar e editar ontologias (FARQHAR et al., 1996).
Ontosaurus
Ferramenta constituída por dois módulos, um servidor de
ontologia que utiliza LOOM para representação do conhecimento
e um servidor de navegação por ontologia, que cria páginas
HTML dinamicamente e apresenta a hierarquia da ontologia
(SWARTOUD et al., 1996).
57
OilEdit
Trata-se de um editor de ontologia de código aberto que permite
construir ontologias utilizando a linguagem OIL. Não é um
ambiente completo para o desenvolvimento de ontologias.
Através da ferramenta FacCT, pode-se fazer a verificação da
consistência e a classificação automática da ontologia
(HORROCKS, SATTLER, TOBIES, 1999).
OntoEdit
É um ambiente gráfico para edição de ontologias que permite
inspeção, navegação, codificação e alteração de ontologias. Com
esta ferramenta, é possível armazenar o modelo conceitual
utilizando-se um modelo de ontologia que pode ser mapeado em
diferentes linguagens de representação. As ontologias podem ser
armazenadas em bancos relacionais e podem ser implementadas
em XML, Flogic, RDF´s, DAML+OIL (MAEDCHE et al.,
2000).
COM
(Ontological Constraints
Manager)
Esta ferramenta verifica a consistência de ontologias através de
axiomas ontológicos. Através de duas ferramentas de edição,
permite a detecção de conflitos (KALFOGLOU el al, 2001).
Protegé 2000
Trata-se de um ambiente interativo, de código aberto, para o
projeto de ontologias. Oferece uma interface gráfica para criação
e edição de ontologias e dispõe de uma arquitetura para a criação
de ferramentas baseadas em conhecimentos. Através da
modularidade da arquitetura, é possível a inserção de novos
recursos (NOY et al., 2000).
VOID
Ambiente voltado para navegação, edição e gerenciamento de
ontologias. Através de simulação, propicia o estudo de questões
teóricas envolvendo o estudo de organização de bibliotecas de
ontologias, bem como tradução entre diferentes formalismos
(SCHREIBER et a., 1995).
WebOnto
Ferramenta que propicia a navegação, criação e edição de
ontologias, representadas na linguagem de OCML. Permite o
gerenciamento de ontologias por interface gráfica, a inspeção de
elementos, a verificação e consistência da herança e o trabalho
cooperativo. Possui uma biblioteca com mais de 100 ontologias
(DOMINGUES, 2001).
WebODE
Ambiente para engenharia ontológica que dá suporte à maioria
das atividades de desenvolvimento de ontologias. Para favorecer
a integração com outros sistemas, fornece um API (application
programming interface) que favorece a integração com outros
sistemas; importa e exporta ontologias de linguagem de
marcação (ARPÍREZ et al., 2001).
58
2.8.8 Linguagens para a construção de ontologias.
Existem vários tipos de linguagens que podem ser utilizadas para a construção de
ontologias. No Quadro 2.5, apresenta-se um conjunto delas. Sem querer ser exaustivo na
listagem, apresentam-se algumas linguagens encontradas na literatura.
Quadro 2.5: Tipos de linguagem para construção de ontologias.
Nome
Descrição
CARIN
Esta linguagem é resultado da combinação de Datalog (linguagem
baseada em regras) e lógica descritiva ALN. Uma ontologia CARIN é
constituída por dois componentes terminológicos, um conjunto de
conceitos com declaração de inclusão e um conjunto de regras que
utilizam estes conceitos (LEVY E ROUSET, 1996).
CycL
Linguagem formal cuja sintaxe é derivada da lógica de primeira ordem.
Um vocabulário de termos (constantes semânticas, variáveis, números,
seqüências de caracteres, etc) é combinado em expressões, sentenças e,
finalmente, bases de conhecimentos (LENAT E GUHA, 1990).
DAML + OIL
Trata-se de uma linguagem semântica para Web que apresenta
extensões para linguagens como DAML (DARP agente markup
language), RDF e RDFS, através de primitivas de linguagem baseadas
em linguagens lógicas. Permite representar conceitos, taxonomias,
relações binárias e instâncias (HORROCKS et al, 2001).
Flogic – Frame
Logic
Esta linguagem integra frames e lógicas de primeira ordem. Os aspectos
estruturais da linguagem baseada em frames e orientada a objetos
(identificação de objetos, herança, tipos polifórmicos, métodos de
consulta, encapsulamentos, etc) são tratados de forma declarativa.
Permite a representação de conceitos, taxonomias, relações binárias,
funções, axiomas e regras (KIFER et al., 1990).
GRAIL
Especifica uma ontologia no domínio médico (GALEN). Trata-se de
uma linguagem baseada em lógica descritiva, terminologicamente
limitada, que permite a construção de hierarquias de primitivas e
axiomas de inclusão de conceitos (LEVY E ROUSET, 1996).
LOOM
Esta linguagem, descendente da família KL-One (Knowledge Language
One), é baseada em lógicas descritivas e regras de produção. Permite a
representação de conceitos, taxonomias, relações n-áreas, funções,
axiomas e regras de produção (BRILL, 1993).
59
Ontolingua
Esta linguagem combina paradigmas das linguagens baseadas em
frames e lógica de primeira ordem. Permite a representação de
conceitos, taxonomia de conceitos, relação n-áreas, funções, axiomas,
instâncias e procedimentos. Sua alta expressividade causa problemas no
mecanismo de inferência (CHAUDHRI et al., 1998).
OCML
Esta linguagem permite a especificação de funções, relações e classes,
instâncias e regras. É utilizada para aplicações em comércio eletrônico,
em sistemas baseados em conhecimento, para gerenciamento de
conhecimento e para desenvolvimento de ontologias. É aplicada em
memória corporativa, medicina, ciências sociais, portais da Web e
engenharia (DOMINGUE et al., 1999; CHAUDHRI et al., 1999).
OML – Ontology
Markup Language
Trata-se de uma linguagem para especificação de ontologias, baseada
em lógica descritiva e grafos conceituais. Permite a representação de
conceitos organizados em taxonomias, relações e axiomas em lógica de
primeira ordem (KENT, 1999).
OIL
É a precursora da DAML + OIL e a base para o projeto da linguagem
para Web Semântica. Combina várias primitivas de modelagem das
linguagens baseadas em frames com a semântica formal e serviços de
inferência da lógica descritiva. Pode verificar classificação e
taxonomias de conceitos (FENSEL et al, 2001).
NKL
Esta linguagem foi desenvolvida para descrever modelos semânticos
para documentos multimídia. É baseada em frames e permite definir
conceitos organizados em taxonomias e o relacionamento entre eles.
Possui ainda uma sublinguagem para a construção de argumentos
complexos (BERTINO et al., 1999).
RDF – Resource
Description
Framework –
RDFS(RDF
sechema)
Esta linguagem foi desenvolvida pelo consórcio W3 Consortium, tendo
por objetivo a representação de conhecimento através da idéia de redes
semânticas. É uma linguagem não muito expressiva, permitindo apenas
a representação de conceitos, taxonomias de conceitos e relações
binárias (LASSILA E SWICK, 1999).
SHOE - Simple
HTML Ontologu
Extensions
Esta linguagem utiliza extensões ao HTML, adicionando marcações
para inserir dados semânticos em páginas Web. Permite representar
conceitos, taxonomias, relações, instâncias e regras de dedução
(HEFLIN E HENDLER, 2000).
XOL
Trata-se de um pequeno subconjunto de primitivas do protocolo OKBC.
É uma linguagem restrita, na qual apenas conceitos, taxonomias e
relações binárias podem ser especificadas. Não possui mecanismos de
inferência e foi projetada para o intercâmbio de ontologias no domínio
da biomédica (KARP, 1997).
60
Os projetos de desenvolvimento de ontologias obedecem a metodologias que devem
ser atendidas com bastante critério. Este cuidado é elemento fundamental no sucesso do
projeto. No Quadro 2.6, apresenta-se um sumário das principais diferenças entre algumas
metodologias de desenvolvimento de ontologias.
Quadro 2.6: Sumário das principais diferenças entre metodologias de
desenvolvimento de ontologias
Critérios
Uschold & King
Grüninger & Fox
METHONTOLOGY
Detalhamento da
metodologia
muito pouco
pouco
muito
Recomendação de
formalização
nenhuma
lógica
nenhuma
Estratégia para construção
de aplicações
independente da
aplicação
semi-dependente da
aplicação
independente da
aplicação
Estratégia para
identificação de conceitos
“middle-out”
“middle-out”
“middle-out”
Ciclo de vida recomendado
nenhum
nenhum
sim
2.8.9 Roteiro para desenvolvimento de uma ontologia
Uma ontologia define um vocabulário comum para pesquisadores que necessitam
compartilhar informações de um domínio. Isso inclui definição de motores para interpretação
dos conceitos básicos no domínio e da relação entre eles.
Para o caso em questão, seguir-se-á a metodologia proposta por (HORRIDGE 2004),
que propõe um conjunto de sete passos, já apresentados anteriormente e repetidos aqui por
comodidade:
•
Passo 1 – determinação do domínio e do escopo da ontologia. Os autores sugerem
iniciar pela definição domínio e o escopo da ontologia. Estas definições podem ser
facilitadas com a resposta as seguintes perguntas:
o Que domínio a ontologia deverá contemplar ou considerar?
o Para que estamos desenvolvendo a ontologia?
61
o Que tipos de questionamentos ou informações a ontologia deve responder?
o Como será a utilização e a manutenção da ontologia?
Estas perguntas devem durar enquanto se estiver na fase de definição e entendimento
do domínio e do escopo que a ontologia deverá atender.
•
Passo 2 – Considere a reutilização de ontologias existentes. É importante
considerar que outra pessoa já pode ter feito um trabalho com ontologias no
mesmo enfoque. Nestes casos o refinamento da ontologia existente pode atender a
necessidade que se tenha e assim economizar recursos. Existem vários servidores
de ontologias e projetos que as utilizam. Uma pesquisa nestes projetos pode
favorecer a identificação e o reuso de ontologias. Existem várias bibliotecas de
ontologias que podem ser acessadas. Um exemplo está no endereço:
“http://www.ksl.stanford.edu/software/ontolingua” .
•
Passo 3 – Enumere importantes condições para a ontologia. Que questões
gostaríamos de apresentar para o usuário da ontologia, que pontos importantes ele
poderia obter ou oferecer com a utilização da ontologia. Neste sentido,
o Quais são as questões que gostaria de falar sobre eles?
o Que propriedades estas condições têm que se deve considerar?
o Que propriedades têm as condições apresentadas pela ontologia?
o O que se poderia afirmar a respeito das condições presentes na ontologia
desenvolvida, com relação ao domínio do qual ela faz parte?
•
Passo 4 – Definir a classe e suas hierarquias. Existem diversas possibilidades para
desenvolver uma hierarquia de classes. Tpo-dows onde o desenvolvimento do
processo inicia-se com a definição dos conceitos mais gerais e depois parte-se para
os mais específicos. Bottom-up que segue o caminho oposto da anterior. A partir
do específico chega-se ao conceito geral. E a combinação das duas anteriores,
caminhando hora no sentido especifico para o genérico hora no sentido genérico
para o específico. Com base na lista criada no passo anterior, se organiza os
elementos identificados e estabelece-se a hierarquia através de taxonomias. Sendo
assim se um conjunto de elemento em A tem características que estão presentes na
classe B, então a classe a será uma superclasse da classe B.
•
Passo 5 – define as propriedades das classes – Slots. Somente a classe não é o
suficiente para disponibilizar informações para responder a questões especificas
62
definidas no passo 1. Na medida em que se define algumas classes, deve-se
descrever a estrutura interna do conceito representado por aquela classe.
•
Passo 6 – Define as facetas do slots - Os slotls podem ter diferentes facetas
descrevendo diferentes tipos de valores, valores permitidos, numero de valores e
outras características que um slot pode ter.
Com relação a cardinalidade, um slot pode ter cardinalidade simples, permitindo um
valor no máximo, ou cardinalidade múltipla, permitindo vários valores para o slot.
Com relação aos tipos de valores do slot, estes podem ser do tipo string, numero,
boolean, enumerado e tipo instancias.
Para definir um slot além da definição dos elementos acima citados, necessita-se
definir também o domínio e a imagem do slot.
Este tema é discutido no paper (HORRIDGE 2004)
•
Passo 7 – Criar instancias – o ultimo passo é criar as instâncias individuais das
classes. Definir as instâncias individuais de uma classe requer, primeiramente
escolher uma classe, depois criar uma instância individual para representar um tipo
especifico de objeto e, por último, preencher os valores do slot.
As várias metodologias indicam a necessidade de pesquisar se não há alguma
aplicação envolvendo o projeto em questão, para aplicar o reuso e assim ganhar tempo e
recurso no desenvolvimento do projeto da ontologia. No Anexo I, apresentam-se endereços
com catálogo mundial referente à maioria dos projetos envolvendo construção de ontologias.
2.9 O PROTÉGÉ
Segundo a definição encontrada no site do aplicativo (http://protege.stanford.edu/), “o
Protégé é um editor de ontologia de código aberto, de livre utilização. É também uma
estrutura de base de conhecimentos”. O software foi desenvolvido pela Escola de Medicina da
Universidade de Stanford, através da Stanford Medical Informatics. Esta organização conta
com vários pesquisadores associados, bem como agências de pesquisas distribuídas no mundo
todo.
O Protégé é uma ferramenta gráfica que suporta as atividades de construção de uma
ontologia. Trata-se de uma ferramenta Java, código aberto, que oferece uma arquitetura
extensível para a construção de ferramentas de base de conhecimento personalizadas. Sob o
enfoque do aplicativo em questão, a ontologia é considerada um domínio específico de
63
conhecimento. Os conceitos e seus atributos, bem como a relação entre estes conceitos, são
representados como um conjunto de classes e slots.
Partindo de metodologias propostas para a modelagem do domínio, utilizam-se grafos
para representar as relações semânticas de hiponímia e meronímia. No Protégé, a relação de
hiponímia se explicita através da utilização de classe e subclasse. Os slots permitem
estabelecer a relação de meronímia.
A ferramenta permite aos seus usuários construir ontologias, definir formulários para
entrada de dados e inserir, consultar, alterar e excluir dados. Permite ainda a manutenção da
ontologia através da alteração de classes e slots. Ela também é uma ferramenta gráfica que
facilita a visão e compreensão da ontologia. Permite facilmente a inclusão de gráficos,
tabelas, mídias como som e imagens, além de poder armazenar estes aplicativos em vários
formatos, tais como OWL, RDF, XML e HTML.
A Aplication Programming Interface – API ou a Interface de utilização do Protégé
permite a utilização, acesso e visualização do conteúdo das bases de conhecimento criados no
Protégé.
A ferramenta apresenta três elementos básicos, através dos quais é possível construir a
ontologia, definindo classes, subclasses e a relação entre elas. É possível também definir a
forma através da qual o conteúdo das instâncias será apresentado, bem como incluir, consultar
e modificar e excluir instâncias da ontologia. Os três elementos são: Guia Class, Guia Forms e
Guia Instances.
a) Guia Class
A guia “Class” é um editor de ontologias que se pode utilizar para definir classes e
hierarquia entre elas, slots, valores de restrição entre eles, bem como os relacionamentos entre
estes vários elementos.
64
Na Fig. 2.13, apresenta-se o lay-out da guia “Class”
Figura 2.13:Guia “Classes” do Protégé
b) Guia “Forms”
O guia “Forms” gera os formulários padrão para aquisição de instâncias base, através
dos tipos e formas dos slots especificados pelo usuário. Através desse ambiente, é possível
formatar a forma desejada para a inserção dos conteúdos das propriedades das instâncias. É
possível alterar o formulário padrão reorganizando campos na tela, alterando tamanhos, títulos
e outras propriedades do slot.
65
Na Fig. 2.14, apresenta-se o layout do guia “Forms”.
Figura 2.14: Guia “Forms” do Protégé
c) Guia “Instances”
A Guia “Instances” é uma ferramenta de aquisição de conhecimento que se pode usar
para adquirir instâncias para as classes definidas na ontologia. Através dela, pode-se inserir,
consultar, alterar ou excluir uma instância.
A interface em questão permite ainda a seleção das propriedades a serem apresentadas.
66
Na Fig. 2.15, apresenta-se o layout da interface
Figura 2.21: Guia “Instances” do Protégé
67
Na Fig. 2.16, apresenta-se uma tela do Protégé representando vários elementos de uma
estrutura de ontologia através das interfaces do Protégé
Figura 2.22: Apresentação de elementos de uma ontologia no Protégé
A descrição de cada elemento constitutivo destas interfaces, bem como sua forma de
utilização, estão presentes no Anexo II e disponibilizados no site da ferramenta.
3 O MODELO PROPOSTO
3.1 CONDIÇÕES DE CONTORNO
A implantação do modelo proposto requer condições preliminares, sem as quais várias
etapas terão sua execução prejudicada, comprometendo o projeto como um todo. O projeto
em questão necessita de um ambiente organizacional com maturidade na utilização de
controles como fator essencial para acompanhar o desenvolvimento organizacional. É
fundamental que a organização tenha adquirido habilidades e competências básicas neste
sentido para poder dar suporte às demandas que o projeto apresenta.
Outro fator fundamental é a identificação e escolha de uma estratégia de
competitividade. O modelo proposto necessita que a organização tenha uma estratégia de
competitividade e que seja capaz de dar sustentação à mesma. Caso a organização não tenha
definido com clareza a estratégia de competitividade, é necessário fazê-lo.
Para definir a estratégia de competitividade, apresentam-se duas possibilidades. A
primeira contempla a aplicação de metodologia para definir a própria estratégia de
competitividade. Varias metodologias de planejamento poderão auxiliar nesta etapa. No
Anexo II, apresenta-se uma metodologia desenvolvida no Núcleo de Desenvolvimento
Empresarial – NDE, vinculado ao Núcleo de Pesquisa e Extensão – NPE, do Centro Federal
de Educação Tecnológica de Santa Catarina – CEFET SC.
A segunda estratégia contempla a aplicação de metodologia já definida, presente no
mercado. Para o caso deste projeto, utilizar-se-á o modelo da cinco forças competitivas de
Porter.
3.2 FATOR DELIMITATÓRIO PARA APLICAÇÃO DO MODELO
Como já mencionado, considerando as características necessárias para a aplicação do
modelo proposto, aborda-se a questão do controle organizacional como fator fundamental
para o êxito, considerando que
69
controle é a ação necessária para verificar se os objetivos, planos, políticas e
padrões estão sendo obedecidos. O controle pressupõe o estabelecimento e a
comunicação dos objetivos, políticas e padrões aos administradores
responsáveis pela sua realização (GOMES.J.S. and SALLES 1999).
Entende-se, que o controle favorece a conquista dos objetivos da organização, sendo
uma das funções básicas da Administração, ele exige e oferece condições que definem o perfil
da organização.
Aborda-se esta questão apresentando no Quadro 3.1 uma síntese das condições que
deve ter uma organização, em se tratando de controle.
Quadro 3.1: Resumo das características do controle (Adaptado de Gomes e Salles, 1999)
Aspectos
Perspectiva limitada
Perspectiva ampla
Filosofia
Controle de cima para baixo
Controle realizado por todos
Controle como sistema
Controle como atitude
Cumprimento
Desenvolvimento de uma
consciência estratégica orientada
para o aperfeiçoamento contínuo.
Ênfase
Melhora da posição competitiva
Considerações do
contexto social,
organizacional e
humano.
Limitado. Ênfase no desenho de
aspectos técnicos.
Amplo. Contexto social, sociedade,
cultura, emoções, valores.
Fundamento teórico
Economia, engenharia
Antropologia, sociologia,
psicologia.
Mecanismo de controle
Controle baseado no resultado da
Contabilidade de Gestão.
Formal e informal. Outras
variáveis, aprendizado.
Normas rígidas, padrões, valores
monetários.
O Quadro 3.1 evidencia as características do controle nas questões: filosofia; ênfase;
conceito de controle; considerações do contexto social; organizacional e humano; fundamento
teórico e mecanismo de controle.
Para a implantação do modelo, necessita-se de condições apresentadas na coluna que
localiza as características de empresa ampla, a saber: controle realizado por todos como
atitude; motivação e autocontrole; desenvolvimento de uma consciência estratégica orientada
para o aperfeiçoamento continuo; melhoria da posição competitiva; condições de
fundamentação teórica em antropologia, sociologia e psicologia em nível suficiente para
70
favorecer o relacionamento e a visão de mundo; mecanismos de controle formal e informal
voltados para a identificação de processos, variáveis de pró-atividade, para considerar o
processo como um fator de sustentação das atividades e como objeto de estudo e
aperfeiçoamento.
Sob o foco do contexto social, as organizações apresentam condições que favorecem
ou dificultam a implantação de tecnologia como a proposta por este trabalho de pesquisa.
Neste sentido, o quadro abaixo apresenta um resumo da dimensão organizacional sob o foco
social. Neste quadro, classificam-se as organizações, buscando propor um perfil para as que
apresentam condições de visibilidade local e as que conseguem enquadrar-se em nível de
dimensões internacionais, a partir das características distribuídas nas linhas da tabela.
Quadro 3.2: Contexto social no estabelecimento do controle
organizacional (GOMES E SALLES, 1999)
Contexto social
Local
Pequena
Internacional
Centralizada
Descentralizada
Controle familiar
Controle ad-hoc
Limitada Formalização
Dimensão
Controle burocrático
Controle por resultados
Grande
Elevada Formalização
Do quadro, depreende-se que o controle descentralizado, feito com flexibilidade,
dentro de uma formalização, favorece o aumento dos horizontes da organização, bem como o
controle por resultados. A manutenção de sistemas formalizados de acompanhamento
expande a possibilidade das organizações e as habilita para desenvolver projetos com as
características similares às do projeto que se apresenta nesta tese.
Sob outro enfoque, o Quadro 3.3 apresenta características em termos de processo e
infra-estrutura que caracterizam as organizações. Percebe-se que as características presentes
nos dois últimos estágios consolidam condições que permitem às organizações movimentar-se
no sentido de garantir sistematicamente políticas de competitividade e outras condições,
tornando-se permeáveis e viáveis no que tange ao aporte de tecnologia.
71
Quadro 3.3: Características em termos de processo e infra-estrutura (SILVA et al., 1992)
Estágios
Características organizacionais
Empreendimento
– estrutura organizacional fluida
– regras e procedimentos personalizados
– planejamento e coordenação incipientes
– poder altamente centralizado
– ênfase em inovação e criatividade
– estratégia de alto risco em relação ao mercado
– informações gerenciais predominantemente informais e rudimentares
– formação de nicho
– captação e ordenação de recursos
Formalização
– estrutura organizacional funcional
– políticas, regras e procedimentos institucionalizados
– planejamento e coordenação sistemáticos
– poder relativamente centralizado
– ênfase no conservadorismo
– estratégia de estabilidade e eficiência
– sistema de informações gerenciais predominantemente centralizado
– relacionamento estável com o ambiente externo
Flexibilização
– estrutura organizacional divisionada e semi-autônoma
– políticas, regras e procedimentos institucionalizados, mas flexíveis
– planejamento sistemático de longo prazo
– poder descentralizado
– ênfase em inovação e criatividade
– estratégia de diversificação de domínio em relação ao mercado
– sistema de informações gerenciais predominantemente descentralizado
– relação adaptativa com o ambiente externo
Apresentados os fundamentos, propõem-se condições de contorno delineadas para o
estudo em questão que contemplem a condição estrutural para que a organização estabeleça e
dê sustentação a mecanismos de planejamento e controle compatíveis com o que requerem as
etapas integrantes do modelo em construção. Para maior clareza, apresentam-se as condições
de contorno necessárias para a implantação, classificando-se as organizações, segundo a
bibliografia apresentada, em três grandes grupos, assim definidos: Grupo I – organizações
indiferentes; Grupo II – organizações em transição; Grupo III – organizações alinhadas
72
estrategicamente. As características desses grupos são apresentadas abaixo e aparecem
resumidas na Fig. 3.4.
3.2.1 Grupo I – Organizações indiferentes
Este grupo caracteriza-se por apresentar um grau de indiferença significativo com
relação a buscar sólida posição com relação ao conhecimento sobre o comportamento do
mercado. Sem dar importância a procedimentos baseados na tecnologia, a organização
caminha de forma desordenada, buscando entender o mercado a partir de procedimentos não
estruturados, extemporâneos, baseados em ações localizadas sem abrangência e patrocínio da
organização como um todo.
Esta situação gera altos valores de desperdício de recursos, e as ações não apresentam
objetividade a ponto de propiciar uma tomada de posição eficaz da organização como um
todo. Percebem-se processos inacabados, rotinas incongruentes e muito esforço operacional
para garantir o mínimo de equilíbrio para vencer as demandas que inercialmente estão
presentes nos vários processos da organização.
Nesta etapa da vida organizacional, dá-se muita atenção para posições visionárias, sem
o cuidado de sustentar as ações advindas destas posições em algum tipo de metodologia.
Esquece-se que um visionário sem metodologia aproxima-se do reino das fadas
(MINTZBERG and QUINN 2001).
As organizações integrantes deste grupo não dispõem de visão do mercado e por isso
são incapazes de compartilhá-la com os seus colaboradores.
3.2.2 Grupo II – Organizações em transição
Este grupo apresenta uma condição bastante característica: Quer ser o que não é e é o
que não quer ser. Essa etapa das organizações se caracteriza por intensa atividade na busca de
novas soluções. O clima organizacional está voltado para reestruturações, e a organização está
permeável ao aportes de tecnologia nas várias áreas de atuação da organização.
Nesta etapa, a organização já conta com um grau de maturidade para perceber o
movimento do mercado e já estabelece um acompanhamento em paralelo do comportamento
do mesmo. O grande desafio está na busca pela visão antecipada dos fatos. Geralmente a
73
organização atua de forma reativa, pois entende o que está acontecendo, porém é tomada de
surpresa com o surgimento dos fatos.
Com relação à visão estratégica, as organizações que se encontram nesta fase já
apresentam visões de cenários, que, em alguns pontos notadamente, começam a ser
compartilhadas.
3.2.3 Grupo III – Organizações alinhadas estrategicamente
As organizações que integram este grupo apresentam visões claras quanto ao
comportamento do mercado, capacidade para implantar um modelo de gestão do
conhecimento por já haverem implantado um nível de planejamento organizacional que
estabelece para todo o âmbito da organização um cenário uniforme e compartilhado.
Estas organizações dispõem de planejamento global e apresentam programas que
buscam aumentar o grau de envolvimento estratégico e de ações alinhadas com este
pensamento.
A gestão do conhecimento é uma atividade possível de ser executada em um ambiente
com estas características. Com relação aos elementos de gestão do conhecimento, composição
de cenário, informação e dado, apresenta-se uma visão esquemática que representa o acima
referido.
Um fator a ressaltar é que o modelo proposto aplica-se às organizações que migram do
segundo grupo para o terceiro. Na verdade, o modelo favorece esta migração.
74
Figura 3.1: Estágios das organizações
3.3 DESCRIÇÃO DO MODELO
O objetivo do modelo é dotar a organização de um processo estruturado para
recuperação de informação a partir de documentos não estruturados, a fim de dar sustentação
a uma estratégia de competitividade.
O modelo está organizado em atividades agrupadas em fase, para transformar o
referencial teórico modelado em domínio de conhecimento a ser modelado. Para efeito de
implantação do modelo proposto, aplicar-se-á o referencial teórico baseado nas cinco forças
competitivas de Porter (PORTER 1996). O referencial teórico permite a construção do
cenário, fator básico para a aplicação do modelo. Definido o referencial teórico, aplicam-se as
quatro fases que compõem o modelo.
Cada fase é o resultado de um conjunto de ações baseadas em orientações
metodológicas que fazem com que o referencial teórico definido seja compreendido, ajustado
75
à realidade da organização e preparado para que se possa dar ao modelo uma estruturação
computacional. A Fig. 3.2 apresenta as fases do modelo proposto.
Figura 3.2: Fases do modelo proposto
3.3.1 Fase I: Localização ou Acoplamento
Durante esta fase, duas ações necessitam ser encaminhadas. A primeira se concentra
na formação da visão compartilhada da estratégia a ser implementada. Durante esta etapa, a
área envolvida na implantação do cenário deverá ser alvo de grande volume de horas de
76
treinamento. O referencial teórico será o elemento propulsor da construção de um cenário a
ser considerado nos passos seguintes.
A segunda etapa é a identificação dos elementos integrantes do cenário construído,
que emerge com a modelagem do cenário criado com a aplicação do modelo teórico.
A terceira etapa identifica os elementos estratégicos que deverão ser considerados na
fase II. Para tanto aplicam-se ao cenário construído metodologias como Strenghts – Weakness
– Opportunities – Threats (S.W.O.T.) (PRADO 2004) para identificar os elementos a serem
considerados.
O resultado desta fase é uma visão conceitual que dá sustentabilidade semântica aos
elementos presentes no cenário em questão.
3.3.2 Fase II: Apropriação ou Posicionamento
Após definido, compreendido e localizado o referencial teórico na organização,
inicia-se a fase II com um conjunto de conceitos que serão a base para a formação da estrutura
ontológica. A partir do ambiente semântico estabelecido na fase I, modela-se o domínio do
conhecimento sustentado pelo referencial teórico e compreendido pela organização.
Com a identificação dos recursos presentes na modelagem do cenário, pode-se
construir classes, estabelecer atributos e relações entre classes e objetos (PROTÉGÉ 2004).
O resultado desta fase é a definição dos elementos sujeito, objeto e predicado, que
permitirão construir uma estrutura que represente o domínio modelado.
Identificados este elementos, inicia-se a fase III.
3.3.3 Fase III: Construção do modelo do domínio
Esta fase se caracteriza pela construção de modelo esquemático que represente o
domínio do conhecimento sustentado pelo referencial teórico. O modelo construído representa
a relação entre classes e objetos e define também o relacionamento entre os elementos do
domínio modelado, os objetos, sujeitos e predicados.
O resultado desta etapa permite a construção da ontologia. Uma ontologia representa
uma visão compartilhada de um domínio (FÉRNANDEZ, GÓMEZ-PÉREZ et al. 1997). Com
a representação do domínio expressa através de uma estrutura ontológica, pode-se construir
um modelo computacional que permitirá o processamento em computadores de regras de
77
negócios pertinentes ao domínio de conhecimento modelado a partir do referencial teórico
proposto.
3.3.4 Fase IV: Construção do modelo computacional
Esta fase caracteriza-se pela construção de uma representação em código processável
pelo computador, para representação da ontologia construída. O modelo computacional é a
ferramenta que dará suporte à estratégia adotada, propiciando a identificação de informações
importantes para o escopo estratégico, presentes em documentos semi-estruturados. A partir
de parâmetros de validação e controle, a ferramenta recupera e analisa dados presentes na
Intranet da organização, disponibilizando o resultado do processamento para os responsáveis
pela sustentação do posicionamento estratégico.
O resultado desta etapa é uma ferramenta computacional, um modelo a ser validado e
utilizado.
3.4 UTILIZAÇÃO DO MODELO
Após a construção do modelo computacional, sua aplicação permitirá à organização
monitorar os vários elementos que foram identificados como integrantes do discurso do
domínio que devem ser considerados pelos gestores. Para exemplificar, considere-se que um
dos discursos de domínio seja: “Necessita-se manter a melhor relação possível com os
clientes”. Esse elemento de discurso está sustentado na ontologia através da modelagem do
recurso documento, que é uma classe que se vincula a clientes. Para o caso, considera-se que
um contato feito com a organização, que tenha como remetente um cliente e que este contato
tenha como tema reclamação, atenda a premissa estabelecida pelo discurso “necessita-se
manter a melhor relação possível com os clientes”. Portanto, deve ser identificado e
selecionado.
Esta propriedade, presente em um contato de cliente, é um agravo ou um sintoma de
que o discurso do domínio “necessita-se manter a melhor relação possível com os clientes”
está sendo prejudicado. Para o caso, estabelece-se uma ação, um comportamento a ser
adotado pela organização. Este comportamento pode ser o envio de uma correspondência para
o cliente, ou para o canal que o atende.
Para fins de ensaio e validação, elaborou-se uma regra indicando que, quando um
cliente da classe “A”, fizer contato com a organização através de um meio não estruturado de
78
comunicação, sendo o contato com tema de reclamação, o documento será identificado e uma
mensagem “Há reclamação do cliente nome-do-cliente” será gerada.
Para fins de modelo, a geração desta frase significa que se pode tratar o evento
(chegada de correspondência do cliente com reclamação) da forma que se entender adequada
para fins de construção de ferramenta utilizando a solução construída.
O processo de tratamento dos documentos não estruturados será feito através de
processo de marcação por funcionário que dá suporte burocrático à organização. O
funcionário não necessita ter ciência do processo a que será submetido o resultado da tarefa de
marcação que ele fará, porém a execução da ação indicada no modelo da ontologia fará com
que um aplicativo, que não faz parte do escopo deste projeto de pesquisa, dispare um
procedimento, que pode ser um comunicado ao diretor de vendas ou o envio imediato de
correspondência acusando recebimento e providências para o tema em questão.
Com isso, a premissa de que o cliente reclamante será atendido não depende mais do
envio da correspondência para o diretor, ou da necessidade de que o funcionário recorde esta
rotina implantada pela estratégia de competitividade.
Este elemento de suporte de gestão apresenta as seguintes vantagens:
a) A tarefa de marcação pode ser feita através de ferramenta desenvolvida para este
fim. É de fácil manejo, não requerendo grande nível de formação acadêmica para sua
operação.
b) O executor do processo de marcação não precisa conhecer as diretrizes que
nortearão o comportamento do ambiente. Ou seja, o anúncio de que chegou um contato de
cliente com reclamação será disparado para o gerente sem a menor interferência do executor
da marcação.
c) O documento contendo dados não estruturados, através do processo de marcação e
do suporte da ontologia, pode ser convertido para um documento semi-estruturado,
permitindo tratamento computacional em vários níveis para vários propósitos. Um deles é o
de dar consecução a diretrizes estabelecidas a partir da estratégia de competitividade
estabelecida pela organização.
d) A efetividade na ação de supervisão das diretrizes da estratégia de competitividade
é uma realidade, pois conta com suporte computacional que, além de rápido, é preciso e
constante.
e) A localização do documento em questão pelos gestores é imediata. Isto facilita a
ação do gestor no sentido de dar sustentação à estratégia de competitividade, pois o tempo
para iniciar atividades corretivas é bastante diminuído.
79
Se o elemento descrito na ontologia estiver alinhado com a estratégia de
competitividade, o produto da ação do modelo será um fator sustentador para a estratégia.
A simulação da chegada do documento será feita no ambiente do Protégé, pois não é
objetivo deste trabalho a construção do ambiente de marcação que atua em correspondência
com o ambiente da ontologia. A Fig. 3.6 apresenta esquema do funcionamento do modelo.
3.5 VALIDAÇÃO DO MODELO
A validação do modelo se dará através de aplicação de recursos baseados em preceitos
da Lógica formal e da teoria dos conjuntos, executados em nível computacional, utilizando
recursos da ferramenta que permite construir a ontologia (MUSEN and al. 1995).
A partir do funcionamento da Ontologia, é possível estabelecer regras de validação
que irão conferir regras suportadas pelo discurso do domínio. Essas regras são as diretrizes
condutoras para o comportamento da Ontologia.
Figura 3.3: Representação esquemática do funcionamento do modelo
Documento
recebido
Ontologia
do modelo
Think
Cientific-Document
Event
Scientific-Event
Live-Scientific-Event
Chegada na
Empresa
Correio ou
E-mail
Part-Publication
Keyowrd
Marcação
Instance
Special-Inssue-
Documentos marcados
Metadados,
segundo o referencial
teórico de competitividade
Dividable-
Scientific-Publication-Eventn-Title
Proceeding
Book
String
Special-Inssue-Magazine
Aplicações futuras,
fora do escopo da
pesquisa.
Aplicativo
Digitalização
quando via correio
Documento
em
marcação
Decisão 1
Decisão 2
Decisão 3
Decisão n
80
4 CONSTRUÇÃO DA ONTOLOGIA
Seguindo os passos propostos pela metodologia para construção de ontologias,
apresentada em (NOY and McGuinness 2005), apresenta-se abaixo a ontologia que representa
o domínio do conhecimento apresentado pelo referencial teórico de Porter.
Inicialmente considera-se que:
a) Existem vários caminhos para modelar o domínio do conhecimento envolvido no
referencial teórico de Porter.
b) A melhor solução depende da aplicação que se tenha em mente e da extensão que se
queira dar para esta aplicação.
Para o caso, a aplicação deverá servir de suporte à estratégia de competitividade
concebida por Porter, dando condições para que se acessem informações em documentos não
estruturados.
c) O desenvolvimento de uma ontologia envolve, necessariamente, um processo
iterativo. A ampliação e amadurecimento da compreensão sobre o domínio do conhecimento
em estudo favorecem o aperfeiçoamento da ontologia. Sendo assim, a segunda proposição
para a ontologia em desenvolvimento será um aperfeiçoamento da primeira, e a solução n será
um aperfeiçoamento da solução n-1.
d) Os conceitos em uma ontologia devem ser comparados a objetos e o relacionamento
entre eles. Provavelmente serão verbos ou objeto em uma relação presente no domínio ao qual
pertencem, descrita através de uma sentença. Para o caso em estudo, têm-se conceitos como
clientes, fornecedores, concorrentes, concorrentes entrantes, indústria e produtos substitutos.
E, como propriedades, temos verbos que ligam elementos de um conjunto representado pelos
conceitos acima a um individuo deste conjunto. Por exemplo: A empresa “A” é integrante do
conjunto de clientes. O elemento “é integrante” constitui uma propriedade que liga a empresa
“A” ao conjunto ao qual ela pertence, chamado “clientes”. A figura 4.1 representa esta relação
82
é integrante
A
é integrante
Clientes
B
é integrante
C
Figura 4.1: Taxonomia entre a classe Cliente, a empresa A e a propriedade “é integrante”.
4.1 SEQÜÊNCIA DE PASSOS – APLICAÇÃO DA METODOLOGIA
Seguindo o que indica a metodologia. O primeiro passo consiste em determinar o
domínio e o escopo da ontologia.
4.1.1 Passo 1
Para atender a esta questão, quatro perguntas devem ser formuladas.
a) Qual domínio a ontologia envolverá?
O domínio da ontologia está ligado à estratégia de competitividade organizacional
definida por Porter. Através dela, serão descritos os conceitos e propriedades de classes e
objetos de um domínio.
Sendo assim, teremos cinco forças que atuarão em um cenário de competitividade
organizacional. São elas os clientes, os fornecedores, os produtos substitutos e os clientes
entrantes.
Recuperando o apresentado na Fig. 2.1, a Fig. 4.2 expressa o domínio do
conhecimento a ser representado pela ontologia.
83
Figura 4.2 – Domínio do conhecimento a ser modelado pela ontologia
b) Para que se vai utilizar a ontologia?
Utilizar-se-á a ontologia para acessar documentos não estruturados, segundo critérios
por ela representados, a partir do domínio acima explicitado.
A ontologia em questão permitirá à organização estabelecer critérios de acesso a
documentos não estruturados que favorecerão a sustentação da estratégia de competitividade
em questão.
c) Que tipos de perguntas ou informações a ontologia deverá responder?
A ontologia deverá ser capaz de responder perguntas vinculadas a cinco referenciais,
base para o estabelecimento de ações, a partir da observação de parâmetros assim delineados:
I) Ações para concorrentes entrantes em potencial:
Este aspecto refere-se à entrada de novas empresas no mercado e para impedir estas
entradas, pode-se estabelecer barreiras considerando:
•
Economia de escala:
Item a ser monitorado: Declínio no custo em decorrência da otimização em áreas
funcionais, integração vertical ou horizontal e compartilhamento de recursos.
Sob esse enfoque, pode-se considerar as seguintes informações:
o Qual o valor do custo operacional de cada área funcional?
o Qual o valor de custo operacional de determinado projeto?
84
o Qual a redução de custos provenientes de condições sinérgicas na utilização de
base operacional, equipamentos ou estruturas herdadas a partir de
relacionamentos construídos com o tempo de operação com clientes,
fornecedores ou outras parceiras?
o Determinado projeto envolve quais áreas funcionais?
o Determinada área funcional está envolvida em quais projetos?
o Que recursos de tecnologia e de logística são necessários para o
desenvolvimento, implantação ou sustentação à determinado projeto?
o Que concorrentes se pode ter para determinado produto fornecido pela
organização?
o Que nível de custo operacional deve ser mantido para inviabilizar investidas de
novos concorrentes no mercado onde a organização atua?
•
Diferenciação do produto:
Itens a serem monitorados: Aspectos vinculados à marca já identificada pelo mercado
e/ou qualidade do produto ou serviço oferecido ao mercado.
Pare este enfoque, pode-se ter as seguintes perguntas ou informações:
o Quais marcas de concorrentes existem no mercado?
o A que tipos de clientes estas marcas atendem?
o Que coincidência existe entre estas marcas e as da minha organização?
o Que diferenciação existe entre a minha marca e a dos concorrentes?
o Que quesitos na qualidade do meu produto devem ser considerados para fins
de diferencial de competitividade?
o De que forma estes quesitos são considerados pelos clientes ou pela
concorrência?
o Que nomes diferentes existem para o produto que minha organização oferece?
•
Necessidade de Capital:
Item a ser monitorado: Alinhamento da organização em torno da necessidade de
capital para desenvolver, implementar ou sustentar determinado serviço ou produto no
mercado.
Este enfoque pode considerar as seguintes perguntas ou informações:
o Que projetos existem para serem implementados?
o Quais os valores de investimentos por projeto?
85
o Quais as fontes de financiamentos disponíveis?
o Quais as fontes de financiamentos possíveis?
o Quais as regras para obtenção de linhas de créditos?
o Quais as oportunidades de contato com investidores nacionais e internacionais?
o Existem editais de órgãos fomentadores de desenvolvimento regional?
o Que editais estão presentes para serem aproveitados por minha organização?
o Quais documentos na organização que fazem referência a instituições
financiadoras de produtos, serviços ou de capital de giro?
o Quais os projetos internos em desenvolvimento capazes de serem financiados?
•
Custo de mudança:
Para que um cliente mude de produto ou de fornecedor, existe um custo e um risco que
podem ser utilizados como fatores determinantes de barreiras para evitar a entrada de novos
concorrentes.
Itens a serem monitorados:
o Quais os custos de treinamento?
o Qual a estrutura necessária para a utilização do serviço ou produto em questão?
o Qual o tempo e risco presentes no processo de mudança de produto ou de
serviço em questão?
o Quais os elementos presentes na documentação da organização que evidenciam
fatores de risco que poderão catalisar a disposição e minimizar a sensação de
risco a correr com a troca do produto ou serviço oferecido pela organização?
o Quais os outros produtos candidatos a substitutos do que a organização
oferece?
•
Acesso aos canais de distribuição:
Dentro desta questão, o foco deve ser voltado para a existência, manutenção e
ampliação da estrutura capaz de fazer com que o produto ou serviço seja escoado.
o Quem integra os canais de distribuição da organização?
o Como estão estes canais e projeções para o futuro?
o Qual a possibilidade de surgimento de novos canais capazes de sustentar o
ingresso de novos concorrentes entrantes no mercado?
86
•
Desvantagem de custos independentes da escala:
Este enfoque envolve a necessidade de se estar atento à presença de tecnologias,
subsídios, curva de aprendizagem e localização.
o
Que novas tecnologias associadas aos produtos e serviços da
organização estão presentes nas documentações não estruturadas?
o Que tipos de tecnologias podem melhorar os custos operacionais de
concorrentes entrantes, tornando-os concorrentes entrantes?
o Que tecnologias envolvem o meu produto ou serviço e como estas estão sendo
tratadas ou consideradas por concorrentes em potencial?
o Que centros de excelência estão vinculados a tecnologias existentes nos
produtos da organização?
o Que leis envolvendo subsídios existem na região ou no mercado onde atuo?
o De que forma estes subsídios podem afetar meu produto ou serviços?
o Que leis existem ou estão em fase de mudança ou em fase de construção?
o Que características tem a cura de aprendizado relacionada ao meu produto ou
serviço?
o Que fatores influem no comportamento desta curva?
o De que forma estes fatores estão presentes na organização?
o Que documentos os referenciam?
o Que características existem no mercado onde o produto ou serviço é oferecido?
o Que dissonância com este mercado pode ser percebida?
o Como a dissonância com o produto ou serviço oferecido pela organização se
manifesta no mercado em análise?
o Que leis ou políticas governamentais presentes estão vinculadas aos produtos
da organização?
o Que leis favorecem e representam oportunidades para a manutenção e/ou
ampliação da fatia de mercado do produto em questão?
o Que leis dificultam e representam ameaças para a manutenção e/ou ampliação
da fatia de mercado do produto ou serviço em questão?
87
II) Ações para Concorrentes presentes no mercado:
Este aspecto refere-se à presença dos concorrentes que disputam com a organização as
fatias de mercado. Para estes tipos de ameaça pode-se estabelecer barreiras com os seguintes
enfoques:
•
Concorrentes numerosos ou bem equilibrados
Este aspecto remete a questões vinculadas ao número de ofertas do mesmo produto ou
serviço por diferentes fornecedores e à capacidade de absorção do produto ou serviço pelo
mercado.
Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações:
o Número de fornecedores por produto ou serviço, foco de monitoramento.
o Comportamento do mercado em termos de consumidores para o produto ou
serviço em questão.
o Presença de referências a fornecedores em documentos não estruturados da
organização, para os produtos em monitoramento.
•
Crescimento lento da indústria:
Este fator considera o comportamento da indústria/mercado em relação ao
produto/serviço em questão.
Itens a serem monitorados: Sob este enfoque pode-se ter as seguintes informações:
o Comportamento do crescimento do mercado/indústria.
o Comportamento do crescimento da aceitação do produto/serviço.
o Fornecedores, concorrentes, ou produtos concorrentes presentes em dados não
estruturados nos computadores da organização.
•
Altos custos com armazenamento
Este fator se volta para questões vinculadas a barreiras estabelecidas pelo custo de
estocagem e armazenamento.
o Valores aplicados em armazenamento e estocagem de produtos
o Acompanhamento das sazonalidades, para determinar seu comportamento.
o Identificação de coincidência de produtos e estoques desses produtos.
o Acompanhamento dos custos com armazenamento.
88
•
Ausência de diferenciação ou custo de mudanças.
Este aspecto favorece o monitoramento da diferenciação do produto ou serviço e a
forma através da qual barreiras podem ser estabelecidas favorecendo a fidelização ou
dependência do mercado ao produto ou serviço em questão.
o Diferencial do produto da em questão.
o Conceitos envolvendo o produto que geram relação exclusiva com os clientes.
o Acompanhamento da aplicação de conceitos similares a produtos concorrentes
para estabelecer o grau de ameaça.
o Identificação de conceitos e ou imagens que possam ser aproveitadas para
favorecer a fixação de produtos e serviços ao mercado e assim ampliar a
participação nele.
o Estabelecer estudos para definir a forma de utilizar os conceitos praticados na
caracterização de produtos e serviços pela concorrência, para utilizá-la em
favor do estabelecimento de estratégia de competitividade.
•
Capacidade aumentada em grandes incrementos.
Este aspecto está relacionado com a questão da super capacidade e redução de preços.
Neste sentido, acompanhar a capacidade de produção própria e da concorrência, bem como o
comportamento das negociações entre indústria e canais de distribuição, pode definir
caminhos para a construção de barreiras e assim consolidar uma estratégia de competitividade
neste aspecto.
o Identificação de formas de aumento de produção ou produtividade.
o Identificação de comportamento de acordos firmados entre a própria
organização ou organizações concorrentes para com canais de distribuição.
o Acompanhamento de indicadores ou de referências que definam as tendências
para a estratégia de produção própria e dos concorrentes.
•
Concorrentes divergentes.
Neste sentido, o desafio é estabelecer barreiras que considerem formas de competir
com regras diferenciadas para serem identificadas e construídas.
o Como identificar as regras que definem a conduta de cada concorrente?
89
o Que critérios devem ser considerados para estabelecimento de regras de
concorrência?
o Que diferenciações podem ser identificar nas regras de concorrência
praticadas?
•
Grandes interesses estratégicos.
A identificação da relação estratégica entre o produto ou serviço, o fornecedor e o
cliente favorece a consolidação de características a serem incrementadas ou mantidas nos
produtos e serviços, de tal forma que se estabeleça um vinculo estratégico que possa ser
utilizado como barreira.
o Que grau de dependência o cliente tem em relação ao produto ou serviço
fornecido?
o O que agregar ao meu produto ou serviço que favoreça a inclusão do produto
fornecido na lista dos itens estratégicos para o cliente.
o Que conceitos regem a realidade do mercado?
o Como incluir este conceito nos produtos e serviços que ofereço ao mercado?
o Como acompanhar a evolução destes conceitos e identificar novas
oportunidades para agregar novos conceitos que possam ser aceitos pelo
mercado?
•
Utilização de estratégias para estabelecimento de barreiras de saídas elevadas.
Neste sentido, uma estratégia de competitividade pode ser estabelecida através da
implantação de ativos especializados, custos fixos de saída, inter-relações estratégicas,
barreiras emocionais, ou restrições de ordem governamental ou social.
o Quais formas de celebrar contratos levam à implantação desta forma de
barreira?
o Que legislação dará suporte a esta estratégia?
o Que leis ou resoluções estão em tramitação nos órgãos governamentais?
o Que políticas são praticadas que favorecem esta estratégia?
o Onde estão os documentos da organização que tratam destas questões?
o O que a concorrência tem utilizado quanto aos aspectos acima citados como
elementos formadores de barreiras?
90
o Que conceitos ou cenários devem ser considerados para o estabelecimento de
comportamentos que culminem na criação de barreiras para impedir ou
equilibrar a ação da concorrência?
o Que promoções ou ações de marketing são desenvolvidas e que conceitos são
explorados por elas?
o Como reage o mercado em presença de ações estratégicas desta ordem?
III) Produtos substitutos:
Este aspecto refere-se aos produtos similares que podem ocupar o espaço de um
produto existente. Através do aperfeiçoamento tecnológico ou mudança de comportamento do
mercado, um determinado produto pode ser substituído por outro.
A ameaça de produtos que possam substituir outros advém da presença de competição
extrema entre produtos alternativos com custos mais baixos e que desempenhem a mesma
função, ou com o mesmo custo mas desempenhando funções adicionais. Estes aspectos são
fatores a ser em monitorados e, através deste processo de monitoramento, deve-se identificar,
estabelecer ou neutralizar barreiras apoiadas nos seguintes fatores:
•
Funções a serem desempenhadas por produtos ou serviços.
Este aspecto favorece o monitoramento sobre as necessidades dos clientes e de que
forma um determinado produto atende estas necessidades.
o Como o produto ou serviço atende o cliente ou mercado?
o Que necessidades são apresentadas pelos clientes?
o Que novos conceitos têm sido considerados pelo mercado?
o Que relações entre conceitos e necessidades dos clientes ou mercado podem
ser estabelecidas?
o Que produtos ou serviços existentes podem ocupar o espaço do produto em
questão?
o Como incrementar produtos e serviços para atender a novas necessidades dos
clientes?
o Como agregar funcionalidades que permitam que o mesmo produto ou serviço
amplie seu espectro de atendimento a necessidades do mercado ou cliente?
91
•
Produtos ou serviços que desempenham funções equivalentes.
Neste sentido, a estratégia de estabelecimento de barreiras pode ser exercida ao
agregar novas funcionalidades ou diminuição de preços ou incremento de tecnologia,
definindo vantagens em termos de durabilidade, design ou consumo de energia.
o Que funções desenvolve determinado produto ou serviço?
o Que serviços ou produtos desenvolvem determinada função?
o Que conceitos tecnológicos dão sustentação a determinado produto ou serviço?
o Que perspectivas de melhorias determinado produto ou serviço pode ter?
IV)
Fornecedores:
Este aspecto se refere ao poder de negociação de fornecedores em relação a qualidade,
elevação de preços ou outros fatores que possam comprometer o equilíbrio ou as condições de
operações desejáveis para os negócios da organização. Neste sentido, barreiras necessitam ser
estabelecidas para atender as seguintes questões de interesse da organização.
•
O mercado é dominado por poucas companhias fornecedores, sendo mais
concentrado do que as indústrias para as quais vende.
Este aspecto pode tornar frágil a capacidade de negociação por parte da indústria.
o Identificação de novos fornecedores.
o Produtos substitutos de outros fornecedores.
o Tendência na oferta dos produtos e inovações tecnológicas que possam
favorecer a substituição do insumo ou matéria-prima em questão.
•
O fornecedor não concorre com produtos substitutos:
A exclusividade no fornecimento de produtos ou serviços favorece o monopólio e o
conseqüente domínio dos clientes que necessitam do insumo ou matéria-prima em questão.
Este aspecto também pode tornar frágil a capacidade de negociação por parte da
indústria.
o Produtos possíveis de substituir o produto em questão.
o Novas tecnologias que favoreçam a substituição do insumo ou matéria-prima
em questão.
92
o Novos produtos que atendam as mesmas necessidades dos clientes, porém que
utilizem outros insumos ou matérias-primas.
•
O produto do fornecedor é um insumo importante para o negócio do comprador.
Este fator deve ser considerado como um item a ser neutralizado através de barreiras a
serem construídas. A partir desta posição delicada, o poder de negociação e o domínio sobre
variáveis importantes em nível de custos ou outros aspectos podem comprometer a conquista
dos objetivos da organização cliente.
Itens a serem monitorados: O mesmo enfoque das questões anteriores aplica-se aqui, a
saber:
o Produtos possíveis de substituir o produto em questão.
o Oportunidades de encontrar insumos ou matérias-primas substitutas.
o Desenvolvimento de novos produtos que atendam as mesmas funções, porém
que utilizem outros insumos ou serviços.
•
Os produtos são diferenciados ou o grupo desenvolveu custos de mudanças.
•
O grupo de fornecedores é uma ameaça concreta de integração para frente.
As duas oportunidades de barreiras oferecidas acima por fornecedores são similares às
demais anteriormente tratadas. Entende-se que as informações a serem obtidas ou as
perguntas delas decorrentes têm o mesmo contorno e já foram contempladas.
V) Clientes
Este aspecto contempla as questões oriundas do cliente que podem estabelecer focos
para o desenvolvimento de barreiras que impeçam a entrada de novos concorrentes, a opção
por novos produtos ou a evasão de clientes da carteira da organização. Para este enfoque, é
importante considerar que há possibilidade de serem exercidas pressões sobre os preços no
sentido de fazê-los baixar, estabelecerem-se movimentos que aumentem o poder de
negociação e barganha de clientes organizados em entidades de classes ou similares, haver
exigência de melhor qualidade ou mais serviços e assim jogarem-se os concorrentes uns
contra os outros.
Neste sentido a atenção deve ser voltada para os aspectos apresentados a seguir:
•
Concentração ou aquisição de grande volume de um mesmo vendedor. Este
aspecto pode retirar capacidade de negociação e estabelecer um ponto de
93
fragilidade na relação cliente-fornecedor. Neste sentido, pode-se desenvolver uma
ferramenta para monitorar as seguintes questões dentre outras.
o Estou sendo refém de clientes ou grupos de clientes?
o Existe possibilidade de estabelecer-se uma condição de domínio por parte dos
clientes?
o Como está o grau de satisfação destes?
o De que forma se relacionam comigo como fornecedor e parceiro deles?
o Quando foi a ultima vez que se recebeu-se correspondência deste cliente?
o O que pode estar o cliente esperando dos fornecedores?
o Como se classificam os clientes em níveis de importância?
•
Os produtos que o cliente adquire representam uma fração significativa de seus
próprios custos ou compras.
Ter conhecimento do grau de dependência que o cliente tem do produto que a
organização fornece é poder estabelecer um conjunto de medidas que criem barreiras para
consolidar posições de parceria. O comportamento do custo para a troca de produto pode
representar um impacto desfavorável. Assim o conhecimento e a métrica deste
comportamento pode representar um fator de competitividade a ser utilizado.
o Produtos fornecidos por cliente
o Solicitações de produtos por clientes
o Forma de comunicação entre empresa fornecedora e cliente
•
Os produtos que os clientes compram são padronizados ou não diferenciados:
Caracterizar o tipo de produto oferecido para cada cliente pode estabelecer outro foco
de análise para estabelecimentos de estratégias de competitividade.
Questões a serem monitoradas: Sob este enfoque, pode-se ter as seguintes
informações:
o Enfoque técnico da comunicação entre clientes e fornecedores
o Tipos de temas tratados nas correspondências.
o Identificação, segundo classificação prévia, do nível estratégico do cliente para
a organização.
o Classe ou característica do produto fornecido para o cliente
94
•
Ele enfrenta poucos custos de mudança.
Se o produto fornecido for de fácil substituição, a relação entre cliente e fornecedor
adquire baixa consistência. Para que haja um fortalecimento nesta relação, outros fatores
devem intervir de forma a estabelecer um grau de dependência que fortifique a relação. Neste
sentido, o enfoque estratégico necessita encontrar elementos que ao serem acionados atinjam
os objetivos de fortalecimento do vinculo e criação de barreiras para novos fornecedores ou
para troca por produto similar.
o Tipo de contato que o cliente faz com a organização.
o Temas dos contatos.
o Interesses explícitos dos clientes.
o Motivos de contato entre cliente e organização fornecedora
•
Ele consegue lucros baixos:
Se o impacto do produto fornecido não tiver muita significação, o interesse pela
operação entre clientes e fornecedores fica comprometido. Este contexto pode representar
ameaças para os interesses da organização fornecedora. Neste sentido, monitorar fatores
paralelos ao objeto da negociação é uma das formas de se estabelecerem barreiras para
favorecer a permanência do cliente na carteira da organização fornecedora.
o Grau de satisfação do cliente.
o Conhecimento dos planos estratégicos em execução pelo cliente
o Conhecimento dos objetivos da organização cliente
o Perceber a intenção do cliente, através das comunicações e dos produtos que o
mesmo adquire na organização fornecedora.
•
Possibilidade de integração para trás.
O avanço da tecnologia proporciona mudanças no perfil de produtos e serviços, as
quais podem gerar o total desinteresse pelo fornecimento de determinados elementos que
passam a integrar processos anteriores ou são substituídos por módulos mais completos que
incorporam funções. Neste sentido, estar atento às necessidades dos clientes e às tendências
tecnológicas representa um fator a ser focado pelos gestores da estratégia de competitividade.
o Comportamento da tecnologia inerente ao produto.
95
o Necessidades do mercado.
o Surgimento de novos produtos.
o Consultas feitas pelos clientes.
o Ofertas feitas pelos fornecedores.
o Temas presentes em conclaves científicos
o Linha de fomento à pesquisa.
•
O produto da indústria não é importante para a qualidade dos produtos ou serviços
do comprador.
A contribuição a ser dada pelo produto a ser fornecido pode ser um fator que garanta a
consolidação de negócios duradouros. Neste sentido, perceber o impacto do produto fornecido
no negócio do cliente deve ser um fator a ser considerado como elemento de competitividade.
o Considerações feitas pelo cliente quanto aos produtos recebidos
o Mudança do comportamento do cliente frente a não conformidades ou a
mudanças efetuadas nos produtos
o Relação de reclamação e nível de distorção apresentado pelo produto em
termos de prazo de entrega, qualidade ou preço.
•
Acesso à informação.
Monitorar o interesse do cliente pelo produto ou serviço em nível de informações
permite monitorar fatores que têm importância para o cliente e que podem ser explorados ou
melhor controlados pelos fornecedores. Neste sentido, estudar e estabelecer estratégias para
disponibilizar ou receber informações de serviços e produtos pode se constituir em um
elemento de relevância na ação estratégica de competitividade a ser implementada.
o Interesse do cliente por tecnologias relacionadas com o produto dele.
o Temas sob o enfoque de produtos e serviços presentes na comunicação
exercida com a organização.
o Comportamento do cliente com relação a variações de características de
parâmetros de entrega, preço, prazo, qualidade, etc.
96
4.1.2 Passo 2
Construído um conjunto de questões e perguntas com a execução do que é indicado na
metodologia, realizado no passo 1, inicia-se pesquisa para ver a possibilidade de reuso de
ontologias já existentes na organização, ou presentes em servidores de ontologia na Web. Para
tanto, a organização deve manter documentação das ontologias para permitir o acesso a
projetos anteriores, ou referências a projetos já desenvolvidos que possam oferecer subsídios
para que se inicie de um ponto a frente, em relação à posição em que a organização está. O
site http://www.cs.utexas.edu/users/mfkb/related.html apresenta um cadastro de projetos de
ontologias existentes no mundo. Ele pode ser a base para uma pesquisa externa à organização.
A questão que deve guiar esta etapa do processo é a necessidade de identificação, em nível
interno ou externo á organização, das ontologias existentes que atendem parcial ou totalmente
as necessidades em questão.
Para este caso, considera-se o apresentado no Anexo I – que contém uma listagem dos
projetos que envolvem ontologias, pesquisados pelo autor em sites. Nenhum deles apresenta
projeto que possa atender aos quesitos desta pesquisa. Sendo assim, é necessário desenvolvêla sem poder aproveitar parcial ou totalmente um projeto existente.
4.1.3 Passo 3
Enumerar importantes condições da ontologia.
Nesta etapa do processo, é importante listar as condições que se gostaria de declarar
para alguém que estivesse no papel da ontologia a ser projetada. Questões como:
A respeito de quais condições se gostaria de dizer algo?
Que propriedade essas condições devem ter?
O que se quer dizer a respeito destas condições?
Neste sentido, apresenta-se a lista das condições importantes a serem consideradas
pela ontologia a ser projetada:
•
Atuar em informações não estruturadas;
•
Identificar questões relacionadas com o referencial teórico, listadas no passo 1,
dentre os quais destacam-se:
o Identificação de clientes, concorrentes, concorrentes entrantes, produtos,
fornecedores e produtos substitutos;
97
o Identificar tipos de documentos segundo classificação estabelecida;
o Identificar temas presentes nos documentos;
o Identificar origem e destino das informações não estruturadas;
o Identificar características de produtos;
o Identificar necessidades dos clientes;
o Identificar a freqüência de comunicação de clientes;
o Estabelecer nível de clientes;
o Identificar ações de concorrentes;
o Identificar a presença de produtos substitutos;
o Determinar a reação de clientes frente à variação de padrões de fornecimento;
o Estabelecer associação de produtos ou serviços, clientes e/ou fornecedores;
o Identificar o volume de clientes por produto fornecido.
Como já mencionado, a construção da ontologia tem caráter iterativo. Assim, outras
condições poderão surgir durante o desenvolvimento do projeto, em função do
aperfeiçoamento gerado pela iteratividade. Portanto, a relação acima não pretende ser
completa, mas sim uma primeira visão das questões que devem envolver o projeto.
Em função da dimensão da ontologia e do objetivo da tese, dar-se-á mais atenção às
questões relacionadas às dimensões do cliente. Procurar-se-á atender de forma mais completa
este aspecto da ontologia. Sendo assim, relacionam-se abaixo as condições relevantes para
esta dimensão competitiva, considerando os enfoques presentes nesta etapa, propostos pela
metodologia, a saber:
A respeito de quais as condições se gostaria de dizer algo?
Deve-se controlar os documentos contendo informações de clientes.
Não deve passar despercebido nenhum documento com referências a clientes.
Deverão ser identificados documentos com conteúdos que impliquem ameaça à
estratégia de competitividade sob o enfoque de clientes.
A direção da organização deverá saber se documentos contendo nomes de clientes de
níveis determinados contiverem temas que comprometam a estratégia de competitividade da
organização.
Deve-se ter condições de identificar documentos por clientes, documentos por temas,
tipos de documentos por clientes e tipos de documentos por tema.
A estratégia de competitividade deverá ser referência para estabelecer identificação e
seleção de documentos.
98
O processo de marcação deverá ocorrer por pessoal não especializado, que desconheça
a estratégia de competitividade e o procedimento de seleção de documentos.
•
Que propriedades estas condições devem ter?
o Os clientes deverão estar classificados por níveis;
o Deve ser possível identificar clientes e classificá-los por níveis;
o As correspondências devem poder ser identificadas por temas, por tipos, por
remetentes e por destinatário;
•
O que se quer dizer a respeito destas condições?
o Toda informação não estruturada deverá ser marcada e sofrer identificação;
o Todo documento com tema reclamação deverá ser identificado e separado;
o Todo documento com tema reclamação e com cliente nível “A” deverá ser
identificado e separado;
o Sempre que houver um documento com remetente do nível “A” com tema
classificado como Reclamação, este deverá ser identificado e sua ocorrência
ser notificada para o diretor ou responsável, ao qual está delegada o controle
do processo de gestão da estratégia de competitividade.
4.1.4 Passo 4
Definição das classes e das hierarquias das classes.
Inicia-se a definição das classes com uma ampla identificação dos conceitos que
integram esta parte do domínio do conhecimento.
Neste sentido, como se está referindo à comunicação entre a empresa e o cliente, mais
especificamente aos documentos emitidos pelos clientes, nota-se que todos os documentos
têm os seguintes conceitos envolvidos:
•
Todo documento é de um determinado tipo;
•
Todo documento tem um remetente;
•
Todo documento tem um destinatário;
•
Todo documento tem um tipo de tema;
•
Todo destinatário tem um tipo de classificação;
•
Todo remetente tem um nível de classificação no qual se enquadra;
99
Outros conceitos podem ser identificados posteriormente e agregados à ontologia.
Como já frisado anteriormente, o processo de construção de uma ontologia é interativo e, a
cada iteração, novas modificações irão aperfeiçoando a ontologia. Neste sentido, temos uma
primeira relação de propriedades que deverão ser modificadas, reduzidas ou ampliadas para
melhor atender o objetivo da ontologia, que é o de fornecer uma visão do domínio do
conhecimento que representa, a qual se seja possível de ser compartilhada.
Com base no acima apresentado, temos o seguinte conjunto de conceitos a serem
considerados:
•
Remetente;
•
Destinatário;
•
Tema;
•
Tipo de documento;
•
Clientes.
As definições das propriedades devem levar em consideração a relação entre os
conceitos.
4.1.5 Passo 5
Para estabelecer a associação entre as classes acima definidas, apresenta-se a seguinte
relação de propriedades:
•
temNome;
•
é de Um.
Considerando as classes e as propriedades acima definidas, pode-se construir as
seguintes sentenças:
•
Documento tem Um Tema;
•
Tema é de Um Documento;
•
Documento tem Um Destinatário;
•
Destinatário é de Um Documento;
•
Documento tem Um Cliente;
•
Cliente é de Um Documento;
•
Nível tem Um Cliente;
•
Cliente é de Um Nível;
100
•
Documento tem Um Tipo;
•
Tipo é de Um Documento.
4.1.6 Passo 6
Definição das facetas dos slots
A definição dos slots ou facetas considera uma classificação que estabelece a relação
entre o domínio e a imagem dessa taxonomia. Os tipos de classificação são:
•
Object property: Um Object property liga indivíduos.
•
Datatype: Um Datatype property liga um indivíduo a um literal.
•
Annotation property: Um Annotation property liga classes a um literal ou string.
Considerando esta classificação, definem-se os slots como segue:
•
Documento:
Data;
Tipo;
Tema;
Remetente;
Destinatário.
•
Tipo:
Carta;
Memorando;
E-mail;
Certificado;
Relatório;
Parecer;
Lei;
Manual;
Declaração;
Certidão.
101
•
Tema:
Elogio;
Reclamação;
Esclarecimento;
Homenagem;
Recordação;
Reiteração;
Ratificação;
Retificação;
Convite;
Recusa;
Proposição;
Contestação;
Informação;
Consulta.
•
Remetente:
Nível A;
Nível B;
Nível C.
•
Destinatário:
Nível A;
Nível B;
Nível C
4.1.7 Passo 7
Criação das instâncias.
Este processo envolve o preenchimento das propriedades acima definidas. Em muitos
casos, a operação se dá em nível de dados. Sendo assim, esta etapa será desenvolvida
diretamente no software utilizado para implementar a ontologia.
Para exemplificar, apresenta-se um elemento da ontologia.
102
Ocorrência:
Um documento tipo carta, com uma reclamação, enviado pela Alfa, que é um cliente
Classe A, para o departamento de vendas.
Super-classe
Classe
Slot
Instância
Tipo Slot
Documento
Tipo
documentoTipo
“Carta”
Datatype
Documento
Tema
temaTipo
“Reclamação”
Datatype
Documento
Remetente
remetenteNome
“Alfa”
Datatype
Documento
Destinatário
destinatárioNome
“Vendas”
Datatype
Documento
Nível
classeNivel
“A”
Datatype
Figura 4.3: Relação entre os elementos da ontologia
4.2 CONSTRUÇÃO DO ESBOÇO DA ONTOLOGIA
Percorrida as etapas definidas na metodologia, deve-se construir um esboço da
ontologia, para favorecer a compreensão da mesma. Para maior clareza, apresenta-se o
esquema da ontologia em três níveis de abstração.
O nível 0 considera as cinco forças competitivas e a relação delas entre si. O nível 1
considera cada força com suas subclasses e o relacionamento entre elas. O nível 2, considera
cada subclasse e as propriedades que ligam as instâncias pertencentes a ela.
103
4.2.1 Nível 0
Visão macro do escopo que envolve a ontologia.
Concorrentes
entrantes
temNegociação
temAmeaça éAmeaça
temNegociação
Clientes
Fornecedores
Concorrentes na
Industria
éNegociação
éNegociação
Competição
éAmeaça
temAmeaça
Produtos Substitutos
Figura 4.4: Visão macro do escopo que envolve a ontologia
Descrição dos elementos:
a) Concorrentes entrantes em potencial:
Este aspecto refere-se à entrada de novas empresas no mercado e às estratégias para
impedir essas entradas.
b) Concorrentes presentes no mercado:
Este aspecto refere-se à presença dos concorrentes que disputam com a organização as
fatias de mercado.
c) Produtos substitutos:
Este aspecto refere-se aos produtos similares que podem ocupar o espaço de um
produto existente.
104
d) Fornecedores:
Este aspecto se refere ao poder de negociação de fornecedores em relação a qualidade,
elevação de preços ou outros fatores que possam comprometer o equilíbrio ou as condições de
operações desejáveis para os negócios da organização.
e) Clientes:
Este aspecto contempla as questões oriundas no cliente que podem estabelecer focos
para o desenvolvimento de barreiras que impeçam a entrada de novos concorrentes, a opção
por novos produtos ou a evasão de clientes da carteira da organização.
4.2.2 Nível 1
Visão de cada força competitiva que envolve a ontologia
Entrantes em potencial
Fornecedor
temCliente
Clientes
temFornecedor
éCliente
éFornecedor
Entrantes em
temProduto
Potencial
Produtos
éNome
temNome
Similares
Nome
éProduto
é
temContato
Contato
Figura 4.5: Classes e propriedades de Entrantes em Potencial
105
Concorrentes
Fornecedor
temCliente
Clientes
temFornecedor
éCliente
éFornecedor
Concorrentes
temProduto
éNome
temNome
Produtos
Nome
éProduto
éContato
temContato
Contato
Figura 4.6: Classes e propriedades de Concorrentes
Produtos Substitutos
Fornecedor
temCliente
Clientes
temFornecedor
éCliente
temProduto
éFornecedor
Produtos
Similares
Produtos
Ameaçados
éNome
temNome
Nome
éProduto
éFicha
temFicha
Ficha
Técnica
Figura 4.7: Classes e propriedades de Produtos Substitutos
106
Fornecedores
Insumos
de
Fornecedores
temCliente
Meus
Concorrentes
temInsumo
éCliente
éInsumo
Fornecedores
temProduto
Produtos
dos
Insumos
éNome
temNome
Nome
éProduto
éContato
temContato
Contato
Figura 4.8: Classes e propriedades de Fornecedor
Clientes:
Fornecedor
temSimilar
éFornecedor
Produto
Similar
temFornecedor
Comunicação
éSimilar
temComunicação
Clientes
temProduto
éComunicação
éNome
temNome
Produto
Nome
éProduto
éContato
temContato
Contato
Figura 4.9: Classes e propriedades de Clientes
107
4.2.3 Nível 2
Este nível compreende o aprofundamento em cada elemento constante do nível
anterior. Por questão de escopo do projeto, apresenta-se o desdobramento da dimensão
Cliente. Considere-se que, para o caso Cliente, um aspecto a ser monitorado é a manifestação
deste em relação a qualquer aspecto que diga respeito à imagem que a organização está
formando
perante
ele.
Neste
sentido,
estabelecer-se-á
monitoramento
sobre
as
correspondências que chegam à organização oriundas de clientes. Este monitoramento terá
como objetivo identificar as que tiverem como tema Reclamação e como nível de cliente os
integrantes da classe “A”. Objetiva-se identificar o Cliente, o nome do arquivo que contém o
documento, o tipo de documento, bem como o departamento da empresa a que foi
endereçado.
Comunicação
ClasseB
temClasse
ClasseA
éClasse
temTema
éDestinatario
Nome_do_arquivo
éNome
temClasse
temClasse
Tema
temNome
Destinatário
temDestinatari
Comunicação
temTipo
Data
temData
ClasseC
temRemetente
éRemetente
éData
Remetente
temClasse
temClasse
temClasse
ClasseA
ClasseB
ClasseC
Figura 4.10: Classes e propriedades de Comunicação
Tipo
108
Para a representação computacional da ontologia, utilizar-se-á um editor de ontologias.
Existem vários tipos já mencionados. Neste projeto de pesquisa, utiliza-se o Protégé. A
escolha se deu em função de ser o mais difundido no grupo de pesquisa do qual o autor faz
parte. Este software é um projeto desenvolvido com a colaboração de várias comunidades
científicas do mundo. Sua base é a Universidade de Stanford. Maiores informações estão
disponíveis no site http://protege.stanford.edu/plugins/owl/ .
4.3 DESENVOLVIMENTO DA ONTOLOGIA NO AMBIENTE PROTÉGÉ
Para o desenvolvimento da ontologia, adotou-se a estratégia de avançar na
implantação por versões. A cada etapa vencida, fazia-se uma verificação e assim os erros e
falhas eram detectados por camada, facilitando a localização e correção. Optou-se por não dar
o passo seguinte sem que o anterior estivesse consolidado. Para o trabalho em questão, este
procedimento auxiliar foi de grande valia, muito embora de difícil execução, em função da
dinâmica que assume o processo.
Considerando o apresentado pelas metodologias de construção de ontologias, o
processo é interativo e não há um único caminho correto para o desenvolvimento do trabalho.
Isto é percebido quando se implanta o modelo no ambiente computacional. Nesse momento, é
necessário criar estruturas auxiliares ou alterar o planejado para atingir o objetivo do
desenvolvimento da ontologia e manter-se no escopo.
109
A Fig. 4.11 representa o discurso do domínio modelado para a teoria das Cinco Forças
Competitivas de Porter.
Concorrentes
entrantes
temNegociação
temAmeaça éAmeaça
temNegociação
Clientes
Fornecedores
Concorrentes
na Industria
éNegociação
éNegociação
Competição
temAmeaça
éAmeaça
Produtos
Substitutos
Figura 4.11: Discurso do domínio modelado para a teoria das Cinco Forças Competitivas de Porter
110
Nas figuras 4.12 a 4.22, vêem-se algumas das principais telas editor de ontologias
Protégé.
Figura 4.12: Classes representando os elementos do referencial teórico
111
Figura 4.13: Propriedades da ontologia
Figura 4.14: Elementos constitutivos da ontologia, representando os dados referentes às forças que
integram o ambiente de competitividade de Porter
112
Figura 4.15: Modelagem da força competitiva Cliente
Figura 4.16: Representação da força Entrantes em potencial
113
Figura 4.17: Força competitiva Fornecedores
114
Figura 4.18: Produtos substitutos em potencial
115
Figura 4.19: Querie elaborada para testar o funcionamento da ontologia.
116
Figura 4.20: Resultado da avaliação do teste de consistência entre a ontologia proposta e a ontologia
inferida pelo aplicativo
117
Figura 4.21: Resultado do teste de inconsistência da ontologia
118
Figura 4.22: Esquema percebido pelo ambiente da construção da ontologia
Após esta etapa, verificou-se a antologia quanto a inconsistências e realizaram-se
ajustes para atender as premissas inerentes à etapa. Passou-se então à implantação de outros
conceitos referentes ao modelo em questão.
Um fator a observar quando se está implantando o modelo referencial, é que o
incremento de um recurso, classe ou propriedade atende um ou mais fatores do modelo
referencial.
O projeto foi executado em cinco versões, em função da implantação de propriedades
e classes. A cada versão se implantava uma nova classe e novas propriedades. O critério para
o estabelecimento de cada versão se baseava no grau de complexidade da etapa a vencer.
Para representar a ontologia, foram definidos três níveis, 0, 1 e 2. Em cada um deles,
um nível de abrangência foi atingido.
Abaixo, apresenta-se a versão final da ontologia, após a edição e construção de três
fases intermediárias, constantes do Anexo III.
119
4.4 VERSÃO FINAL DA ONTOLOGIA
A seqüência de telas apresentadas nas Fig. 4.23 a 4.33 contempla os elementos da
ontologia em questão.
Figura 4.23: As classes da atual fase da ontologia
120
Figura 4.24: Classe Cliente nível A
121
Figura 4.25: Classe Cliente nível B
122
Figura 4.26: Classe Concorrentes na Indústria
123
A classe Documento, apresentada na figura abaixo, não pertence ao nível 0 no plano
de representação esquemática, porém foi desenvolvida para fins de validação do modelo, já
que a premissa a ser atendida por esta fase da pesquisa está baseada na necessidade de
monitorar o relacionamento da empresa com seus clientes através das correspondências
enviadas por eles.
Figura 4.27: Classe documentos
124
Figura 4.28: Entrantes em potencial
125
Figura 4.29: Classe Fornecedores e algumas instâncias
126
A figura abaixo apresenta a classe Produtos atuais. Incluiu-se esta classe na fase atual
do projeto para estabelecer relação com os clientes e com os produtos substitutos. A relação
entre os clientes é que os produtos atuais são os fatores que ligam os clientes às empresas
participantes da indústria, e os produtos substitutos o são na medida em que se considera que
há produtos a serem substituídos.
Figura 4.30: Classe Produtos atuais
127
Figura 4.31: Classe Produtos substitutos
128
A figura abaixo apresenta versão atual da classe Tema dos documentos. Esta classe
permite a seleção de documentos por tema. Um dos temas a serem considerados é
Reclamação. É possível inserir um número indefinido temas e controlar documentos não
estruturados a partir deles.
Figura 4.32: Classe Tema dos documentos
129
A classe Tipo de documento, mostrada na figura abaixo, está vinculada aos
documentos que a empresa recebe. Através dela, pode-se identificar quando chega um e-mail,
um relatório, um parecer, uma carta, um convite, entre outros.
Figura 4.33: Classe Tipo de documento
As telas seguintes apresentam as propriedades definidas nesta ontologia. Cada
propriedade apresenta um conjunto de atributos que permitem que se dê consistência e se
estabeleça relação entre as classes.
Através das propriedades, pode-se fazer perguntas para a ontologia, bem como definir
restrições.
As propriedades apresentadas relacionam classes entre si. Sendo assim são
classificadas como object property (HORRIDGE 2004).
130
4.4.1 Propriedades da ontologia projetada
4.4.1.1 Propriedade “é ameaça entrante”
Nesta tela, pode-se perceber o domínio e a imagem vinculadas à propriedade. Pode-se
perceber também a utilização de propriedade inversa. Através dela, consegue-se inverter o
sentido de pesquisa ou pergunta para a ontologia.
Figura 4.34: Propriedade “é ameaça entrante”
131
4.4.1.2 Propriedade “é cliente remetente”
Esta propriedade está vinculada ao documento, e a tela apresenta as classes de domínio
e de imagem para esta propriedade.
Figura 4.35: Propriedade “é cliente remetente”
132
4.4.1.3 Propriedade “é fornecedor atual”
Esta propriedade relaciona os produtos produzidos pelos participantes da indústria
com os fornecedores dos insumos destes produtos. Quando um comportamento destes
fornecedores se altera, os participantes da indústrias deverão saber quais produtos que eles
produzem poderão ser afetados.
Figura 4.36: Propriedade “é fornecedor atual”
133
4.4.1.4 Propriedade “é negociação com cliente”
Esta propriedade relaciona os clientes com os participantes da indústria. Estes
participantes da indústria concorrem entre si e são as empresas que disputam neste ambiente
de competitividade clientes e fatias de mercado.
Figura 4.37: Propriedade “é negociação com o cliente”
134
4.4.1.5 Propriedade “é negociação com fornecedor”
Esta propriedade relaciona o participante da indústria com o fornecedor dos insumos
para os produtos que ele oferece aos clientes.
Figura 4.38: Propriedade “é negociação com fornecedor”
135
4.4.1.6 Representação da propriedade “é produção atual”
Esta propriedade relaciona o participante da indústria com o produto que ele produz. O
cliente compra dele este produto, e ele, o produtor, necessita estar atendo aos produtos
substitutos que o são para os produtos que ele fornece aos clientes.
Figura 4.39: Propriedade “é produção atual”
136
4.4.1.7 Propriedade “é produto atual”
Esta propriedade relaciona o cliente ao produto fornecido pelos participantes da
indústria em questão.
Figura 4.40: Propriedade “é produto atual”
4.4.1.8 Propriedade “é produto similar”
A propriedade “é produto similar”, representada na Fig. 4.41, apresenta a relação entre
os produtos atuais, fornecidos pelos participantes na indústria e os produtos substitutos, que
representam ameaça. O enfoque desta propriedade é o de identificar que clientes podem trocar
de produto. A similaridade é com os produtos atualmente fornecidos pelos participantes da
indústria aos clientes. O cliente compra produtos, e estes têm outros que são similares.
137
Através desta propriedade, pode-se identificar os clientes alvo para os produtos substitutos
identificados.
Figura 4.41: Propriedade “é produto similar”
138
4.4.1.9 Propriedade “é produto substituto”
A propriedade “é produto substituto”, representada a seguir, relaciona os produtos
produzidos pelos participantes da indústria com os que podem substituí-los. A relação nesta
propriedade é apenas entre produto atual e produto substituto.
Figura 4.42: Propriedade “é produto substituto”
139
4.4.1.10 Propriedade “é tipo documento”
Esta propriedade relaciona o documento com um tipo classificado. Com ela, pode-se
dizer quantas cartas chegaram na empresa, que tipo de documento mais chega na organização,
quantos relatórios, e-mails, pareceres, manuais, etc. chegaram na empresa. Através desta
propriedade, o modelo pode dizer que chegou uma carta e que ela tem reclamação de cliente.
Figura 4.43: Propriedade É tipo documento
140
4.4.1.11 Propriedade “é tipo tema documento”
Esta propriedade refere-se ao tipo de tema constante no documento. Para dar suporte à
estratégia de bom relacionamento com clientes, as regras de restrição identificarão temas de
documento que tenham reclamações.
Figura 4.44: Propriedade É tipo tema documento
141
4.4.1.12 Propriedade Tem ameaça entrante
Esta propriedade é a propriedade inversa da “é ameaça entrante”. Permite navegar no
sentido oposto à propriedade da qual ela é a inversa. Utiliza-se este recurso para dar mais
flexibilidade e robustez ao modelo. Dentre outras, a característica desta propriedade é a
inversão das classes domínio e imagem.
Figura 4.45: Propriedade “tem ameaça entrante”
As demais propriedade presentes nestas telas são propriedades inversas, conforme já
mencionado, todas têm uma oposta que permite avaliar sua configuração bem como, os
domínios e as imagens
142
4.4.1.13 Propriedade “tem nome”
Trata-se de uma propriedade diferente das anteriores. Esta propriedade relaciona
classes com seus indivíduos, a quem atribui características tais como nome, data, tipo, status,
etc. Todas as classes mencionadas em domain utilizam esta propriedade.
Figura 4.46: Propriedade “tem nome”
143
4.4.2 Visão esquemática do estágio atual da ontologia
O ambiente de desenvolvimento da ontologia disponibiliza várias ferramentas bastante
úteis para suporte ao projeto de desenvolvimento. A figura 4.47 apresenta uma tela com a
visão esquemática atual da ontologia.
Figura 4.47: Visão esquemática do estágio atual da ontologia
144
5 VALIDAÇÃO DO MODELO
5.1 PROCESSO DE VALIDAÇÃO DO MODELO
Para validar o modelo, resgata-se o problema da pesquisa: Como acessar os dados
presentes em documentos não estruturados de uma organização para dar sustentação a uma
estratégia de competitividade?
O projeto de pesquisa responde a pergunta através do modelo criado. Partindo do
referencial teórico de competitividade apresentado por Porter, modelou-se um domínio,
construiu-se uma estrutura ontológica que representasse o domínio do conhecimento em
questão e fizeram-se perguntas à estrutura, que devolveu respostas coerentes, como se pode
observar.
5.1.1 Situação
A tela da Fig. 4.48 mostra a classe Produto atual, bem como outras classes que com
ela se relacionam, a saber. Produtor do produto atual, Fornecedor para os insumos deste
produto, Cliente e Produto substituto. A tela apresenta também o nome do produto e a ficha
técnica.
Para a pergunta “Que empresa produz o produto atual?”, observa-se que a resposta
pode se dar através de análise visual na tela da ferramenta, o que constitui processo pouco
seguro em função de limitações humanas e de processo.
Com a elaboração de um processo automático de pesquisa à ontologia, através de
queries, pode-se obter a resposta.
145
Figura 4.48: Classe produto atual bem como outras classes que com ela se relacionam
146
A Fig. 4.49 apresenta a tela com pergunta e resposta. Comparando a tela que apresenta
a classe e o conjunto de outras classes e propriedades com que ela se relaciona, tem-se a base
para validar a consistência da resposta dada.
Figura 4.49: Tela de validação da querie
A figura acima mostra o resultado do processamento da querie que pergunta sobre a(s)
empresas que fornece(m) o produto atual.
Todo processo pode ser representado em formatos que permitem aplicar linguagens de
marcação e assim processar o código. Os conceitos que deram suporte à resposta estão
presentes no modelo da ontologia que utilizou o referencial teórico de Porter. Sendo assim,
afirma-se que é possível dotar uma organização de modelo para acessar dados não
estruturados e com ele dar sustentação a um processo de competitividade organizacional.
No Anexo IV, apresenta-se o código em OWL, HTM e RDF do resultado da marcação
dos documentos não estruturados.
Outra questão para a qual o modelo necessita dar suporte é a estratégica de atender
bem ao cliente, ou ter uma ação rápida para os casos em que houver reclamação dos clientes.
147
Para tanto, elaborou-se uma querie que identifica os documentos recebidos pela organização e
identifica os que são de interesse da equipe de estratégia competitiva da organização.
A Fig. 4.50 apresenta os documentos já marcados, bem como a maneira através da
qual a ontologia representa esses dados.
Tela com os indivíduos da classe Documento, bem como as demais relações e
instâncias que o modelo estabelece.
Figura 4.50: Tela com os indivíduos da classe Documento
148
A tela da Fig. 4.51 mostra os clientes e as empresas das quais eles são clientes. A tela
da Fig. 4.52 apresenta as correspondências que contêm reclamação e são dos clientes classe
A.
Figura 4.51: Clientes e as empresas
Observa-se que as caixas das propriedades informam e apresentam a relação entre as
classes e os indivíduos que as integram.
149
Para finalizar a averiguação, apresenta-se a tela com os clientes nível A.
Figura 4.52: Correspondências que contêm reclamação e são dos clientes classe A
150
A Fig. 4.53 apresenta a empresa que produz determinado tipo de produto. Para o caso,
clientes da empresa 3.
Figura 4.53: Empresa que produz determinado tipo de produto para um cliente
151
A Fig. 4.54 apresenta o resultado de processamento de querie chamada Produtos atuais
da empresa 1. Conforme o nome, a querie resgata todos os produtos que a empresa 1 produz.
Figura 4.54: Resultado de processamento de querie chamada Produtos atuais da empresa 1
152
O funcionamento da querie que identifica todos os clientes pode ser visto através da
Fig. 4.55.
Figura 4.55: Funcionamento da querie que identifica todos os clientes
153
A identificação de todos os clientes da classe A, também é uma atividade modelada na
estrutura que fornece este tipo de informação. A figura 4.56 apresenta o resultado da
aplicação desta querie.
Figura 4.56: Identificação de todos os clientes da classe A
Outras queries podem ser executadas, e os resultados ratificam o que se conclui sobre
o resultado do trabalho de pesquisa desenvolvido.
Para finalizar esta etapa de validação. Apresenta-se a querie que identifica e informa
que empresas da classe A enviaram correspondência com reclamação.
154
A Fig. 4.57 apresenta o resultado do processamento de queries identificando os
clientes que enviaram correspondência com reclamação.
Figura 4.57: Queries identificando os clientes que enviaram correspondência com reclamação
5.2 CONCLUSÃO DA VALIDAÇÃO
O processo funciona. Tanto a metodologia para o desenvolvimento do modelo, quanto
os resultados intermediários e agora definitivos demonstram que o modelo é válido e contribui
para acessar documentos não estruturados e assim auxiliar em uma estratégia de
competitividade.
155
6 RESULTADOS, CONTRIBUIÇÕES E CONCLUSÕES
Esta tese ocupou-se do problema de pesquisa “Como acessar os dados presentes em
documentos não estruturados de uma organização para dar sustentação a uma estratégica de
competitividade?“. Para investigá-lo, definiu-se o objetivo geral “desenvolver um modelo
para recuperação de dados não estruturados a partir de um referencial de competitividade
organizacional”, além dos objetivos específicos “modelar um domínio de conhecimento com
base em uma estratégia de competitividade”; “construir uma ontologia para representar o
domínio do conhecimento modelado”; “implementar a ontologia”; “executar testes em nível
conceitual, para validar o modelo desenvolvido”. Obtiveram-se os resultados a seguir:
6.1 RESULTADOS OBTIDOS
Existem muitas formas de fazer acessos a documentos estruturados, semi-estruturados
e não estruturados. Para documentos estruturados, o domínio da tecnologia atingiu um nível
que faz com que a atividade seja trivial. A disponibilidade de soluções é grande, está
difundida e é de fácil acesso.
Com relação a dados semi-estruturados, as linguagens de marcação e toda uma gama
de códigos e algoritmos permitem seu manuseio com relativa facilidade. Com a necessidade
gerada pela Web, as soluções para o manuseio desses tipos de dados estão ao alcance de
todos. Um ponto a destacar neste tipo de ambiente de programação ou de utilização de
aplicativos é a necessidade de se familiarização com orientação a objeto, em um mínimo de
referências conceituais.
Com relação a dados não estruturados exige-se um pouco mais de esforço. As soluções
computacionais existem e estão disponíveis em um grau de disseminação que requer
familiarização com o tema para localizá-las.
A recuperação de dados não estruturados é uma atividade que exige metodologia de
modelagem de domínio para que se possa mapear o dado não estruturado e identificar o
conteúdo do mesmo. Como o formato deste dado está implícito no próprio documento e a
156
identificação do formato do mesmo somente ocorre após uma análise do formato e conteúdo,
é fundamental encontrar uma ferramenta que auxilie no desenvolvimento desse modelo
conceitual.
As ontologias dão a essa tarefa uma dimensão de simplicidade e eficiência. Através da
modelagem do domínio do conhecimento, estabelecendo relações entre as várias propriedades
do ambiente de domínio modelado, pode-se representar o documento de forma a associá-lo a
uma estrutura capaz de ser compreendida por toda uma comunidade.
Com o auxílio das linguagens de marcação e tirando proveito da capacidade que estas
ferramentas de construção de ontologias têm em gerar códigos XML, HTML, RDF e outros, a
utilização de recursos computacionais sobre o resultado deste trabalho torna resolvido o
problema do acesso aos dados não estruturados.
A modelagem do domínio do conhecimento presente no documento não estruturado e
a possibilidade de representar seu conteúdo através de tags de linguagem de marcação elevam
o documento para uma categorização de documento semi-estruturado, e a solução em termos
de tecnologia computacional para o tema é conhecida e amplamente dominada. Sendo assim,
com o modelo apresentado está resolvido o problema de capacitar a organização para acessar
os dados não estruturados.
Um outro aspecto presente no problema de pesquisa a ser encaminhado estava
vinculado à associação do documento não estruturado a uma estratégia de competitividade.
Este aspecto também foi resolvido com a aplicação de ontologias.
As ontologias foram o grande elemento estrutural que, associado aos documentos não
estruturados, possibilitou o aporte de dois elementos significativos para a solução ao problema
da pesquisa. Com a representação do conhecimento através de estruturas ontológicas, ficou
superada a necessidade de indexação do documento, já que, através dos axiomas, das classes,
propriedades e restrições, tornou-se possível o acesso aos documentos devidamente marcados.
A possibilidade de representação de conteúdos semânticos, vinculados a um
referencial teórico de competitividade, resolveu a questão de dar à recuperação dos dados um
método definido por este referencial. Embutidas no método estão as regras de negócio, as
restrições e as taxonomias que favorecem a utilização de critérios para a recuperação de
documentos não estruturados que se enquadrem em determinada situação. Com isso, ficou
resolvido o problema de acessar documentos não estruturados presentes na organização,
segundo um referencial teórico que dê sustentação a uma estratégia de competitividade.
Sem o modelo desenvolvido por esta tese, a solução para a questão de pesquisa
proposta está vinculada a uma grande quantidade de aplicação de recursos computacionais,
157
necessários para dar sustentação a pesados métodos computacionais que fazem o rastreamento
e indexação dos documentos não estruturados da organização, apresentados no capítulo da
revisão da literatura. O volume de recursos computacionais necessários e o grau de
complexidade para disponibilizar a informação desencorajam sua utilização, fazendo com que
os documentos não estruturados fiquem relegados à possibilidade de análises a posteriori,
sujeita ainda as falhas dos sistemas suportados por ações humanas, repetitivas e rotineiras.
Estes sistemas têm-se mostrado ineficientes por rotatividade das pessoas que dão suporte aos
mesmos e pela inerente condição de susceptibilidade a falhas humanas.
Considerando o objetivo geral, o modelo foi desenvolvido e está definido. Ele permite
o atendimento a cinco questões nevrálgicas no que se refere à implantação de processos e ao
envolvimento de metodologias para dar sustentação aos mesmos. As cinco questões são as
seguintes:
6.1.1 Compreensão e compartilhamento do referencial teórico a ser
implementado.
Com a metodologia apresentada no referencial teórico, é possível estabelecer
atividades que permitam compreender o conteúdo do referencial teórico e compartilhar esta
compreensão com os demais membros do conjunto responsável por dar sustentação à
estratégia de competitividade.
6.1.2 Localização do modelo de competitividade à realidade da
organização.
Este aspecto assume grande importância, na medida que toda empresa tem suas
idiossincrasias. Sem considerar este aspecto, corre-se o risco de gerar muitas inconsistências
na implementação das ações que darão suporte à estratégia de competitividade. Desde a
localização de recursos físicos e tecnológicos até o acoplamento dos novos conceitos à cultura
organizacional, muito há que fazer para estabelecer o melhor ajuste possível e assim localizar
(adaptar) o referencial à estratégia de competitividade. A localização estabelece o modus
operandi do processo inerente ao referencial teórico considerado, estabelece políticas, regras
de negócio, rotinas, responsáveis e recursos de tecnologias que deverão ser contemplados para
a sustentação ao processo. O modelo garante esta posição com aplicação de metodologia
estruturada e detalhada no processo.
158
6.1.3 Adequação dos recursos necessários à sustentação do projeto.
Esta etapa fica assegurada com o atendimento aos planos operacionais que derivam da
etapa anterior. Uma grande desafio a ser vencido quando se estabelecem planos de trabalho é
identificar as tarefas e definir prazos e recursos necessários para a sua execução. A
metodologia integrante do modelo construído favorece a execução desta etapa, na medida que
o processo de localização do referencial teórico contempla, necessariamente, a elaboração de
planos operacionais com indicações precisas para o que deve ser feito, quem fará, quando
fará, onde e por que desenvolverá a atividade.
6.1.4 Modelagem do domínio do conhecimento presente no referencial
teórico que dá suporte à estratégia de competitividade.
Este aspecto torna possível o registro e explicitação gráfica da compreensão do
conhecimento contido no referencial teórico, presente na estratégia de competitividade. Esta
etapa descreve os conceitos e os relacionamentos entre eles e permite enunciar axiomas que
nortearão a conduta de cada elemento responsável pela manutenção da estratégia de
competitividade.
6.1.5 Construção da ontologia e disponibilização de ferramentas para
utilização de recursos computacionais na operacionalização do
processo.
Esta etapa consolida a eficiência do modelo, na medida que permite a utilização de
recursos computacionais na operacionalização do modelo. Com o concurso do computador,
estabelece-se velocidade, precisão, invariabilidade de critérios, redução de custos e constância
operacional ao processo.
A utilização do modelo em meio computacional transfere para o computador a
responsabilidade de aplicar inteligência ao processo. Sem o computador, a análise de critério
precisaria ser suportada e desenvolvida por pessoas. Isto implicaria identificar, treinar e
garantir constância e invariabilidade de operação a um ser humano. Ou seja, esta pessoa não
poderia ficar doente, não poderia ter seu ânimo alterado em função de variações ambientais,
tais como temperatura e luminescência, deveria ser imune a mecanismos de rejeição de outras
pessoas ou de atividades, deveria ter critérios inalteráveis para estabelecer avaliações com
159
relação a conteúdos de conhecimento e executar estas atividades, associadas a outras, com a
mesma eficiência.
Estas são algumas das várias questões que, se não atendidas amplamente, põem a
perder todo o processo estabelecido. O computador, municiado pelo conhecimento modelado,
executa as tarefas com discrição, rapidez, constância, invariabilidade e precisão que dão a esta
parte do processo um grau de estabilidade impossível de alcançar com o concurso humano,
por mais treinado e comprometido que seja.
Com relação à construção da ontologia, as tecnologias existentes permitem acesso a
metodologias que favorecem a execução desta tarefa de forma segura e eficiente. O processo é
iterativo e as iterações vão dando precisão e aperfeiçoamento. As ferramentas disponíveis
para a construção das ontologias têm um grau de aperfeiçoamento significativo, dando rapidez
e segurança ao desenvolvimento. E os recursos que estes ambientes disponibilizam permitem
a elaboração de perguntas e o estabelecimento de inferências que dão ao modelo grande
capacidade e flexibilidade.
A possibilidade de traduzir os conceitos e propriedades da ontologia em linguagens
interpretadas por máquinas permite aplicarem-se recursos computacionais e assim
implementar todas as características desejáveis para tornar o resultado da aplicação do modelo
uma resposta ao problema da pesquisa em questão.
Sendo assim, é possível recuperar dados não estruturados para dar sustentação a uma
estratégia de competitividade, e as organizações podem dispor desta solução em função do
baixo custo e pouca complexidade para a implantação da solução construída.
6.2 CONTRIBUIÇÕES
As contribuições que esta tese proporciona estão vinculadas a sete questões assim
identificadas:
6.2.1 Incorporação de tecnologia nas organizações
A execução do modelo traz como conseqüência secundária a incorporação pela
organização de toda uma gama de conhecimento presente no referencial teórico em questão.
A aplicação das primeiras etapas do modelo permite a incorporação, não apenas de referencial
teórico de competitividade, mas também de outros preceitos metodológicos que a empresa
queira internalizar.
160
6.2.2 Gestão de processos
As várias atividades inerentes ao desenvolvimento do modelo, bem como as
metodologias presentes nestas atividades, habilitam a organização a aperfeiçoar a gestão de
seus processos. Inicialmente orientado para a estratégia de competitividade, o modelo pode
ser desmembrado e ser utilizado para a implantação de outras estratégias.
6.2.3 Implantação de estratégia de competitividade
Sendo objeto deste trabalho de pesquisa, a efetiva implantação de uma estratégia de
competitividade é o resultado final da aplicação do modelo construído. As várias etapas do
modelo e as metodologias presentes em cada uma destas fases garantem a implantação do
referencial eleito. O cuidado em estabelecer e compartilhar as compreensões e o conjunto de
atividades suportadas por metodologia estruturada e da fácil aplicação garantem o perfeito
acoplamento do referencial à organização, dando efetividade ao processo de implantação.
6.2.4 Alinhamento estratégico da organização
Com a compreensão e compartilhamento da visão estratégica presente no referencial
teórico que dará sustentação à estratégia de competitividade, a organização passa a contar
com um elemento de acordo semântico fundamental para favorecer o entendimento entre seus
gestores e a definição de balizas para nortear as ações. O comportamento constante e preciso
estabelecido pela utilização de recursos computacionais libera o corpo diretivo envolvido para
desenvolver outras atividades, e o referencial estabelecido, em conjunto com a aplicação do
modelo, favorece a compreensão de aspectos da organização que levam a um melhor
alinhamento estratégico.
6.2.5 Estabelecimento de controle sobre a execução da estratégia
Sendo uma das funções básicas da organização, o estabelecimento de controle sobre os
processos é fundamental para mantê-los e aperfeiçoá-los.
Com a definição clara do escopo do processo, inerente à aplicação do modelo
proposto, a organização dispõe de recursos para estabelecer o controle sobre os processos
inerentes à estratégia de competitividade em questão e pode desdobrar essa habilidade para
161
outras áreas. A participação no processo de implantação do referencial teórico dará ao
integrante do processo habilidades que o capacitarão para estabelecer esta função básica na
administração de qualquer processo organizacional.
6.2.6 Facilidade e baixo custo da implantação da solução
Por envolver atividades e metodologias conhecidas, a aplicação do modelo apresenta
facilidade de execução e baixo custo de operação. O desenvolvimento das atividades iniciais
inerentes ao modelo envolve pessoas e metodologia de domínio da comunidade das
organizações e dos centros de tecnologia em geral. O desenvolvimento da modelagem do
domínio do conhecimento, a construção da ontologia e a implantação em recursos
computacionais seguem um avanço que aponta para a diminuição de custos e a consolidação
de uma estabilidade já presente em grande parte das metodologias e dos ambientes voltados
para esta atividade. Sendo assim, fazendo paralelos com as várias tecnologias existentes para
a implantação de soluções similares, que dêem às organizações condições de desenvolver o
que o problema de pesquisa desta tese apresenta, fica claro que a solução proposta é fácil e de
baixo custo.
6.2.7 Metodologia de análise e solução de problemas inerentes às
questões da organização
Presente no modelo proposto, um conjunto de metodologias para análise e solução do
problema é oferecido nos passos intermediários para a internalização dos preceitos inerentes
ao referencial teórico em questão. As habilidades que serão desenvolvidas pela equipe
participante do projeto dão à organização condições de aplicar esta metodologia para analisar
e resolver outros problemas existentes na organização.
6.2.7 Apropriação de conhecimentos pela organização
Com a modelagem do domínio de conhecimento, a localização e o desenvolvimento
da ontologia, o conhecimento inerente ao referencial teórico fica apropriado pela organização.
Com a implantação de recursos computacionais o conhecimento inerente ao referencial
teórico passa a fazer parte dos processos da organização dando-lhes vida e efetividade, nem
sempre possíveis quando o conhecimento fica ao encargo de pessoas.
162
A execução do projeto desta tese evidenciou a necessidade de mais pesquisa no
desenvolvimento de soluções em nível da habilitação semântica para os processos
computacionais. As características dos dados existentes nas organizações e o nível de
necessidades geradas pela modificação do ambiente onde as organizações estão inseridas
apontam para a premente necessidade de equipá-las para fazer frente aos desafios que as
esperam. Capacitar as organizações para sobreviverem ao embates do dia-a-dia é garantir uma
sociedade mais sólida e justa para todos.
Os dados presentes nos computadores das organizações têm muito a oferecer. Pouca
atenção ainda se dá a esses dados. Percebe-se que o despreparo de dirigentes e a dificuldade
de acesso às tecnologias podem ser dois dos motivos para isso. Este projeto de pesquisa
mostrou como é possível reverter este processo e como é significativo o resultado a que se
pode chegar com a aplicação destas tecnologias aos processos da organização.
163
REFERENCIAL BIBLIOGRÁFICO
ABITEBOUL, S. (1997). Querying Semistructured Data. INTERNACIONAL
CONFERENCE ON DATABASE THEORY, Delphi, Greece.
ABITEBOUL, S., P. BUNEMAN, et al. (2000). Data on the Web: from relations to
Semistructured Data and XML. San Francisco.
ABREU, A. F. (1999). Gestão da Inovação: Uma abordagem orientada à gestão corporativa.
Florianópolis, IGTI/UFSC.
ALVES, R. (2002). A gestão do conhecimento e as tecnologias de informação. 2004.
ARANGO, G. and R. PRIETO-DÍAZ (1994). Domain Analisys Concepts and esearch
Directions. WORKSHOP ON SOFTWARE ARCHITECTURE, Los Angeles, 1994, USC
Center for Software Engineering. Anais...
ATZENI, P., G. MECCA, et al. (1997). Semistructured and Structured Data in the Web:
Going Back and Forth. SIGMOD Record. v.26: p.16-23.
AURELIO, N. D. (1994). Novo Dicionário da Lingua Portuguesa. Rio de Janeiro, Editora
Nova Fronteira.
BONIFACIO, A. S. and C. A. Heuser (2002). Ontologias e Consultas Semânticas: uma
aplicação ao caso Lattes.
CARDOSO, O. R. (1993). Foco da Qualidade Total de Serviços no Conceito do Produto
Ampliado. Departamento de Engenharia de Produção. Florianopolis, Universidde Federal de
Santa Catarina.
CASTRO, P. A. D. (2000). Representação de Conhecimento. 2004.
CHEN, H. (1994). A textual database/knowledge-base coupling approach to creating
computer-supported organizational memory.
CLARK, J. and K. GURY (1998). Innovation and Competitiveness: A review. Techonology
Analysis & Strategic Management. V.10.
CORAL, E. (2002). Modelo de Planejamento Estratégico para a Sustentabilidade Empresarial.
Emgenharia de Produção e Sistemas. Florianópolis, Universidade Federal de Santa Catarina.
164
CORCHO, O., M. FERNÁNDEZ-LÓPEZ, et al. (2001). ontoweb, thechnical roadmap. 2005.
DAVENPORT, T. H. and L. PRUSAK (1998). Conhecimento Empresarial. Como as
Organizaçòes Gerenciam o seu Capital Intelectual. Rio de Janeiro, Campus.
DIEGN, R. (2000). Knowledge Management and the Internet. IEEE Intelligent Systems. v.
15: pp. 14-17.
DRUCKER, P. (2001). O Advento da Nova Organização. In Gestão do Conhecimento, Ed.
Campus.
ECIB (1994). ECIB - Estudo da competitividade da industria brasileira. Campinas - SP, Ed.
Papirus.
FALBO, R. A. and A. C. C. NATALIA (2003). Gerência de Conhecimento em ODE. XVII
Simpósio Brasileiro de Engenharia de Software (SBES'03), Manaus, Brazil, outubro de 2004,
Anais.
FÉRNANDEZ, M., A. GÓMEZ-PÉREZ, et al. (1997). METHONTOLOGY: From
Ontological Art Towards Ontological Engineering. Working Notes. California, Ontological
Engineering, Stanford University.
FERREIRA, A. B. H. (1999). Novo Dicionário da Lingua POrtuguesa. Rio de Janeiro,
Aurélio Buarque de Holanda Ferreira e J.E.M.M. Editores Ltda.
FILHO, P. S. (1999). A Gestão do Conhecimento e a motivaçào nas Organzaçoes. 2005.
FREITAS, F. L. G. (2004). ONTOLOGIAS E A WEB SEMÂNTICA. Santos - S.P. Brasil,
Universidade Católica de Santos.
FREITAS, H. and C. M. KLADIS (1995). O Processo Decisorio: Modelos e Dificuldades.
Revista Decidir ano II. n.08: p. 30 a 34.
FURLAN, J. D., I. M. IVO, et al. (1994). Sistemas de Informações Executivas. São Paulo,
Makron Books.
GOMES.J.S. and J. M. A. SALLES (1999). Controle de Gestão: Uma Abordagem Contextual
e Organizacional. São Paulo, Atlas.
GOMESZ-PERES, A. (1994). "From Knowledge Basead Systemsto Knowledge Sharing
tecnology: Evaluation and Assessment."
GÓMEZ-PÉREZ, A., M. FERNANDEZ, et al. (1996). Tawards a Method to Conceptualize
Domain. WORKSHOP ON ONTOLOGICAL ENGINEERING (ECAI'96, Budapeste, 1996.
GRUBER, T. R. (1995). Toward Principles for The Design of Ontologies used for Knowledge
Sharing. Int. J. Human-Computer Studies. v.43.
165
GUIZZARDI, G. (2000). Uma Abordagem Metodológica de Desenvolvimento para e com
Reuso, Baseada em Ontologias Formais de Domínio. Departamento de Ciência da
Computação, Universidade Federal do Espirito Santo.
GUIZZARDI, G. (2000/4). UMA ABORDAGEM METODOLÓGICA DE
DESENVOLVIMENTO PARA E COM REUSO, BASEADA EM ONTOLOGIAS
FORMAIS DE DOMÍNIO. Departamento de Ciência da Computação, Universidade Federal
do Espirito Santo.
GUIZZARDI, R. S. S., L. AROYO, et al. (2002). Help&Learn: A Peer-to-Peer Architecture
to Support Knowledge Management in Collaborative Learning Communities. 2004.
HERMENEGILDO, J. (2002). Ver titulo da tese dele.
HORRIDGE, M. (2004). A Pratical Guide To Building OWL Ontologies With The ProtégéOWL Plugin.
JADE, N. B. d. (2004). Ontologia, Núcleo Brasileiro de JADE. 2005.
KRAEMER, A., D. W. CARVALHO, et al. (2004). Ontologia. 2005.
LAUS, J., R. A. AZAMBUJA, et al. (2002). Sistema de E-Commerce, gerenciado por um Eis.
2004.
MELLO, R. d. S., C. F. Dorneles, et al. (2000). Dados Semi-Estruturados. XV Brazilian
Database Simposium, João Pessoa, PB, Brazil.
MINTZBERG, H. and J. B. QUINN (2001). O Processo da Estratégia. Porto Alegre,
Bookman.
MIRANDA, M. (1981). Organizações e Metodos. São Paulo, Ed. Atlas.
MONTGOMERY, C. A. and M. E. PORTER (1998). Estratégia: a busca da vantagem
competitiva. Rio de Janeiro, Campus.
MUSEN, M. A. and e. al. (1995). PROTEGE-II: Computer support for development of
intelligent systms from libraries of component. MEDINFO'95 - WORLD CONGRESS ONF
MEDICAL INFORMATICS, 8, Anais.
NATALI, A. C. C. and R. A. FALBO (2003). Infra-Estrutura para Gerência de
Conhecimento. X Sessão de Ferramentas do Simpósio Brasileiro de Engenharia de Software SBES'2003, Manaus - Amazonas, outubro de 2003.
Infra-estrutura para Genhecimento
NOY, N. F. and H. C.D. (1997). The State of Art in Ontology Design: A Survey and
Comparative Reviw. AI Magazine.
NOY, N. F. and D. McGuinness (2005). Ontology Development 101:Guide to Criating Your
First Ontology. 2005.
166
O'BRIEN, A. J. (2001). Sistmas de Informação e as Decisões Gerenciais na Era da Internet.
São Paulo, Saraiva.
OLIVEIRA, D. P. R. (2002). Sistemas de Informações Gerenciais. São Paulo, Editora Atlas.
PECOTCHE (1994). Curso de Iniciação Logosófica. São Paulo, Ed. Logosófica.
PECOTCHE, C. B. G. (1985). Exegese Logosófica. São Paulo, Ed. Logosófica.
PORTER, M. E. (1996). Vantagem competitiva: criando e sustentando um desempenho
superior. Rio de Janeiro, Campus.
PRADO, L. J. (2004). A estratégia por 10 caminhos.
PROTÉGÉ (2004). A Pratical Guide To Building OWL Ontologies With The Protégé-OWL
Plugin.
SACHS, I. (1993). Estratégias de Transição para o Século XXI: Desenvolvimento e meio
ambiente. São Paulo, Studion Nobel, Fundap.
SERAFIM F., P. (1999). A Gestão do Conhecimento e a motivaçào nas Organzaçoes. 2005.
Serrano, A. (2004). Gestão do Conhecimento O novo paradígma das organizações. 2004.
SERRANO, A. and C. FIALHO (2004). A ORGANIZAÇÃO DO CONHECIMENTO. 2004.
USCHOLD, M. and G. M. (1996). ontologies: Principles, methods and applications. The
knowledge Engineering Review. v.11: p.93-136.
VALENTE, A. and J. BREUKER (1996). Toward Principled Core Ontologies. Banff,
Canada, In B.R Gaines and M. Mussen, Proceedings of the KAW-96.
YOGESH, M. (2004). "Integrating Knowledge Management Technologies
in Organizational Business Processes:
Getting Real Time Enterprises to Deliver Real Business Performance." Journal of Knowledge
Management(Knowledge Management and Technology’, Q3).
167
ANEXO I – Listagem de projetos que envolvem ontologias
Endereço 1: http://ksl-web.stanford.edu/kst/ontology-sources.html
O endereço acima está vinculado a universidade de Stanford, base de
operação para grandes projetos na área, apresentado abaixo.
Sites Relevant to Ontologies and Knowledge Sharing
The information on this page is far from complete. Please send suggestions to Richard Fikes.
The information on this page has been collected from a number of sites, all of which are included
here.
Table of Contents
• Specific Projects
• General Resources Pages
• Sources for Implemented Ontologies
Specific Projects
• Knowlege Sharing and Ontology work at Stanford's Knowledge System's Lab including the
o Ontolingua system for distributed collaborative ontology editing and use.
o The How Things Work (HTW) Project.
• The KIF Knowledge Interchange Format standard
• IEEE Standard Upper Ontology (SUO) Working Group
• KQML - Knowledge Query and Manipulation Language
• The ARPA Intelligent Integration of Information I³ project
• The Process Interchange Format (PIF) project.
• The Toronto Enterprise Integration Laboratory
• The Planning Initiative (ARPI)
• The PROTÉGÉ-II Research Project at Stanford.
• The Cyc Project
General Resources Pages
•
•
•
•
Ontology resources collated by Nicola Guarino (Padova, Italy)
Ontology resources collated by Doug Skuce at the University of Ottawa
Knowledge-base Projects collated by Bruce Porter's group at the University of Texas, Austin.
Classification Research Home Page (SIGCR, ASIS)
168
• Knowledge Representation and Reasoning group, collated by Enrico Franconi at IRST, Povo TN,
Italy
• TOP: Ontology resources page maintained by KR&R, Inc.
• Aristotle - A clearinghouse devoted to projects, research, products and services devoted to
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
'automated categorization'.
Untangle - Intelligent information access by providing a deep representation of information using
description logics.
University of Twente, the Ontology Collection homepage
ESPRIT Projects relevant to knowledge sharing and ontologies:
o EuroKnowledge - ESPRIT Project to co-ordinate and encourage standardisation activities in the
area of knowledge technology.
o KACTUS - ESPRIT Project on "modelling Knowledge About Complex Technical systems for
multiple USe"
o KADS-II - ESPRIT Project on "An Advanced and Comprehensive Methodology for Integrated
KBS Development";
o KEML - Knowledge Engineering Methods and Languages, archive and mailing list.
o FERMI - ESPRIT Project on "Formalisation and Experimentation on the Retrieval of
Multimedia Information."
o COMMET and KREST - Components of Expertise Method and Toolkit(Free University of
Brussels)
o TRADE, LCM and TCM - Toolkit for Requirements and Design Engineering (Free University
of Amsterdam)
o Linguistic Geometry - applications to manufacturing, space navigation, robotics, planning,
scheduling, VLSI design and other systems
o SPACENET - European Qualitative Spatial Reasoning Network
Internet Medical Terminology Resources.
o GALEN - Generalised Architecture for Languages, Encyclopaedias and Nomenclatures in
Medicine.
o Unified Medical Language System - (UMLS®).
SHOE - A proposed small extension to HTML which allows HTML authors to annotate their web
documents with formal knowledge-representation semantics.
Language Analysis & Knowledge Engineering (LAKE) Research Group at Ottawa;
SRI Artificial Intelligence Center - Representation and Reasoning Technologies;
o the GKB-Editor: graphical browser/editor for declarative knowledge
Knowledge reuse and ontologies research at Osaka University.
Mizoguchi Lab, Japan - Ontology Engineering
Shelter - an environment for collaborative, team development of large knowledge based systems in
a manner facilitating sharing and reuse.
Sensus - Ontology Creation and Use in the Pangloss project (papers)
The Enterprise Ontology and Project at AIAI, University of Edinburgh
The ThoughtTreasure ontology, as part of the ThoughtTreasure artificial intelligence program/tool
set.
The MIKROKOSMOS Ontology - from the Computing Research Laboratory, New Mexico State
University.
The Moby lexicon project.
The Reuse Center - An Intelligent Distributed Data Base for OO Software Components.
Ontological Foundations of Knowledge Representation - The AI & Robotics Group of LADSEB,
Padua, Italy
The ARPA/Rome Laboratory Planning Initiative (ARPI)Planning Ontology Construction Group
(POCG), growing out of the older Knowledge Representation Specification Language (KRSL)
effort.
The MIT LCSClinical Decision-Making Group Guardian Angel project
The MIT LCSPlanning Ontology Project
The USC ISI SENSUS project
The Edinburgh Plan Ontology Project
169
• ARPA Knowledge Sharing Effort library
• The ThoughtTreasure ontology. This ontology is available under the terms of the GNU General
Public License. It consists of 21,521 concepts and 37,162 assertions and is part of the
ThoughtTreasure artificial intelligence program/tool set, which contains much else besides the
ontology.
• The Mikrokosmos ontology: An in-depth, broad coverage ontology for multilingual Natural
Language Processing
Sources for Implemented Ontologies
• The MIKROKOSMOS Ontology - from the Computing Research Laboratory, New Mexico State
University.
• The Generalized Upper Model 2.0 developed originally to support natural language processing, but
•
•
•
•
•
•
with extended goals towards more general domain modeling.
The Toronto Virtual Enterprise (TOVE) project
Generalized Upper Model - GMD, Darmstadt, Germany
Planning and Reasoning Ontology at MIT;
the Knowledge Representation Specification Language (KRSL);
Planning Ontology Construction Group (POCG);
the Edinburgh Activity/Process/Plan Ontology Project.
Bibliography
There is a growing literature on ontology development and use as distinct from general work in
knowledge representation, knowledge-based systems, and conceptual modelling. As time allows, I will
include references to such work here.
• What is an Ontology? (Gruber)
• Data and Knowledge Engineering (DKE) journal, Elsevier, 1996 special issue on Modelling Parts
and Wholes;
Alessandro Artale, Enrico Franconi, Nicola Guarino and Luca Pazzi: Part-Whole Relations in
Object-Centered Systems: An Overview.
Webmaster
Last modified: Tue Jan 16 2001
170
Endereço 2: http://www.cs.utexas.edu/users/mfkb/related.html
O endereço acima apresenta um catalogo de projetos em ontologia
apresentado abaixo
Some Ongoing KBS/Ontology Projects and Groups
Quick Index: [ A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | VWXYZ]
Also: [ Mailing Lists | On-Line Proceedings ]
If you are working on or know of related work not mentioned here, please email me
([email protected]).
Other useful Ontology and KR collections include:
•
•
•
•
Stuart Russell's AI on the Web
WPI's Webliography (on AI in Design)
John Bateman's Ontology Portal
David Chalmer's Philosophy of Mind bibliography.
Knowledge-Base Projects, Groups, and Related Material
1.1.1
A
• Algernon - (Univ. Texas at Austin). A frame-based knowledge representation language using
access-limited logic for inference. New for 2003: Algernon in Java!
• AOS - The Agricultural Ontology Service. A federated clearinghouse for terms, definitions and
relationships in the agricultural and related domains for use by the agricultural community.
(Kickoff meeting to be held in November 2001).
• ARPI - The DARPA/Rome Laboratory Planning and Scheduling Initiative (now finished).
Research in planning systems. The ontology group (within this) aims to design an ontology to
enable knowledge sharing between the collaborating groups, and ultimately between computer
systems directly.
• AskJeeves - A question-answering Web search engine.
• The Air Traffic Services (aviation) Ontology, part of a larger knowledge management program
by the FAA.
1.1.2
B
• BSR - The Basic Semantic Repository (Developed to support the EDI efforts, is "an internationally
agreed register of multilingual data concepts").
• The BRICO Ontology - combines WordNet, Roget's Thesaurus, and the top-level of the Cyc
ontology (MIT Media Lab).
• WordsEye - a Natural Language Understanding system that converts English text into threedimensional scenes that represent that text.
171
• The Buffalo Ontology Site - Pointers to the philosophy, history, and some computational work in
ontologies.
• BPMO - The Business Process Management Ontology - an integrated information model which
helps to better align IT with business, bringing together business process design, project
management, requirements management, and business performance management (from Jenz &
Partner, GmBH).
1.1.3
C
• Carter - (Postscript paper). A (now defunct) tool for assisting experts in agreeing on what should
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
go into a consensus knowledge base. This paper was eventually published as: Trice A, Davis R,
"Heuristics for reconciling independent knowledge bases", Information Systems Research, 4 (3),
pp262-288, Sept 1993.
Cerebra - A Description Logic reasoner which provides a way for applications to understand each
other. "This may come as a surprise to some other software companies..." (from Network
Inference).
Chimaera - a software system that supports users in creating an maintaining ontologies, in
particular merging multiple ontologies together and diagnosing individual or multiple ontologies
(KSL, Stanford).
CIA World Factbook - a popular resource for building a world-savvy KB.
CKML - Conceptual Knowledge Markup Language. An application of XML and an extension of
OML. (Also see white paper on CKML).
CLASSIC (AT&T Labs, NJ) - a description logic.
CLIPS - A public domain, expert system shell written in C. Also see the (non-public-domain)
successor JESS.
CODE4 - A graphical knowledge-base editor and knowledge management tool, from the
Language Analysis and Knowledge Engineering Lab (LAKE), Univ. Ottawa, Canada.
CommonSense Reasoning - See the Common Sense Problem Page, and Proc 4th Symp on
CommonSense Reasoning. Also see Cyc, OpenMind, and PDKB.
The Common Sense Problem Page - A list of benchmark problems in commonsense reasoning.
CommonKADS - A comprehensive knowledge engineering methodology. See also:
o Free University Brussels - older summary of KADS
o KEML - Knowledge Engineering Methods and Languages. A mailing list and publication
archive which evolved from the KADS project.
o Integral Solutions Ltd - development of AI/KBS tools, including sale and support of the
CommonKADS WorkBench, and involvement in the KACTUS project.
Common Logic (CL) Standard - a new (2003) attempt to define a (ISO) standard language and
semantics for use in Ontology and Knowledge Engineering. Also see earlier work on KIF.
Common Logic Controlled English - a formal language with an English-like syntax (by John
Sowa).
The Component Library (CLib) - a knowledge base of formally represented, general, domainindependent concepts (Univ Texas at Austin), represented in the KM knowledge representation
language.
ConceptNet - A freely available commonsense knowledge base and natural language processing
toolkit, generated automatically from the 700,000 sentences (as of 2004) of the Open Mind
Common Sense Project.
Concept Maps - A graphical notation for organizing and representing knowledge in an informal
way. Also see this introduction to Concept Maps. For some examples, see the IHMC CMap
Tools page (view with Internet Explorer) and the Graphic Organizer Concept Maps page.
Conceptual Dependency - A summary of Roger Schank's conceptual primitives for representing
simple sentences.
Conceptual Grammar (TM) - A hierarchical knowledge base management system (KBMS)
bundled with the VisualText (R) integrated development environment (IDE) and NLP++ (R)
programming language (from Text Analysis International).
172
• Conceptual Graphs - Researchers using Peirce/Sowa's conceptual graphs theory for knowledge
representation. FAQ.
o Online Course in Knowledge Representation using Conceptual Graphs (by Ulrik Petersen,
Univ Aalborg)
o Mailing List and Mailing List Archives
o CG Shorthand - Notes on a Visual Shorthand for Conceptual Graphs (Robert McNally)
o The CG Standard.
o Harry Delugach's Conceptual Structures homepage.
o CGWorld - A workbench for Conceptual Graphs development, from LARFLAST, Univ
Sophia, Bulgaria. (see here for the original announcement).
o CharGer - A CG visual editor, running under a Java VM.
o LINEAR - Mike Wermelinger's pointers to discussions/proposal for the CG linear (text-based)
notation.
o Reasoning and Unification over Conceptual Graphs - book by Dan Corbett, Univ South
Australia.
o Peirce Holdings International - Research and development of CG-based tools.
o Project Peirce - A collaborative project for developing a CG workbench (see also ftp site).
o Prolog+CG - A Prolog implementation of (part of) CGs.
Also (non-computer-related) on Peirce:
o PEIRCE-L - An email discussion forum on Peirce's Philosophy.
o PORT - The Peirce On-line Resource Testbed: a massive effort to make Peirce's 100,000 pages
of hand-written manuscripts available world-wide.
• Contexts - Univ. Maine's collection of pointers.
• Controlled Languages - Rolf Schwitter's collection of pointers.
• CPR - Core Plan Representation. A planning ontology which supports the representation needs of
many different planning systems, designed to facilitate information sharing and the creation of
common planning services.
• CRACK - A description logic with an on-line, Web-based interface (from IRST, Italy).
• CYC - A massive ongoing effort to formalize common-sense knowledge. An open source version
is now available as OpenCyc, including (parts of) the ontology, axioms, inference engine, and
knowledge acquisition tools. Also see the CYC FAQ, and Jorn Barger's collection of Cyc
resources on the Web.
• CycL - the representation language of CYC.
1.1.4
D
• DAML - DARPA Agent Markup Language. A DARPA program to develop a language and tools
•
•
•
•
•
•
•
•
to facilitate the concept of the semantic web.
DAML-S - The DAML Services ontology for specifying Web-based services (e.g., for ecommerce
applications).
The DARPA Knowledge Sharing Effort - See Knowledge Sharing Effort (DARPA).
Description Logics. Also see Enrico Franconi's excellent course and overheads on DLs, and the
DL systems Cerebra, CLASSIC, CRACK. DLP, FaCT, GRAIL, KRIS, LOOM,
PowerLOOM, and RACER. Also see the Description Logic Handbook.
Design Patterns - Repository of reusable, object-oriented programming abstractions.
Dictionaries - Stauffer Library's collection of pointers to on-line dictionaries.
DLML - A Description Logic Markup Language (Jerome Euzenat, INRIA, France)
DLP, a Description Logic System (Bell Labs).
DOLCE - a Descriptive Ontology for Linguistic and Cognitive Engineering, from the Laboratory
for Applied Ontology (LOA), Italy. See here for publications about DOLCE.
173
1.1.5
E
• eMystics.org - the world's first ontology of Vedic wisdom.
• The Enterprise Ontology - a collection of terms and definitions relevant to business enterprises
(AIAI, Edinburgh, UK).
• EPILOG - (Episodic Logic). Len Schubert et al.'s knowledge representation language, for use in
natural language processing.
• Evaluation Methods for Knowledge Engineering - Lots of useful information.
• EXPECT - an environment for developing knowledge-based systems that includes knowledge
acquisition tools to extend and modify KBs (ISI, Los Angeles).
1.1.6
F
• FaCT - An optimized, tableaux-based DL (Ian Horrocks, Manchester, UK)
• F-Logic - A novel formalism that accounts in a clean and declarative fashion for most of the
structural aspects of object-oriented and frame-based languages.
• FLORA - An object-oriented KB language and application development platform. The
programming language supported by FLORA is a dialect of F-logic with numerous extensions,
which include a natural way to do meta-programming in the style of HiLog and logical updates in
the style of Transaction Logic.
• FLORID - A deductive, object-oriented database system employing F-logic as data definition and
query language; FLORID has been extended for handling semistructured data in the context of
Information Integration from the Web.
• FrameNet - "an online lexical resource for English". Contains an extensive, semantic analysis of
verbs and their case-frame representations. Also see (independent project) WordNet.
• Functional Representation and Reasoning Community - Some pointers.
1.1.7
G
• The Gene Ontology (GO) - a controlled vocabulary that can be applied to all organisms even as
knowledge of gene and protein roles in cells is accumulating and changing.
• Generalized Ontological Language (GOL) - see GOL.
• GALEN - Generalized Architecture for Languages, Encyclopedias and Nomenclatures in
•
•
•
•
•
•
Medicine. GALEN is a medical terminology server for supporting the development of clinical
coding schemes, built using the description logic GRAIL.
The Generalized Upper Model -- a linguistically motivated ontology that supports NL processing;
a multilingual outgrowth of the Penman Upper Model.
The Generic Frame Protocol - not a language, but a standardized set of low-level access functions
for frame-based KR systems. GFP has been recently renamed as OKBC (The Open knowledge
Base Connectivity Protocol).
The Generic Knowledge-Base Editor - a graphical KB editor, implemented in Lisp+CLIM, from
SRI. Supports the Generic Frame Protocol.
GOL - General Ontological Language - A formal framework for building and representing
ontologies. GOL provides a library of top-level ontologies which can be used as a framework for
building more specific ontologies. (Univ. Leipzig, Germany).
GRAIL - a Description Logic. Used in the GALEN and TAMBIS projects.
GT - The Generic Task Toolkit. Chandrasekaren et al., Lab for AI Research, Ohio State Univ. A
kit of domain-independent, method-specific, composable tools from which expert systems can be
constructed.
174
1.1.8
H
• Halo - a long-term, knowledge-based research program aimed at developing inference-capable
•
•
•
•
applications which can acquire knowledge directly from domain experts, answer novel questions,
and solve advanced problems in a broad range of scientific disciplines (Vulcan Inc.).
HOMER - An "intelligent agent" integrating many aspects of AI, operating in a (simulated)
microworld for unmanned submarines.
HowNet - An on-line, common-sense KB for multilingual Natural Language Processing. It
contains inter-conceptual relations and inter-attribute relations as connoted in Chinese lexicons and
their English equivalents. (Also see this overview).
HPKB - DARPA's High-Perforance Knowledge Base program, an initiative in constructing largescale, knowledge-based systems. This program finished in 2000, with the follow-up RKF program
now underway.
HTW - The How Things Work project at Stanford; use of a KB and interactive explanation
facilities (through WWW) to assist understand/manage/etc. engineered products.
1.1.9
I
• IBROW3 - An intelligent brokering service for knowledge-component reuse on the world-wide
web (an Esprit project).
• ICOM - A CASE tool for Intelligent Conceptual Modeling (Univ Manchester, UK).. It includes
handling of multiple E-R diagrams, and logical specification verification.
• IEEE Standard Upper Ontology (SUO) Working Group - see Standard Upper Ontology
(SUO) Working Group.
• Ikarus - an experimental, Web-based knowledge management system (from LAKE, Univ Ottawa,
Canada).
• Inference Engines: See Languages and Inference Engines for knowledge representation
• InfoQuilt - A research project that support human-directed knowledge discovery in a multi-
ontology, multi-agent environment.
• Internet Business Logic - Writing and running English business rules with unlimited vocabulary,
using a browser. Automatic generation and execution of SQL. (from Reengineering LLC).
• Internet Medical Terminology Resources
• IRST - Knowledge Representation and Reasoning Group (Povo, Italy)
1.1.10 J
• JESS - Java Expert System Shell. JESS is a rule engine and scripting environment, originally
inspired by the CLIPS expert system shell.
• JOE - Java Ontology Editor (Center for IT, Univ South Carolina). Based on entity-Relation
diagrams. Will read ontologies stored in KIF format.
1.1.11 K
• KA2 - The Knowledge Annotation Initiative by (and of) the Knowledge Acquisition Community:
o The community web portal for accessing this knowledge.
o OntoBroker - the underlying system for ontology-based services.
• KACTUS - An interactive environment for browsing, editing and managing ontologies (Univ
Amsterdam).
• KADS: See CommonKADS.
• KAON - The KArlsruhe ONtology and Semantic Web infrastructure, an open-source ontology
management infrastructure targeted for business applications. It includes a comprehensive tool
suite allowing easy ontology creation and management, as well as building ontology-based
applications.
• KAW - Knowledge Aquisition Mailing List.
175
• Knowledge Acquisition Tools: See EXPECT, Shaken, and additional systems under Ontology
Building Tools.
• KIF - Knowledge Interchange Format: A proposed, logic-based format for exchanging knowledge
•
•
•
•
•
•
•
between computer programs (more details here). Also see the newer effort on the ISO Common
Logic standard.
KM - A frame-based knowledge knowledge representation language used by the Knowledge
Representation Group at Univ Texas at Austin.
The Knowledge Sharing Effort (DARPA) and related work. A large, collaborative project to
research and promote knowledge-base reuse.
o Ontology editor - log in and select the ontology editor to view/create Ontolingua ontologies.
o email archive (email exchanges)
o KIF - Knowledge Interchange Format: A proposed, logic-based format for exchanging
knowledge between computer programs.
o Stanford Ontology Editor - log in and select the ontology editor to view/create Ontolingua
ontologies.
Knowledge Systems Group - Univ Sydney, Australia. Research in belief revision.
KOMET - A text generation system producing connected, natural language texts in multiple
languages. Uses the Generalized Upper Model ontology, a multilingual outgrowth of the Penman
Upper Model.
KRIS - a description logic ( German Research Center for AI, GmbH)
KRSL - Knowledge Representation Specification Language. Part of ARPI (DARPA/Rome
Planning Initiative).
KSL - Stanford's Knowledge Systems Lab; doing extensive, pionering research in knowledge
representation, reuse, and sharing.
1.1.12 L
• Laboratory for Applied Ontology (Italy) - a new (2002) laboratory resulting from the fusion of
two former groups LADSEB-CNR and ITBM-CNR.
• Language Analysis and Knowledge Engineering Lab (LAKE), Univ. Ottawa, Canada.
o CODE4 - A frame-based Knowledge Management system for various applications (especially
•
•
•
•
linguistics/terminology)
o Ikarus - an experimental, Web-based knowledge management system.
o ClearTalk - An English-like, formal language for expressing information.
Languages and Inference Engines for Knowledge Representation:
o For description logic languages, see Description Logics.
o For conceptual graph tools, see Conceptual Graphs.
o For other languages, see Algernon, CycL, EPILOG, F-Logic, KM, and SNePS.
o In addition, the theorem proving/ automated reasoning community have developed numerous
theorem provers operating on representations expressed in standard first-order logic syntax (e.g.,
see here).
LIFE - (Logic, Inheritance, Functions, Equations). A programming language with some powerful
mechanisms for KB construction (no longer supported).
LOOM - a description logic (ISI, CA). Also see its successor PowerLOOM, and Bob
MacGregor's Retrospective on LOOM
o The Ontosaurus - a Web-based interface to LOOM.
o ON9 - The ontology library at the Laboratory for Applied Ontology (Italy), developed using
the ONIONS methodology and implemented in LOOM.
o SHELTER - "SHELTER is intended to offer an environment for collaborative, team
development of large knowledge based systems in a manner facilitating sharing and reuse.".
Uses LOOM as it's underlying representation language.
LSDIS Lab - The Large-Scale Distributed Information Systems Lab (Univ Georgia). Doing
extensive research and education on the Semantic Web.
176
1.1.13 M
• Machine Learning - David Aha's extensive list of researchers.
• Mailing Lists - for various KR topics.
• MADEFAST - an experiment in collaborative engineering over the Internet. Also see the Stanford
KSL page on MADEFAST.
• Medical Terminologies and Ontologies: See
o the Gene Ontology (GO)
o UMLS and MeSH
o Medical Terminology Resources (a collection of pointers).
o Medical Nomenclatures - some searchable, online databases (in French).
o MAOUSSC - a multiaxial, medical representation (in French).
• MeSH - The National Library of Medicine's subject thesaurus, also a principle component
vocabulary of UMLS. Try out the MeSH browser!
• The Meteor Project - researching Semantic Web services and their composition.
• Mikrokosmos - An in-depth, broad coverage ontology for multilingual NLP from the Computing
Research Laboratory, New Mexico State University.
• MindNet - Microsoft's automatically derived, structured KB build using NLP on dictionaries and
the Encarta encyclopedia.
• Mizoguchi Lab - Japan. Some interesting papers and ontologies.
• Moby - A public domain suite of lexical resources (word lists, part-of-speech lists, thesaurus, etc.).
See here for a quick summary.
• Multiple Ontologies - see Ontologies - Dealing with multiple ontologies.
1.1.14 N
• NASA's Thesaurus - covering aerospace (available for a nominal fee).
• Building/using KBs via natural-language processing (NLP) techniques: See START, and
MindNet.
• Notio - a Java class package to provide an implementation-independent interface for manipulating
Conceptual Graphs (Univ Guelph, Canada).
1.1.15 O
• Observer (Ontology Based System Enhanced with Relationships for Vocabulary hEterogeneity
Resolution) - A project dealing with multi-ontology query processing.
• OCML - Operational Conceptual Modeling Language. Used as the modeling language in
•
•
•
•
•
•
•
•
WebOnto.
ODE - The Ontology Design Environment (Univ Madrid, Spain). See here also.
OIL - Ontology Interchange Language. A proposed standard for specifying and exchanging
ontologies, drawing together ideas from Web languages (e.g., XML, RDF), Description Logics,
and frame-based systems.
OilEd - a simple ontology editor for building ontologies using DAML+OIL.
OKBC - The Open Knowledge Base Connectivity Protocol (formerly called GFP, the Generic
Frame Protocol). Not a language, but a standardized set of low-level access functions for framebased KR systems.
OK Station (in French) - The Ontological Knowledge Station, a commercial modeling tool
dedicated to the acquisition, definition and manipulation of knowledge bases and ontologies, based
on the OK ontological model (Univ Savoie, France).
OMCSNet - A semantic network derived from the OpenMind commonsense database, now
superceded by the more recent OpenMind derivative knowledge base ConceptNet.
OML - Ontology Markup Language.
ON9 - The ontology library at the Laboratory for Applied Ontology (Italy), developed using the
ONIONS methodology and implemented in Loom.
177
• ONIONS - a methodology for building a library of generic ontologies, and generating domain
ontologies (the Laboratory for Applied Ontology, Italy).
• OntoBroker - A system using ontologies for both annotating Web documents, and providing
ontology-based answering services. OntoBroker is being used as part of the KA2 initiative
• OntoEdit - An Ontology Engineering Workbench. OntoEdit is a development environment for
design, adaptation and import of knowledge models for application systems.
• ONTOGEO - The Geospatial Ontology Research Group in the National Technical University of
•
•
•
•
•
•
•
Athens. This is a repository for the research and teaching activities of the OntoGeo Group in
Geographic Information Science, addressed primarily to researchers.
Ontolingua - a language and set of tools for ontology development (from Stanford). Includes a
Sharable Ontology Library.
Ontology - Definitions and perspectives
o What is ontology? (from Ontology Works)
The Ontology Page (TOP) identifies world-wide activity aimed at developing formalized
ontologies as the basis for shared and modularly-structured knowledge.
Ontologies: History and Philosophy - See:
o Ontologies (Descriptive and Formal Ontologies) - A collection of bibliographies on leading
ontologists from Nineteenth Century to our days and a discussion of some philosophical
problems related to ontology (by Raul Corazzon).
o The Buffalo Ontology Site
The ANSI Ad Hoc Group on Ontology Standards
Ontologies - examples and collections (also see Thesauri). See
o Air Traffic Services (aviation) Ontology (from the FAA)
o BPMO - The Business Process Management Ontology
o The Component Library (CLib) - A knowledge-base of formally represented, general
concepts.
o CYC (and the derivative PDKB)
o DAML-S The DAML Services ontology.
o DOLCE - a Descriptive Ontology for Linguistic and Cognitive Engineering.
o The Enterprise Ontology (for business enterprises)
o Ontologies for ethology (animal behavior), in particular for the Loggerhead Turtle
o the Gene Ontology (GO)
o FrameNet (lexical reference)
o the Generalized Upper Model (for NLP)
o various medical terminologies
o Mikrokosmos (for NLP)
o MindNet (derived from NLP on dictionaries)
o ON9 (the CNR-ITBM Ontology Library)
o the Ontolingua Ontology Library
o The OpenMind database and the ConceptNet knowledge base derived from it
o PharmGKB - the Pharmacogenetics and Pharmacogenomics Knowledge Base
o PSL (process specification)
o QoS (computers and networks)
o SENSUS (for NLP)
o discussions for an IEEE Standard Upper Ontology
o STEP (for product data exchange)
o SUMO (the Suggested Upper Merged Ontology)
o the Twente Ontology Collection
o VerbNet a semantically rich verb lexicon
o WebKB-2 (a lexically oriented KB, includes a "tidied up" version of WordNet 1.7)
o the Wilkins' ontology (17th century!)
o WordNet (lexical reference)
Ontology Building Tools - For building and managing ontologies. See Michael Denny's survey of
ontology editors (2002), and also the following specific tools:
o Chimaera
178
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
CODE4
EXPECT
the Generic Knowledge-Base Editor
Ikarus
JOE (Java Ontology Editor)
KAON
KACTUS
OilEd
OntoEdit
Ontosaurus
Protege
Sigma
Shaken
Snobase
the Stanford Ontology Editor
SymOntos
WordMap
and additional systems under Knowledge Acquisition Tools.
• Ontology Learning Tools - Automated/assisted techniques for building an ontology. See
o ECAI'2000 Workshop on Ontology Learning (online proceedings)
o IJCAI'2001 Workshop on Ontology Learning (online proceedings)
o The Ontology Learning "community portal" - a nascent (as of July 2001) portal for
information on this topic.
• Ontology Merging Tools - See Chimera and PROMPT. Also see Carter, a tool for helping
experts build a consensus KB.
• Ontologies - Dealing with multiple ontologies - See InfoQuilt, Observer.
• Ontology Works - Ontology Works is a leading source of ontology construction software,
•
•
•
•
•
•
ontology-based database software, and ontology-based information integration software. The
Ontology Works IODE is software designed to produce ontologies - true-to-the-world information
models. These models may be implemented in the Knowledge Server and High-Performance
Knowledge Server. (Also see their page What is ontology?)
OntologyStream Inc. - a Virginia-based company focused on incorporating knowledge science
and technology into eGovernment and intelligence applications.
Ontosaurus - a Web-based interface to LOOM. For a demo, browse the Sensus KB using it.
OntoWeb - Ontology-based information exchange for knowledge management and electronic
commerce. A collaborative network of European researchers and industrials, which aims to
strengthening the European influence on Semantic Web standardisation efforts such as those based
on RDF and XML.
OpenCyc - The open source version of the Cyc technology (including selected parts of the
ontology, axioms, inference engine, and knowledge acquisition tools). Public OpenCyc servers
(as on Dec 2002) are: Thinker, Turing, McCarthy.
The OpenMind Initiative - a collection of projects to develop "intelligent" software. Note in
particular OpenMind CommonSense (below).
OpenMind CommonSense - A new web site for collecting "commonsense" knowledge, as English
sentences, en masse from people on the Web. The database can be downloaded for free. Also, a
semantic network/knowledge base called ConceptNet mined from this corpus is available. (Also
see Push Singh's homepage).
1.1.16 P
• Pangloss and Penman - natural language projects at USC Information Sciences Institute. The
creation and use of large ontologies forms a key component of this research.
179
• Panlingua - A universal theory of linguistic structure (by Chaumant Devin).
• The PARKA Project - a frame-based AI system which claims to scale to extremely large KB
applications (Univ Maryland at College Park).
• PDKB - the Public Domain Knowledge Bank, planned as a public domain, common-sense KB
•
•
•
•
•
•
•
•
based on the Cyc ontology.
PharmGKB - The Pharmacogenetics and Pharmacogenomics Knowledge Base - an integrated
resource about how variation in human genes leads to variation in our response to drugs.
PIF - Process Interchange Format
PowerLOOM - A KL-ONE-style knowledge representation language (the successor of LOOM).
Project Peirce - A collaborative project for developing a CG workbench (see also ftp site).
Prolog+CG - A Prolog implementation of (part of) conceptual graphs.
PROMPT - An interactive ontology merging tool. Part of Protege-2000.
Protege-2000 - An extensible KR tool for constructing ontologies, customizing knowledgeacquisition forms, and entering domain knowledge. (Also see here and here).
PSL - The Process Specification Language Ontology.
1.1.17 Q
• The QoS Ontology - about computers and networks.
• Question-Answering Systems: See Halo (knowledge-based question-answering), START (NLP),
TRAINS and TRIPS (NLP + interactive planning), AskJeeves (Web search), TextMap
(TREC/Web search, ISI), and Webclopedia (NLP and information retrieval).
1.1.18 R
• RACER - an expressive Description Logic, implemented with a highly optimized ABox tableaux
calculus (Univ Hamburg, Germany).
• RDF - Resource Description Framework: A lightweight ontology system to support the exchange
of knowledge on the Semantic Web.
• REMOTE (Request Management fOr Task Execution) - An ontology-based application
providing users of wireless devices with new software applications (developed like web services),
in order to avoid the dependence on the performance of their devices. From the Distributed
Information Systems Group, Univ Zaragoza, Spain.
• RKF - DARPA's new initiative in Rapid Knowledge Formation, developing methods to allow
Subject Matter Experts (SMEs) to construct knowledge bases directly.
• Roget's Thesaurus
o Bibliography on Roget - A bibliography of research using this for natural language processing
(Mario Jarmasz, Univ Ottawa, Canada).
o The 1911 Version online - part of the ARTFL project.
o MICRA's version - A note on the availability of MICRA's modified version of Roget. Also see
Pat Cassidy's call for collaborators in FACTOTUM, an electronic encyclopedic KB project
(starting from Roget).
• RosettaNet - An industry consortium established to create open e-business standards. Includes
establishing standardized terminologies (dictionaries).
1.1.19 S
• SCORE - (Semantic Content Organization and Retrieval Engine), patented technology being
incorporated into a set of comprehensive Semantic Web products offered by Voquette/Semagix.
• The Semantic Business Process Management (SBPM) Working Group - working towards the
mechanization of Business Process Management by using Semantic Web techniques, especially
Semantic Web Services.
• The Semantic Enterprise - (Amit Sheth's graduate course).
180
• The Semantic Web - A vision of having data on the web defined and linked in a way that it can be
used not just for display purposes, but also in various applications by machines. Also see:
TRIPLE, FLORA, Meteor, and work by LSDIS.
KAON
several keynotes on the Semantic Web
Amit Sheth's graduate course on the Semantic Web
WonderWeb - Ontology infrastructure for the Semantic Web.
Two one-minute overviews (posters) on The Semantic Web and RDF vs. XML (from
Semaview).
o RDF
o The Semantic Business Process Management (SBPM) Working Group
SENSUS from ISI, Los Angeles. A large concept taxonomy for natural language processing and
other applications. Click here to browse it using the Ontosaurus browswer.
Shaken - A knowledge acquisition and reasoning tool built by the SRI Team, as part of DARPA's
Rapid Knowledge Formation project. (Contact [email protected] for access to the software
itself).
SHOE - HTML extensions to allow knowledge-representation semantics to be added to Web
pages, using explicit user-defined ontologies. See also its successors OML and CKML.
Sigma Knowledge Engineering Tool - An environment for developing, viewing and debugging
theories in first order logic.
Sisyphys III - Third in a series of experiments begun in 1990 by the KAcq community, to compare
techniques for constructing knowledge-based systems. Also see KAW'98 papers on this experiment
here.
SMDF - The Shared Meanings Design Framework (in a very early stage, as of August 2000). An
HCI-centered methodology for supporting e-commerce developers, by focussing on the semantics
which an interface transmits. Uses SMML (Shared Meanings Markup Language).
SNePS - The Semantic Network Processing System, a knowledge representation and reasoning
system from Univ at Buffalo, NY (also see this overview of the SNePS research group).
SNeRG - The Semantic Net Research Group at Univ. NY at Buffalo.
Snobase - IBM Ontology Management System (also known as SNOBASE, for Semantic Network
Ontology Base) is a framework for loading ontologies from files and via the Internet and for locally
creating, modifying, querying, and storing ontologies.
The IEEE Standard Upper Ontology (SUO) Working Group - working to specify a standardized
upper ontology. Also see SUMO (the Suggested Upper Merged Ontology).
SRS (Software Retrieval Service) - An ontology-based application which allows users to retrieve
and install software in an easy and efficient way. From the Distributed Information Systems Group,
Univ Zaragoza, Spain.
Stanford KSL - Stanford's Knowledge Systems Lab. Doing extensive, pionering research in
knowledge representation, reuse, and sharing.
The START natural language question-answering system (Infolab, MIT). Matches questions with
hand-written annotations on paragraphs. Also see the START HPKB demo.
STEP/PDES - Standard for Exchange of Product Data. A huge, international effort to create an
interlingua for exchanging manufacturing product data. See also STEP Tools, Inc.
SUMO (also see here) - The Suggested Upper Merged Ontology, developed within the IEEE
Standard Upper Ontology (SUO) Working Group. Contains (as of December 2003) about 1000
terms and over 4200 assertions for general ontological concepts such as temporal relations, spatial
relations, activities and roles. Also see:
o Loom 4.0 translation of a subset of the Suggested Upper Merged Ontology.
o SUMO-WordNet2 mappings - All of WordNet's (v2.0) synsets (for nouns, verbs, adjectives,
and adverbs) mapped to SUMO.
o Public ontologies for computers and networks (QoS), and ecommerce (DAML-S) built on
SUMO.
SymOntos (Symbolic Ontology Management System) - a software system that stores and manages
a domain ontology (LEKS, CNR, Italy).
o
o
o
o
o
o
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
181
• Synergy - A language for "executable CGs", allowing representation and simulation of dynamic
processes using CGs.
1.1.20 T
• TAMBIS - (Transparent Access to Multiple Biological Information Sources). TAMBIS is an
•
•
•
•
•
•
•
•
•
integration and retrieval system for bioinformatics resources, using an extensive ontology authored
in the description logic GRAIL (but now moving towards another description logic, FaCT).
TCM - Toolkit for Conceptual Modelling. A collection of software tools to present conceptual
models of software systems in the form of diagrams, tables, trees, and the like.
TGM-I - The Library of Congress's Thesaurus for Graphical Materials.
Thesauri:
o The Web Thesaurus Compendium - Pointers to many thesauri.
o Lexical FreeNet - A browsable Thesaurus, including (unusually) graph searching capabilities.
o Stauffer Library - Pointers to online dictionaries and a few thesauri.
o ISSO 2788 - Some summary notes on the ISO 2788 Standard for Thesaurus Construction.
o Moby - includes a Thesaurus of 30,000 words and 2.5 million synonyms and related words.
And it's public domain!
o Canadian Thesaurus of Construction Science and Technology
o Roget's Thesaurus
o The EuroVoc Thesaurus - a multilingual thesaurus covering the fields in which the European
Community is active.
o NASA's Aerospace Thesaurus
The ThoughtTreasure Project - An AI program for experimenting with AI and natural language
processing. It includes a large ontology of 21,521 concepts and 37,162 assertions.
Topic Maps: A graphical representation of the topics an information set is about, their
interrelationships, and which part of an information set are relevant to which topics.
o What is a Topic Map? - IDEAlliance page.
o InfoLoom - various samples, presentations, FAQs, and pointers.
o ISO/IEC FCD 13250:1999 - The ISO standard for Topic Maps.
The TOVE project and ontologies, from the Enterprise Integration Lab , Univ Toronto.
Trellis - An interactive environment allowing users to add their observations, viewpoints, and
conclusions as they analyze information (ISI). Also see this paper and demo.
TRIPLE - an RDF query, inference, and transformation language for the Semantic Web.
Twente Ontology Collection -- (Univ Twente, Netherlands). On Ceramics, substances, and
engineering design. This page no longer seems to be available.
1.1.21 U
• UMLS - Unified Medical Language System (UMLS) of the National Library of Medicine (NLM).
A collection of around 60 different biomedical vocabularies, unified/aligned into a single
thesaurus, lexicon, and semantic network. Also see MESH, one of UMLS's principle component
vocabularies.
• UT Austin - KBS Group - Work on large-scale, multifunctional knowledge-bases.
1.1.22 VWXYZ
• VerbNet - A semantically rich, class-based verb lexicon (U. Penn).
• Webclopedia - an automated, retrieval-based question-answering system (ISI).
• WebGrid-II A Web-based knowledge elicitation tool, implementing repertory grids, from the
Knowledge Science Institute, Univ Calgary, Canada. (Papers, and also see WebGrid-I).
• WebKB-2 - A large-scale, lexically-oriented (WordNet-like) knowledge-base + Web-based
interface. The WebKB-2 knowledge-base includes a "tidied up" version of WordNet 1.7 (see here
182
•
•
•
•
•
•
for details). The WebKB-2 interface allows users to retrieve, re-use, complement, annotate and be
guided by other users' knowledge.
WebOnto - a Web-based knowledge modeling tool, allowing users to browse and edit knowledge
models over the Web (Knowledge Media Institute, UK). Uses OCML as the underlying
language.
the Wilkins' ontology (for historical interest): A 17th century literary work by Bishop John
Wilkins, presenting a large ontology, a written and spoken language derived from the ontology, and
a dictionary that maps terms in the ontology to English.
WonderTools - for helping select an ontology-building tool (SWI, Univ Amsterdam, Netherlands).
WonderWeb - A European Union-funded project developing ontology infrastructure (ontology
languages, frameworks, ontologies, and other tool support) for the Semantic Web.
WordMap - A commercial taxonomy management system for building and deploying taxonomies
quickly and easily.
WordNet - a large, on-line lexical reference system. Also see:
o Proceedings of WordNet and Other Lexical Resources (a NAACL Workshop on WordNet).
o Proceedings of SemaNet'02 - Building and Using Semantic Networks (a COLING 2002
workshop on WordNet).
o WebKB-2, a "tidied up" WordNet derivative
o (independent project) FrameNet
Mailing Lists
• Conceptual Graphs o Archive (Recent emails)
o Archive (Ancient emails)
o Subscription information
• Evaluation Methods for Knowledge Engineering - mailing list.
• KAW - Knowledge Aquisition Mailing List.
• KAW-PSM - Knowledge Aquisition: Problem-Solving Methods mailing list.
• Knowledge and Information Systems - Journal.
• Mail Archives - for Interlingua, KQML, MADEFAST, Ontolingua, and SRKB.
• onto-std and ontology mailing lists - the former for the ANSI Ad Hoc Group on Ontology
Standards, the latter for general AI discussions on ontologies.
• Subscription Information - for KAW, Conceptual Graphs, KQML, Knowledge Sharing, and
Interlingua.
On-Line Proceedings
• KAW'96 - Proceedings (1996, Banff, Canada).
• Workshop on Problem-Solving Methods for Knowledge-Based Systems (Aug 23, 1997,
Nagoya, Japan) in Connection with IJCAI-97 (Aug 23-29, 1997, Nagoya, Japan).
• ProKSI'97 - workshop report from the 2nd workshop on Product Knowledge Sharing and
Integration.
• "Comparing Description and Frame Logics" - summary of the workshop (Mar 26-27, 1997,
•
•
•
•
•
Karlsruhe, Germany).
IJCAI'97 Workshop on Problem-Solving Methods - proceedings.
KAW'98 - Proceedings (1998, Banff, Canada).
ECAI'98 Workshop on Applications of Ontologies and Problem-Solving Methods
V&V Workshop '98 - The 1998 European Meeting on Validation and Verification of KBSs.
KRDB'98 -- Knowledge Representation and Databases, Proceedings of the 5th Workshop (May
31, 1998, Seattle, WA).
183
• CommonSense'98 - Proc. 4th Symposium on Logical Formalizations of Common Sense
•
•
•
•
•
•
•
•
•
Reasoning.
IJCAI'99 Workshop on Ontologies an Problem-Solving Methods.
IJCAI'99 Workshop on Knowledge Management and Organizational Memories.
KAW'99 - papers from the 1999 workshop.
ECAI'2000 Workshop on Ontology Learning (Aug 22, 2000).
IJCAI'2001 Workshop on Ontology Learning (Aug 4, 2001). Also see the home page for this
workshop.
IJCAI'2001 Workshop on the IEEE Standard Upper Ontology (Aug 6, 2001)
ADL 2001 - Proceedings of the 2001 Workshop on Applications of Description Logics.
Database and Information Systems Research for Semantic Web and Enterprises - NSFOntoWeb Invitational Workshop (Apr 3-5, 2002).
Proceedings of the EKAW'04 Workshop on Core Ontologies in Ontology Engineering (2004)
Maintained by Peter Clark (peter.e.clark@boeing
184
ANEXO II – Utilização de metodologia para
definição de estratégia competitiva
A metodologia a ser apresentada, foi desenvolvida pelo Núcleo de
Desenvolvimento Empresarial. Este núcleo reúne um grupo de pesquisadores,
professores do Centro Federal de Educação Tecnológica de Santa Catarina, e tem
por objetivo realizar pesquisa em nível tecnológico e disponibilizar os resultados para
a comunidade na qual o CEFET-SC está inserido (HERMENEGILDO 2002).
Esta metodologia tem sido utilizada em várias aplicações que requerem a
construção de cenários voltados para ações estratégicas. Ao final da aplicação da
metodologia, pode-se identificar com precisão o conjunto de ações, as variáveis
envolvidas e com isto compor um plano de ação para a conquista de objetivo
previamente definido.
A metodologia consiste em aplicar a visão de processos e, com suporte do
diagrama de causa e efeito apresentado por Ishikawa, definir um conjunto de
atividades a serem executadas para a conquista do objetivo eleito. Na metodologia,
o modelo de Ishikawa é adaptado. Consideram-se os 6 M por ele definidos: Meio
ambiente, Matéria-prima, Máquinas e equipamentos, Metodologia, Medida, Materiais
e insumos, e inclui-se um sétimo M denominado Mercado. Cada M acima citado dá
suporte a um conjunto de ações que têm por meta conquistar um objetivo
determinado. No caso em questão, o objetivo é estabelecido pelo modelo conceitual
eleito para a aplicação do modelo. A figura a seguir representa o diagrama de causa
e efeito no modelo de Ishikawa adaptado.
Modelo de Ishikawa adaptado
Matéria-Prima
Máquinas e eqptos
Medida
Objetivo
Metodologia
Meio-ambiente
Materiais
Mercado
185
186
Dinâmica de aplicação do modelo
Com base no referencial definido no modelo conceitual, identificam-se os
objetivos que devem ser conquistados. Estes objetivos ocupam o lugar de foco no
diagrama de causa e efeito adaptado. O diagrama originalmente é utilizado para
identificar causas para os problemas apontados. No local do problema, coloca-se o
objetivo a ser atingido. Nas extremidades, indicam-se as fontes de origens das
ações a serem encaminhadas para a conquista dos objetivos apontados.
Estas ações listadas são priorizadas. Para tanto, utiliza-se método oriundo da
análise de valor. A grade abaixo apresenta o procedimento.
Este método é integrado por três fases. A primeira é dedicada à valorização
das atividades da lista pelo participante do evento que definiu a lista de atividades a
serem priorizadas. A segunda fase é dedicada a somar os indicadores de
prioridades apresentados por cada participante. A terceira fase é caracterizada pelo
ordenamento da relação de atividade, com base na somatória dos vários índices de
priorização individuais.
Abaixo, apresenta-se modelo ilustrativo.
Suponha-se que três participantes tenham decidido por um determinado M
(método por exemplo) do diagrama de Ishikawa.
Na coluna intitulada “minha priorização”, o participante indica a ordem de
prioridade que ele atribui à realização da atividade apontada. Quanto maior a
prioridade, menor a numeração.
187
Planilha de apontamentos do participante do Participante 1
Objetivo: Objetivo 1 / Origem de ação Método
Numero
Atividade
Minha priorização
1
Atividade A
2
2
Atividade B
1
3
Atividade C
4
4
Atividade E
3
Numero
Atividade
Minha priorização
1
Atividade A
1
2
Atividade B
4
3
Atividade C
2
4
Atividade E
3
188
Numero
Atividade
Minha priorização
1
Atividade A
2
2
Atividade B
3
3
Atividade C
1
4
Atividade E
4
A matriz de consolidação das “minhas priorizações” estará assim construída:
Numero
Atividade
Participante
Participante
Participante
Somatório
1
2
3
dos
Nossa
priorização
participantes
1
Atividade
A
2
1
2
5
1
2
Atividade
B
1
4
3
8
3
3
Atividade
C
4
2
1
7
2
4
Atividade
E
3
3
4
10
4
Com base no conteúdo da coluna de “somatório”, constrói-se o conteúdo da
coluna “nossa priorização”. Considera-se o menor valor de somatório para atribuir a
maior prioridade.
189
Modelo de Pareto
Após este etapa, aplica-se o princípio de Pareto ao modelo. Segundo este
princípio, em uma lista de atividades ordenadas, implantando-se 20% das atividades
da lista, atende-se 80% da totalidade das atividades indicadas.
Desta forma, como a lista está integrada por quatro atividades, 20% delas, é
0,8. Aplicando-se arredondamento conclui-se que atendendo a primeira atividade,
que é a atividade A, atender-se-á 80% das atividades de toda a lista consolidada.

Modelo de recuperación de datos no estructurados para la

Transcrição

Documentos relacionados

Filosofia do Direito

WPUC 2007

Ontologias - ENANCIB - Encontro Nacional de Pesquisa em Ciência

Proposta Filosofia do Direito

Programação do III Seminário de Ontologia

João Paulo Andrade Almeida – Professor associado da

Tesauro conceitual e ontologia de fundamentação - CEUR

Erótica e Ontologia - KBR Editora Digital

Baixar este arquivo PDF

from enacomp.com.br