Modelo de recuperación de datos no estructurados para la
Transcrição
Modelo de recuperación de datos no estructurados para la
UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO TECNOLÓGICO DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO MODELO DE RECUPERAÇÃO DE DADOS NÃO ESTRUTURADOS PARA SUSTENTAÇÃO Á ESTRATÉGIA DE COMPETITIVIDADE ORGANIZACIONAL ANTÔNIO PEREIRA CÂNDIDO FLORIANÓPOLIS, SC 2005 ANTÔNIO PEREIRA CÂNDIDO MODELO DE RECUPERAÇÃO DE DADOS NÃO ESTRUTURADOS PARA SUSTENTAÇÃO Á ESTRATÉGIA DE COMPETITIVIDADE ORGANIZACIONAL Tese apresentada ao Programa de PósGraduação em Engenharia de Produção da Universidade Federal de Santa Catarina, como requisito parcial para obtenção do título de Doutor em Engenharia de Produção. Orientador: Prof. Fernando Álvaro Ostuni Gauthier, Dr. FLORIANÓPOLIS, SC 2005 ANTÔNIO PEREIRA CÂNDIDO MODELO DE RECUPERAÇÃO DE DADOS NÃO ESTRUTURADOS PARA SUSTENTAÇÃO À ESTRATÉGIA DE COMPETITIVIDADE ORGANIZACIONAL Esta tese foi julgada e aprovada para obtenção do título de doutor em Engenharia de Produção no Programa de Pós-Graduação em Engenharia de Produção da Universidade Federal de Santa Catarina. Florianópolis, 29 de julho de 2005. Prof. Edson Pacheco Paladini, Dr. Eng. Coordenador do PPG em Engenharia de Produção BANCA EXAMINADORA: ____________________________________ _______________________________ Prof. Fernando Álvaro Ostuni Gauthier , Dr. Orientador - UFSC Ana Maria Bencciveni Franzoni, Dra. Moderadora: UFSC ___________________________________ __________________________________ Profa. Edis Mafra Lapolli, Dra. Examinadora - UFSC Jorge Luiz Silva Hermenegildo, Dr Examinador Externo – CEFET - SC ___________________________________ Prof. Marco Antônio Neiva Koslosky, Dr. Examinador Externo – CEFET - SC DEDICATÓRIA Dedico este trabalho primeiramente a Deus. Por vezes sinto que Ele, através do meu espírito, me ajuda, instigando-me a conhecer, convidando-me a me completar como ser humano, estimulando-me a fazer de mim uma expressão de Sua criação. Dedico este trabalho também a você, que está percorrendo estas linhas agora. Por algum motivo, estamos agora em contato. Dou esta forma a esta dedicatória para lhe dizer que a vida é fantástica. Através dela podemos realizar muitas coisas. Esta tese exigiu muito de mim. Tive que saber ouvir, refazer, repensar. Tive que aprender a conhecer os meus limites e a pedir ajuda. Aprendi também, a ser ajudado com dignidade, sabendo que a ajuda é parte da vida. Penso que se pude fazer você sentir o quão grato eu sou a todos os que me ajudaram atingi meu objetivo. Há outra coisa ainda: Cultive a gratidão, ela é uma credencial que habilita o ser humano para evoluir. AGRADECIMENTOS Refazendo a trajetória que culminou com a finalização desta tese, sinto-me muito feliz e recompensado. Durante este período pude fazer e consolidar grandes amizades. Foram anos de trabalho e dedicação. Quantos finais de semana, quantas madrugadas... Tenho certeza de que somente pude chegar a este resultado porque fui muito ajudado. Algumas pessoas tiveram participação direta, outras indiretas, porém todas foram fundamentais para a conquista deste objetivo. Inicialmente, gostaria de agradecer a Universidade Federal de Santa Catarina, em especial ao Programa de Pós-Graduação, através do qual pude ampliar meus conhecimentos e adquirir habilidades fundamentais para o melhor exercício de minha profissão. Faço registro especial aos profissionais, funcionários públicos federais, daquele departamento que sempre atuaram com muita eficácia nos encaminhamentos dos temas burocráticos e regimentais. Especial gratidão dedico ao meu orientador, Prof. Dr. Fernando Álvaro Ostuni Gauthier, pelo tempo e dedicação dispensados a este projeto. Foi ele quem teve a idéia do tema da tese. Especial também foi a participação do Prof. Dr. Jorge Luiz Silva Hermenegildo, que muito me ajudou com sua visão e experiência na organização das idéias e como companheiro de pesquisas. Sua paciência e comprometimento foram fundamentais em alguns momentos do projeto. Sou grato também aos colegas do Núcleo de Informática e Sistemas do CEFETSC, em especial aos professores Dr. Marco Antônio Neiva Koslosky e Dr. Hamilcar Boing. Estes professores me estimularam oferecendo aportes para o encaminhamento de questões do trabalho. Deixei para mencionar por último os dois principais fatores de êxito nesta empreitada. O primeiro é minha família, esposa e filhas. Minha esposa foi incansável no atendimento a questões que facilitaram o caminho. Seu amor, sua dedicação e seu exemplo muito me alentaram e me estimularam. Minhas filhas compõem com ela o mais sublime recanto onde por vezes me recolhia e buscar forças para continuar. O Segundo é Deus. Ele me deu a vida, a inteligência e a sublime sensação de existir, que serão a essência viva de tudo o que fiz, faço e farei. RESUMO CÂNDIDO, Antônio Pereira. Modelo de recuperação de dados não estruturados para sustentação à estratégia de competitividade organizacional. Florianópolis. 2005. 204 f. Tese (Doutorado em Engenharia de Produção) – Programa de Pós-Graduação em Engenharia de Produção, UFSC, Florianópolis. As organizações, de modo geral, têm um volume de informações presentes em seus computadores das quais fazem pouco uso, por não conseguirem uma forma eficiente de acesso às mesmas. A dificuldade maior em fazer acesso a estes dados se dá pela característica da sua estruturação. Trata-se de dados não estruturados. Tendo presente esta questão, a presente pesquisa tem por objetivo encontrar uma solução para favorecer o acesso a dados não estruturados. Para encaminhar o trabalho, busca-se aplicar uma estratégia de competitividade como fator de indexação destes dados. Sendo assim, elegeram-se as cinco forças competitivas de Porter (PORTER, 1996) e, através da utilização de ontologias, construiu-se um modelo que permite a estruturação destes dados, tornando-os acessíveis por meios computacionais. O resultado da pesquisa evidencia que é possível transformar dados não estruturados em semi-estruturados e, a partir daí, aplicar recursos computacionais já existentes para disponibilizá-los para a organização. A modelagem do domínio do conhecimento contido no referencial teórico das cinco forças competitivas de Porter favoreceu o desenvolvimento do trabalho dando ao mesmo um caráter prático. A aplicação do modelo proposto permite às organizações realinhamento estratégico, definição clara de funções sobre o foco da pesquisa em questão e automatização de um processo inerente a estratégia de competitividade eleita que permite a identificação, seleção e ação com base nos dados não estruturados que chegam à organização. A pesquisa mostrou a viabilidade do modelo, bem como evidenciou a contribuição que modelos deste tipo podem representar para o avanço das organizações na otimização dos recursos computacionais de que dispõem. Na medida que seja possível a aplicação de modelagens de domínio e que estas modelagens possam ser representadas e processadas em meios computacionais, a organização se habilita para resgatar dados e informações não estruturados, muito importantes para atingir seus objetivos. Palavras-Chave: Recuperação de dados, Ontologia, Competitividade Organizacional ABSTRACT CÂNDIDO, Antônio Pereira. Modelo de recuperação de dados não estruturados para sustentação à estratégia de competitividade organizacional. (A model for the recuperation of non-structured data for the sustentation of a strategy for organizational competitiveness). Florianópolis. 2005. 204f. Tese (Doutorado em Engenharia de Produção) – Programa de PósGraduação em Engenharia de Produção, UFSC, Florianópolis. Organizations generally have a bulk of information in their computers out of the which they may make little use, because they do not possess an efficient form to access those information. The major difficulty in having access to those data is caused by their structuring nature. They are non-structured data. Considering this fact, this research aims to find a solution to permit the access to non-structured data. A strategy of competitiveness is adopted as a factor for the indexation of those data. Thus, Porter’s five competitive forces (PORTER, 1996) were chosen and, by means of the application of ontologies, a model was built that allows for the structuring of those data, making them accessible for computational processing. The results suggest that it is possible to transform non-structured data into semi-structured data, and then apply existing computational facilities to make those data available for the organization. The modeling of the domain of the knowledge included in the theoretical basis of Porter’s competitive forces permitted the development of the work, giving it a practical characteristic. The application of the proposed model allows for to the strategic realignment of the organization, clear definition of functions on the focus of the present research, and automation of a process inherent to the chosen strategy of competitiveness, which permits identification, selection and action, based on the non-structured data that enter the organization. The research proved the viability of the model and evidenced the contribution that models of this type can bring to the progress of the organizations, by optimizing the available computational resources. As far as the application of a domain modeling is possible, as well as its computational representation and processing, the organization is able to rescue non-structured data and information, which may be very important for the organization to reach its objectives. Key words: Data recovery, Ontology, Organizational competitiveness SUMÁRIO 1 INTRODUÇÃO ..................................................................................................................... 1 1.1 DEFINIÇÃO DO PROBLEMA DE PESQUISA.............................................................4 1.2 JUSTIFICATIVA ............................................................................................................. 5 1.3 AS HIPÓTESES DA PESQUISA .................................................................................... 8 1.4 OBJETIVOS DA PESQUISA ..........................................................................................9 1.4.1 Objetivo geral............................................................................................................... 9 1.4.2 Objetivos específicos .................................................................................................... 9 1.5 RELEVÂNCIA, CONTRIBUIÇÃO E INEDITISMO.....................................................9 1.6 METODOLOGIA........................................................................................................... 11 1.6.1 Características da metodologia aplicada ................................................................. 11 1.6.2 Validação do modelo e limitações............................................................................. 12 1.6.3 Estrutura do trabalho................................................................................................ 12 2 FUNDAMENTAÇÃO TEÓRICA......................................................................................14 2.1 O PAPEL DA ENGENHARIA ......................................................................................14 2.2 DADOS, INFORMAÇÃO E CONHECIMENTO .........................................................15 2.3 BIBLIOTECAS OU REPOSITÓRIOS DE DADOS, UMA REALIDADE PRESENTE.................................................................................................................... 17 2.4 COMPETITIVIDADE ORGANIZACIONAL............................................................... 19 2.5 SOBRE GESTÃO DO CONHECIMENTO ...................................................................25 2.6 RECUPERAÇÃO DE INFORMAÇÕES E CLASSIFICAÇÃO DE DADOS .............. 28 2.7 DOCUMENTO SEMI-ESTRUTURADO......................................................................37 2.8 ONTOLOGIAS............................................................................................................... 39 2.8.1 Aplicações ................................................................................................................... 40 2.8.2 Tipos de Ontologias ................................................................................................... 42 2.8.3 Engenharia de Ontologias......................................................................................... 43 2.8.4 Metodologias de desenvolvimento de ontologias..................................................... 46 2.8.5 Benefícios na utilização de ontologias ...................................................................... 50 2.8.6 Projeto e desenvolvimento de Ontologias. ............................................................... 51 2.8.7 Ferramentas para a construção de ontologias. ....................................................... 55 2.8.8 Linguagens para a construção de ontologias........................................................... 58 2.8.9 Roteiro para desenvolvimento de uma ontologia.................................................... 60 2.9 O PROTÉGÉ ..................................................................................................................62 3 O MODELO PROPOSTO.................................................................................................. 68 3.1 CONDIÇÕES DE CONTORNO ....................................................................................68 3.2 FATOR DELIMITATÓRIO PARA APLICAÇÃO DO MODELO .............................. 68 3.2.1 Grupo I – Organizações indiferentes ....................................................................... 72 3.2.2 Grupo II – Organizações em transição.................................................................... 72 3.2.3 Grupo III – Organizações alinhadas estrategicamente .......................................... 73 3.3 DESCRIÇÃO DO MODELO.........................................................................................74 3.3.1 Fase I: Localização ou Acoplamento........................................................................ 75 3.3.2 Fase II: Apropriação ou Posicionamento ................................................................ 76 3.3.3 Fase III: Construção do modelo do domínio ........................................................... 76 3.3.4 Fase IV: Construção do modelo computacional ..................................................... 77 3.4 UTILIZAÇÃO DO MODELO ....................................................................................... 77 3.5 VALIDAÇÃO DO MODELO........................................................................................ 79 4 CONSTRUÇÃO DA ONTOLOGIA.................................................................................. 81 4.1 SEQÜÊNCIA DE PASSOS – APLICAÇÃO DA METODOLOGIA ...........................82 4.1.1 Passo 1......................................................................................................................... 82 4.1.2 Passo 2......................................................................................................................... 96 4.1.3 Passo 3......................................................................................................................... 96 4.1.4 Passo 4......................................................................................................................... 98 4.1.5 Passo 5......................................................................................................................... 99 4.1.6 Passo 6....................................................................................................................... 100 4.1.7 Passo 7....................................................................................................................... 101 4.2 CONSTRUÇÃO DO ESBOÇO DA ONTOLOGIA ....................................................102 4.2.1 Nível 0 ....................................................................................................................... 103 4.2.2 Nível 1 ....................................................................................................................... 104 4.2.3 Nível 2 ....................................................................................................................... 107 4.3 DESENVOLVIMENTO DA ONTOLOGIA NO AMBIENTE PROTÉGÉ ................ 108 4.4 VERSÃO FINAL DA ONTOLOGIA .......................................................................... 119 4.4.1 Propriedades da ontologia projetada..................................................................... 130 4.4.2 Visão esquemática do estágio atual da ontologia .................................................. 143 5 VALIDAÇÃO DO MODELO ..........................................................................................144 5.1 PROCESSO DE VALIDAÇÃO DO MODELO .......................................................... 144 5.1.1 Situação..................................................................................................................... 144 5.2 CONCLUSÃO DA VALIDAÇÃO ..............................................................................154 6 RESULTADOS, CONTRIBUIÇÕES E CONCLUSÕES.............................................. 155 6.1 RESULTADOS OBTIDOS ..........................................................................................155 6.1.1 Compreensão e compartilhamento do referencial teórico a ser implementado. 157 6.1.2 Localização do modelo de competitividade à realidade da organização. ........... 157 6.1.3 Adequação dos recursos necessários à sustentação do projeto. .......................... 158 6.1.4 Modelagem do domínio do conhecimento presente no referencial teórico que dá suporte à estratégia de competitividade. ..................................................... 158 6.1.5 Construção da ontologia e disponibilização de ferramentas para utilização de recursos computacionais na operacionalização do processo............................. 158 6.2 CONTRIBUIÇÕES ...................................................................................................... 159 6.2.1 Incorporação de tecnologia nas organizações ....................................................... 159 6.2.2 Gestão de processos ................................................................................................. 160 6.2.3 Implantação de estratégia de competitividade...................................................... 160 6.2.4 Alinhamento estratégico da organização............................................................... 160 6.2.5 Estabelecimento de controle sobre a execução da estratégia............................... 160 6.2.6 Facilidade e baixo custo da implantação da solução ............................................ 161 6.2.7 Metodologia de análise e solução de problemas inerentes às questões da organização ................................................................................................................. 161 6.2.7 Apropriação de conhecimentos pela organização................................................. 161 REFERENCIAL BIBLIOGRÁFICO .................................................................................163 ANEXO I – Listagem de projetos que envolvem ontologias............................................. 168 ANEXO II – Utilização de metodologia para definição de estratégia competitiva ........ 182 LISTA DE FIGURAS Figura 2.1: Modelo das forças competitivas de Porter ............................................................. 21 Figura 2.2: Tipos de dados conforme sua estrutura.................................................................. 33 Figura 2.3: Grafo com um ciclo e sem raiz .............................................................................. 35 Figura 2.4: Grafo cíclico e com raiz ......................................................................................... 35 Figura 2.5: Árvore .................................................................................................................... 36 Figura 2.6: Representação de dados semi-estruturados por grafo ............................................ 36 Figura 2.7: Dado semi-estruturado ........................................................................................... 37 Figura 2.8: Grafo do dado semi-estruturado............................................................................. 38 Figura 2.9: Aplicação de ontologia em interoperabilidade.......................................................41 Figura 2.10: Parte dos atributos da Classe Documento Científico ........................................... 45 Figura 2.11: Parte da Ontologia KA......................................................................................... 46 Figura 2.12: Etapas de desenvolvimento e sua relação com as atividades de suporte ...............48 Figura 2.13:Guia “Classes” do Protégé .................................................................................... 64 Figura 2.14: Guia “Forms” do Protégé..................................................................................... 65 Figura 2.21: Guia “Instances” do Protégé ................................................................................ 66 Figura 2.22: Apresentação de elementos de uma ontologia no Protégé................................... 67 Figura 3.1: Estágios das organizações...................................................................................... 74 Figura 3.2: Fases do modelo proposto...................................................................................... 75 Figura 4.1: Taxonomia entre a classe Cliente, a empresa A e a propriedade “é integrante”.... 82 Figura 4.2: Domínio do conhecimento a ser modelado pela ontologia .................................... 83 Figura 4.3: Relação entre os elementos da ontologia ............................................................. 102 Figura 4.4: Visão macro do escopo que envolve a ontologia.................................................103 Figura 4.5: Classes e propriedades de Entrantes em Potencial...............................................104 Figura 4.6: Classes e propriedades de Concorrentes .............................................................. 105 Figura 4.7: Classes e propriedades de Produtos Substitutos ..................................................105 Figura 4.8: Classes e propriedades de Fornecedor ................................................................. 106 Figura 4.9: Classes e propriedades de Clientes ...................................................................... 106 Figura 4.10: Classes e propriedades de Comunicação ........................................................... 107 Figura 4.11: Discurso do domínio modelado para a teoria das Cinco Forças Competitivas de Porter ...................................................................................... 109 Figura 4.12: Classes representando os elementos do referencial teórico ...............................110 Figura 4.13: Propriedades da ontologia.................................................................................. 111 Figura 4.14: Elementos constitutivos da ontologia, representando os dados referentes às forças que integram o ambiente de competitividade de Porter ..................... 111 Figura 4.15: Modelagem da força competitiva Cliente .......................................................... 112 Figura 4.16: Representação da força Entrantes em potencial................................................. 112 Figura 4.17: Força competitiva Fornecedores ........................................................................ 113 Figura 4.18: Produtos substitutos em potencial......................................................................114 Figura 4.19: Querie elaborada para testar o funcionamento da ontologia.............................. 115 Figura 4.20: Resultado da avaliação do teste de consistência entre a ontologia proposta e a ontologia inferida pelo aplicativo ...................................................................... 116 Figura 4.21: Resultado do teste de inconsistência da ontologia ............................................. 117 Figura 4.22: Esquema percebido pelo ambiente da construção da ontologia.........................118 Figura 4.23: As classes da atual fase da ontologia .................................................................119 Figura 4.24: Classe Cliente nível A........................................................................................ 120 Figura 4.25: Classe Cliente nível B ........................................................................................ 121 Figura 4.26: Classe Concorrentes na Indústria....................................................................... 122 Figura 4.27: Classe documentos............................................................................................. 123 Figura 4.28: Entrantes em potencial ....................................................................................... 124 Figura 4.29: Classe Fornecedores e algumas instâncias.........................................................125 Figura 4.30: Classe Produtos atuais........................................................................................ 126 Figura 4.31: Classe Produtos substitutos................................................................................ 127 Figura 4.32: Classe Tema dos documentos ............................................................................ 128 Figura 4.33: Classe Tipo de documento ................................................................................. 129 Figura 4.34: Propriedade “é ameaça entrante” .......................................................................130 Figura 4.35: Propriedade “é cliente remetente”...................................................................... 131 Figura 4.36: Propriedade “é fornecedor atual”.......................................................................132 Figura 4.37: Propriedade “é negociação com o cliente” ........................................................ 133 Figura 4.38: Propriedade “é negociação com fornecedor”..................................................... 134 Figura 4.39: Propriedade “é produção atual” ......................................................................... 135 Figura 4.40: Propriedade “é produto atual”............................................................................ 136 Figura 4.41: Propriedade “é produto similar” ........................................................................137 Figura 4.42: Propriedade “é produto substituto” .................................................................... 138 Figura 4.43: Propriedade É tipo documento........................................................................... 139 Figura 4.44: Propriedade É tipo tema documento .................................................................. 140 Figura 4.45: Propriedade “tem ameaça entrante”...................................................................141 Figura 4.46: Propriedade “tem nome”.................................................................................... 142 Figura 4.47: Visão esquemática do estágio atual da ontologia .............................................. 143 Figura 4.48: Classe produto atual bem como outras classes que com ela se relacionam.......145 Figura 4.49: Tela de validação da querie ............................................................................... 146 Figura 4.50: Tela com os indivíduos da classe Documento ................................................... 147 Figura 4.51: Clientes e as empresas ....................................................................................... 148 Figura 4.52: Correspondências que contêm reclamação e são dos clientes classe A.............149 Figura 4.53: Empresa que produz determinado tipo de produto para um cliente................... 150 Figura 4.54: Resultado de processamento de querie chamada Produtos atuais da empresa 1........................................................................................................... 151 Figura 4.55: Funcionamento da querie que identifica todos os clientes ................................ 152 Figura 4.56: Identificação de todos os clientes da classe A ...................................................153 Figura 4.57: Queries identificando os clientes que enviaram correspondência com reclamação ......................................................................................................... 154 LISTA DE QUADROS Quadro 2.1: Resumo comparativo entre competitividade e sustentabilidade........................... 20 Quadro 2.2: Evolução do conceito de gestão do conhecimento ............................................... 26 Quadro 2.3: Metodologias para construção de Ontologias....................................................... 54 Quadro 2.4: Principais ferramentas para construção de ontologias.......................................... 56 Quadro 2.5: Tipos de linguagem para construção de ontologias.............................................. 58 Quadro 2.6: Sumário das principais diferenças entre metodologias de desenvolvimento de ontologias ............................................................................................................. 60 Quadro 3.1: Resumo das características do controle................................................................ 69 Quadro 3.2: Contexto social no estabelecimento do controle organizacional......................... 70 Quadro 3.3: Características em termos de processo e infra-estrutura ...................................... 71 1 INTRODUÇÃO Nos primeiros tempos da história das organizações, os objetivos organizacionais eram eminentemente funcionais, explicavam-se com a existência da organização. Havia uma relação direta entre a habilidade e o propósito do empreendedor com a natureza do empreendimento. Na medida que as organizações se desenvolviam, fazia-se necessário agregar mais pessoas a elas. Esses colaboradores eram treinados e, assim, a empresa transferia-lhes habilidades e competências. Como seus patrões, muitos colaboradores tinham o pensamento empreendedor e, com o tempo, se desligavam das organizações que lhes haviam dado emprego e capacitação e criavam outras empresas que desenvolviam os mesmos produtos. Assim, passavam a disputar o mesmo mercado. O conhecimento, que era um fator de monopólio, tornou-se motivo de concorrência. O surgimento de produtos iguais a partir de habilidade iguais fomentou a competição pela preferência. Com esse fenômeno, a direção da ação mudou de sentido: Inicialmente, o mercado procurava algum fornecedor por ser o único a produzir o bem desejado. A partir do momento em que mais de um produzia o mesmo bem, o mercado passou a ser objeto de conquista. Desde então, as atenções têm-se voltado para o atendimento das necessidades do mercado. E as organizações que têm dificuldade de identificar e atender essas necessidades, encontram dificuldades para sobreviver. Um fator inerente ao mercado, além de clientes, fornecedores e produtos, são os concorrentes. É característica inerente ao mercado a existência concomitante de empresas que disputam os mesmos clientes e que também entendem que devem atender as suas necessidades. Como o mercado tem limitações de demanda, o aumento de fatia de mercado de uma organização leva à conseqüente diminuição de fatia de mercado de outra. Esse jogo traz como essência uma disputa que desafia as organizações a estarem sempre buscando mais mercado, sabendo que outras organizações têm a mesma intenção. Esse fator leva, naturalmente, à concorrência, e esta estabelece um movimento de competitividade. 2 Manter-se competitiva é o desafio maior para o qual deve capacitar-se toda a organização. Competitividade, segundo Clark e Gury (1998), “é geralmente entendida como a habilidade de uma empresa em aumentar seu tamanho, fatia de mercado e lucratividade”. A organização deve ser capaz de manter um ritmo constante em seu crescimento, como evidencia de competitividade. A habilidade de manter-se nessa constância depende de estratégias de competitividade. A capacidade de uma organização em manter estratégias em torno da concorrência é um fator de competitividade (ECIB 1994). Estabelecendo um encadeamento de elementos, a competitividade é o resultado de ações habilitadas, com o objetivo de fazer com que a organização cresça. Crescer, para a organização, deve significar, entre outros aspectos, aumento de lucratividade, ou aumento de fatia de mercado (PRADO 2004). No passado, para uma organização gerar lucratividade e sustentar vantagens competitivas, orientava sua ação gerencial para mão-de-obra barata, estratégias de localização, utilização de recursos naturais e de capital (CORAL 2002). Atualmente, essa realidade mudou. Além dos elementos citados, a influência das tecnologias nas comunicações, no armazenamento, processamento e recuperação da informação e o novo cenário estabelecido por uma realidade socioeconômica globalizada fizeram com que a sustentação de uma posição competitiva constitua um desafio de dimensões complexas (ABREU 1999). A nova ordem econômica fez com que alguns fatores pouco considerados no passado passassem a ocupar lugar de destaque no presente. Nesse sentido, o conhecimento deixou de ser um elemento de retórica e passou a constituir vetor estratégico de relevância para as organizações. Segundo (DAVENPORT and PRUSAK 1998) “é o conhecimento a única fonte sustentável de vantagem competitiva”. O advento dos computadores favoreceu grandemente o processamento de dados. No passado, o grande obstáculo para a o estabelecimento de cenários estava na computação dos dados. Volumes de fichas e limitação de capacidade de processamento inviabilizavam muitos trabalhos. Por vezes, chegava-se ao final de um processo com grande massa de dados para serem processados. Porém o tempo que demandava tal atividade fazia com que as conclusões a que se chegava não fossem mais interessantes por não serem mais informações atualizadas. Essas limitações desencorajavam investimentos nesse tipo de atividade. Sem se contestar a necessidade e viabilidade em termos de modelo, a questão da deficiência de ferramentas para o trabalho computacional era o ponto crítico. Atualmente, recursos computacionais não representam limitações para o trabalho de processar dados e informações. As pesquisas em tecnologias da informação deram como 3 grande contribuição algoritmos que implementam tecnologias bastante eficientes para tratamento dos dados. As tecnologias de banco de dados, redes de computadores e modelos computacionais como redes conexionistas, além de um grande avanço de hardware, simplificaram essas atividades, tornando-as presentes em qualquer processo de planejamento, diagnóstico ou composição de cenários diversos. Um aspecto a ser considerado, que se evidenciou grandemente com a facilidade de acesso a computadores e tecnologias de compartilhamento de recursos computacionais, é a capacidade de disseminação da informação. No passado, com as estruturas de mainframes e por condição natural, em face do estágio de desenvolvimento dos recursos computacionais, os desafios estavam em armazenar os dados e estabelecer formas de acessá-los para tratamento e análise. Com isso, muito se avançou na tecnologia de processamento de dados estruturados. Cadastros de clientes, fornecedores, empregados, produtos, dentre outros, eram inseridos nos computadores através de estruturas de dados especializadas em administrar esses tipos de dados. Quando se analisa o comportamento estrutural do layout dos registros para armazenar esses dados, conclui-se que tal estrutura não muda, independentemente do número de ocorrências. O formato do registro para o cadastramento de um produto de estoque é o mesmo, independentemente do volume de itens existentes nesse estoque. Para acessar qualquer item desse cadastro basta ter um campo chave e o código do produto. O acesso às informações desse item de estoque é possível em qualquer linguagem compatível. Porém acessar dados para estabelecer controle sobre eles e, a partir deles, compor cenários ou extrair informações, já não representa um desafio e não atende mais as necessidades das organizações. O desafio está em fazer construir ou utilizar conhecimentos, em estabelecer relações entre conteúdos existentes nos computadores que representem fontes de conhecimentos. Os computadores são máquinas com habilidades inatas para serem acessados e lidos. Assim como os livros, basta abri-los e lê-los. Um fator relevante a observar é que, quando um ser humano abre um livro e percorre suas linhas, o entendimento faz a identificação e filtra as informações, classificando-as. Com este recurso as pessoas entendem o que estão lendo, contextualizam e assim extraem a informação deste livro. As pessoas contam intrinsecamente com uma estrutura conceitual que foram desenvolvendo ao longo do tempo. E essa estrutura é que lhes possibilita extrair do livro lido as informações e assim ampliar, alterar ou rejeitar a sua estrutura conceitual. Porém os computadores não têm um processo de educação similar ao dos humanos, pois não contam 4 com a habilidade natural, existente nos humanos, para construção dessas estruturas conceituais. Como os humanos, os computadores podem acessar outros computadores e ler o conteúdo neles existente. Porém esses mesmos computadores não são providos de recursos, como os seres humanos, para selecionar os conteúdos lidos. Cada vez mais, o conhecimento é fundamental para a dimensão estratégica da organização. Também é crescente a solicitação às pessoas para que desenvolvam mais atividades e com mais agilidade, pois os cenários em que estas organizações então inseridas são mais instáveis. Requerem ações em tempos cada vez menores. É vital para qualquer organização ter uma estratégia de competitividade, a qual estratégia envolve tarefas que devem ser executadas dentro de prazos e dimensões bem definidas. Contar com recursos computacionais para desenvolver ações inerentes a uma estratégia de competitividade é um fator critico nas organizações. 1.1 DEFINIÇÃO DO PROBLEMA DE PESQUISA Para (O'BRIEN 2001)), a informação é o dado contextualizado. Portanto, a manipulação do dado através de modelos que o contextualizem constitui uma forma de construir informações, e estas são fundamentais na gestão do conhecimento ou em qualquer atividade humana. Em uma organização ou em um consórcio de empresas, a recuperação eficiente de dados e informações se tornou fator estratégico. Ela é básica no planejamento, na organização, na direção e controle de qualquer atividade. A elaboração de diagnósticos, a disseminação de um conhecimento, o estabelecimento de estratégias, o desenvolvimento de estudos e a composição de cenários são algumas destas atividades que necessitam de conhecimento para serem executadas. A recuperação eficiente dos dados, elemento básico da informação, contempla várias dimensões que devem ser observadas como fatores essenciais para a construção de um processo eficaz. Nesse sentido, o tempo e a precisão na ação de identificar, selecionar e apresentar os resultados da pesquisa são atividades de suma importância. Sendo assim, a recuperação de dados passa a ter importância estratégica no processo de gestão da informação, dentro de uma organização. 5 Resgatando a origem das organizações, é importante considerar que: as organizações e as empresas surgiram espontaneamente, como culminação de uma atividade continua, “exigindo e regulando” o comportamento de indivíduos e de grupos sociais na consecução de determinado objetivo. (MIRANDA 1981) Considerando que as informações presentes na organização emergem da contextualização de seus dados (O'BRIEN 2001) e que uma estratégia de competitividade encontra na informação a base de sustentação, tem-se na atividade de recuperação destes dados a exegese da formulação da competitividade. A informação que resultará da contextualização dos dados servirá de base para a formulação estratégica. Grande parte dos dados de uma organização não se apresenta de forma estruturada, em banco de dados, ou em arquivos com formato capaz de favorecer o acesso a seus dados de forma clara e rápida (ATZENI, MECCA et al. 1997). É o caso de dados contidos em relatórios, pareceres, notícias, etc. Neste caso, o acesso a esses dados, que estão contidos em documentos denominados “não estruturados”, torna-se um desafio. Considerando estes aspectos, apresenta-se como o problema da presente pesquisa: • Como acessar os dados presentes em documentos não estruturados de uma organização, para dar sustentação a uma estratégia de competitividade? 1.2 JUSTIFICATIVA A organização documental sobre as várias atividades da empresa apresenta uma diversidade muito grande. As teorias existentes, a forma de implementá-las, o aporte das tecnologias da informação, o comportamento de clientes, concorrentes, fornecedores e do mercado e a evolução das práticas de gestão são alguns dos fatores geradores desta diversidade. Nesse ambiente de idéias, estratégias, relatos, resultados, políticas, métodos e procedimentos, muitas experiências estão narradas em artigos, apostilas, manuais, leis e normas (ABITEBOUL 1997). Por outro lado, verifica-se que há muita informação fragmentada, muito material para pesquisa e muitas respostas já enunciadas – porém “perdidas” – nos computadores que integram as redes, por falta de uma solução de acesso que os inclua em um acervo bibliográfico, ou em um domínio específico. 6 Essas informações fragmentadas, parte presente em relatórios, parte em apostilas, parte em artigos, muito contribuem para a composição do mosaico no qual se incluem e que pode ser objeto de estudo para pessoas ou grupo de pessoas. Podem ser focos de interesse dos mesmos. O interesse por acessar informações na organização pode ter várias origens e aplicações. Para a área jurídica, o interesse se volta para processos inerentes à área; para a área de administração, outros são os interesses. Com base nestas informações, orientam-se procedimentos, avaliam-se e definem-se metas, estabelecem-se reajustes, enfim, exerce-se a gerência. Para o caso da gestão estratégica, o enfoque não é diferente. Um aspecto a ser considerado é que se alguma informação não for acessada, isso pode comprometer a eficiência da gestão. Quando se estabelece um plano de ação, uma estratégia que tem nas informações uma questão substancial, os colaboradores são peças fundamentais na detecção e repasse das mesmas. Quando a informação pode ser facilmente controlada por computador, a possibilidade de que se perca ou não seja considerada é bastante remota. Porém, quando a possibilidade do computador controlar este informação é pequena, a estratégia fica totalmente dependente da capacidade humana de executar esse controle. Considerando a possibilidade de erro, ou de ausência do responsável pelo controle da informação, torna-se bastante importante contar com recursos computacionais para controlar estes tipos de informações. O problema é que o referencial a ser considerado para a sustentação da estratégia está na mente do colaborador; exige algumas habilidades que não estão presentes nos computadores. Essas habilidades requerem a compreensão de um ambiente que envolve conceitos e suas relações, elementos que estabelecem regras com um grau de subjetividade bastante acentuado. Quando se analisam processos como cálculo de folha de pagamento, contabilidade, administração de estoque, entre outros, percebem-se claramente as regras de negócios e a estabilidade destas regras. Essa característica possibilita a criação de modelos computacionais relativamente simples que habilitam os computadores para o desenvolvimento dessas atividades. Já a possibilidade de o computador manter o controle sobre as informações tornase bastante pequena quando se trata de questões mais abstratas, presentes em documentos não estruturados como textos – por exemplo, a identificação de referências sobre um determinado concorrente, feita em um relatório de sessão de licitação, ou o relatório de visita a um cliente onde se cita o valor de um produto oferecido pela concorrência. Neste sentido, evidencia-se a importância de construir um modelo que dê aos computadores habilidade para percorrer esses documentos e identificar tais elementos. 7 A aplicação de uma solução para recuperação de dados baseada em um referencial de competitividade libera a mente dos executivos da organização para outras atividades mais importantes, deixando esta tarefa meramente mecânica para os computadores. Esta realidade permite racionalizar recursos organizacionais e aperfeiçoar a capacidade competitiva da organização. É importante ter-se presente que o êxito organizacional tem relação com a gestão do conhecimento, na medida em que se utiliza a tecnologia como meio para a conquista dos objetivos da organização (YOGESH 2004). O conhecimento é a essência da organização. É o fator critico de sucesso. A organização que não administra seus saberes está condenada a viver sempre recomeçando (OLIVEIRA 2002). Considerando que uma das funções básicas da administração é controlar, é fundamental exercer tal função sobre as informações da organização. Segundo Jaques Rueff (apud (OLIVEIRA 2002), “classificar prioridades e formular programas é fácil. Difícil é balancear e monitorar expectativas.” Entende-se, então, que o afã de controlar deve estar acompanhado da necessidade de balancear e monitorar demandas e recursos. O balanceamento e monitoramento requerem ações continuadas e precisas, para acompanhamento, medida e conciliação. A aplicação de modelos de gestão do conhecimento auxilia os gestores nessas tarefas acima, na medida que permite constituir mecanismos que executam a tarefa de localizar, identificar e selecionar as informações necessárias para o trabalho de gestão do conhecimento de cada gestor. Ao repassar este trabalho para modelos computacionais especializados, o gestor é auxiliado, pois grande parte das atividades rotineiras voltadas para a gestão do conhecimento são desenvolvidas por computadores. Segundo Oliveira (2002) “o grande problema é a definição das informações que devem ser selecionadas e, principalmente a forma de integrá-las à organização”. Assim, a aplicação de um modelo de gestão que envolva esse conhecimento poderá favorecer grandemente a eficiência desta atividade. O esforço se concentra em definir os conhecimentos que darão base para o modelo e, com base nessas estruturas, prever como o modelo se comportará quando em operação. No instante em que isto acontece, a visão compartilhada está presente, resultado do esforço realizado anteriormente na aplicação de um arcabouço tecnológico que capacita este modelo de gestão do conhecimento aa atuar dentro de conceitos que sustentam a organização. Cabe observar também que o acesso ao acervo de conhecimentos gerados pela própria organização é fator estratégico, pois favorece a disseminação da informação. Sendo assim, o acesso a estes acervos é um fator de êxito para pesquisadores e grupos de pesquisa, na medida 8 que, através do acesso, está-se considerando o já produzido e encurtando distâncias entre o ponto de partida e o de chegada para a pesquisa da realidade que se quer conhecer. O acesso a dados e informações é uma atividade inerente ao processo de gestão do conhecimento. Se o acesso a dados ou informações não estruturadas contar com uma metodologia de indexação eficiente, eficiente será o processo como um todo. 1.3 AS HIPÓTESES DA PESQUISA O compromisso da engenharia com o aperfeiçoamento de processos é a base para a abordagem deste projeto de pesquisa. Considerando que a engenharia é "o conjunto de conhecimentos e técnicas que permitem aplicar o saber científico à utilização da matéria e das fontes de energia" (AURELIO 1994) e que o próprio conhecimento pode ser a matéria ou a fonte de energia, ou seja, o alvo da aplicação do conhecimento de engenharia, tem-se um enfoque bastante próprio à exegese do trabalho aqui apresentado. Capacitar as organizações para acessar os dados de forma rápida e integrada, independentemente de serem eles estruturados ou não, contribui para aumentar a segurança no manuseio da informação, diminui retrabalho, possibilita a reusabilidade dos dados (principalmente dos não estruturados), proporciona economia e aumento de produtividade, garante maior controle sobre os dados existentes nos computadores da organização e contribui para efetivar os recursos computacionais como elementos facilitadores no propósito de conquistar os objetivos organizacionais. As hipóteses que sustentarão o presente estudo o são as seguintes: a) É possível modelar conceitos baseados em uma estratégia de competitividade. b) É possível implementar o conceito modelado em um computador. c) É possível, através do modelo implementado, identificar, selecionar e recuperar documentos não estruturados, segundo critérios definidos no modelo de competitividade. 9 1.4 OBJETIVOS DA PESQUISA 1.4.1 Objetivo geral O presente trabalho de pesquisa tem por objetivo desenvolver um modelo para recuperação de dados não estruturados, com base em um referencial de competitividade organizacional. 1.4.2 Objetivos específicos • Modelar um domínio de conhecimento com base em uma estratégia de competitividade. • Construir uma ontologia para representar o domínio do conhecimento modelado. • Implementar a ontologia • Executar testes em nível conceitual, para validar o modelo desenvolvido. 1.5 RELEVÂNCIA, CONTRIBUIÇÃO E INEDITISMO A relevância e contribuição da pesquisa estão na possibilidade de oferecer às organizações um ambiente similar a um Enterprise Information Sistem – E.I.S., composto por dados de diferentes formatos e localizados em diferentes locais. Segundo (FURLAN, IVO et al. 1994), “E.I.S. é uma tecnologia que visa integrar num único sistema de informação todas as informações necessárias, para que o executivo possa verificá-las de forma numérica, textual, gráfica ou por imagens.” O uso de tal tecnologia auxilia grandemente a atividade dos gestores porque, segundo (LAUS, AZAMBUJA et al. 2002), com a utilização do EIS, pode-se verificar informações desde o nível consolidado até o nível mais analítico que se desejar, de forma rápida e segura, possibilitando um melhor conhecimento e controle da situação e maior agilidade e segurança no processo decisório. O que se observa, no entanto, é que os E.I.S existentes estão habilitados a fazer acesso a repositórios cujos dados estão armazenados em estruturas formais e homogêneas. A proposta do trabalho de pesquisa em questão é habilitar um ambiente de Gestão da 10 Informação para recuperar dados, independentemente da forma, focado em uma estratégia de competitividade. A recuperação dos dados tem significância a partir da estratégia de competitividade eleita para dar sustentação ao modelo. Tal estratégia estabelecerá as diretrizes e restrições para identificação e seleção das informações criticas, necessárias para dar sustentação à estratégia de competitividade. O modelo construído permite à organização ter acesso e controle sobre um conjunto de dados que dão sustentação a sua estratégia de competitividade. O modelo atua segundo um viés encapsulado no referencial teórico que orienta a estratégia escolhida. Este viés define políticas e diretrizes que o modelo sustentará. A estrutura operacional que dá seguimento às atividades vinculadas às diretrizes e políticas tem no modelo proposto ações de identificação e seleção de documentos não estruturados que, para serem repassados para os colaboradores, requereriam um nível de treinamento bastante alto, exigindo também alto nível intelectual das pessoas envolvidas. A aplicação dessa tecnologia permite maior sustentabilidade à gestão da organização, na medida que disponibiliza informações selecionadas em um ambiente operacional fácil de gerir, facilitando o suporte tecnológico necessário para a tomada de decisão dos gestores da organização. O ineditismo deste trabalho reside no fato de que o controle das informações não estruturadas, presentes nos computadores da organização, no que se refere à estratégia de competitividade, contará com uma ferramenta computacional que envolve um conhecimento presente no modelo. Este conhecimento proverá inteligência à ferramenta, na medida que os documentos semi-estruturados, presentes na organização, receberão um tratamento semântico. Isso favorecerá a identificação das informações presentes nestes e assim propiciará o controle sobre as mesmas. O modelo utiliza uma ontologia que representa a estrutura de conhecimento presente na proposta de Porter para a estratégia de competitividade baseada nas cinco forcas competitivas. São consideradas as cinco forças competitivas e a relação entre elas, permitindo ao gestor da estratégia de competitividade ampliar a sustentação a mesma, através da utilização dos dados não estruturados anteriormente pouco utilizados, em função da dificuldade de aplicar recursos computacionais para tratar esse tipo de dados. 11 1.6 METODOLOGIA 1.6.1 Características da metodologia aplicada O projeto de pesquisa é de natureza tecnológica e aplicada. O foco é identificar um conjunto de tecnologias e organizá-las de tal forma que um modelo possa ser construído e testado com base na premissa de dotar a organização de condições de recuperar dados não estruturados para dar sustentação a uma estratégia de competitividade organizacional. O presente trabalho utilizará procedimentos experimentais. A partir de um referencial teórico, será desenvolvido um modelo computacional que terá como procedimento de validação a aplicação de ferramentas computacionais que constroem e validam ontologias. A construção de ontologias requer um nível de nexo que, quando ausente, inviabiliza o funcionamento das mesmas. Como a ontologia construída é a representação de um domínio de conhecimento (CASTRO 2000), presente no modelo de Porter (PORTER 1996), a coerência das respostas para as “perguntas” feitas à ontologia determinará seu grau de eficiência e validade. O comportamento dos processos de validação da ontologia baseia-se em preceitos sustentados pela teoria dos conjuntos e pela lógica de predicados. O conjunto que conterá os elementos, fruto da ocorrência de um axioma, representado em uma frase modelada na ontologia, não poderá ser vazio. Se o for é porque o axioma não se aplica ao domínio do conhecimento modelado ou há erro. Com base no modelo teórico construído, pode-se elaborar afirmações capazes de serem representadas no computador. Se o modelo sustentar essas afirmações e apresentar como resposta elementos que dão eficiência ao modelo, comprova-se que o produto do trabalho de pesquisa atende aos objetivos para os quais foi construído. A pesquisa bibliográfica será realizada por meio de acessos a sites especializados, livros, artigos científicos, dissertações e teses. A pesquisa será direcionada às áreas de: a) Competitividade organizacional; b) Gestão do conhecimento; c) Recuperação de informações e classificação do dado a partir do tipo de estrutura; d) Ontologia. As áreas acima mencionadas darão suporte teórico para o trabalho a ser desenvolvido. O modelo a ser desenvolvido deverá contribuir com o aumento da competitividade 12 organizacional, na medida que promoverá eficiência no tratamento dos dados não estruturados como fator de sustentação para a estratégia de competitividade em questão. A etapa que aborda questões vinculadas à gestão do conhecimento resgata de que forma o conhecimento, o dado e a informação se relacionam e de que forma o modelo poderá contribuir para o melhoramento deste tipo de gestão. A recuperação do dado é o objeto de pesquisa deste trabalho. O modelo a ser construído constituir-se-á em uma ferramenta para a recuperação de informações não estruturadas. A construção de uma ontologia, a partir da modelagem do domínio do conhecimento presente no referencial teórico, permitirá atender a questão da pesquisa. 1.6.2 Validação do modelo e limitações O modelo construído será validado teoricamente, a partir da aplicação em um modelo conceitual. O suporte à validação das regras definidas no modelo dar-se-á com base na lógica formal, na teoria dos conjuntos e nos axiomas presentes no domínio de conhecimento modelado. Um parâmetro fundamental de validação do modelo está calcado na habilidade para tratar dados não estruturados a partir de regras de validação definidas por um referencial teórico de competitividade. A limitação do modelo será estabelecida pela premissa teórica que sustenta o modelo de competitividade e por questões estruturais da organização onde o modelo for implementado. 1.6.3 Estrutura do trabalho A pesquisa está estruturada contemplando os seguintes focos: • definição do problema; • fundamentação teórica; • o modelo proposto; • construção da ontologia; • resultados, conclusões e contribuições; • anexos e elementos complementares. 13 O primeiro capítulo – Introdução – contém as considerações iniciais da pesquisa. Este capítulo é composto por subitens que apresentam a definição do problema da pesquisa, a justificativa, as questões da pesquisa e os objetivos, bem como limitações e a estrutura do trabalho. O segundo capítulo aborda a fundamentação teórica e apresenta os pilares referenciais para o desenvolvimento do projeto de pesquisa. Esta parte está estruturada em subitens assim denominados: O papel da engenharia; Dados, informação e conhecimento; Bibliotecas ou repositórios de dados, uma realidade presente; Competitividade organizacional; Gestão do Conhecimento; Recuperação de informações e Ontologias. O terceiro capítulo aborda o modelo proposto. Esta parte do projeto de pesquisa apresenta o modelo de competitividade escolhido como referencial, a modelagem do domínio do conhecimento que o envolve, a construção da ontologia que representa este domínio e o modelo computacional que suportará a ontologia. O quarto capítulo apresenta o processo de construção da ontologia a partir da metodologia selecionada e do referencial de competitividade de Porter. Os resultados e conclusões da aplicação do modelo proposto são apresentados no quinto capitulo. 2 FUNDAMENTAÇÃO TEÓRICA A abordagem proposta para o presente trabalho de pesquisa considera quatro linhas de conhecimento que, combinadas, favorecerão a conquista dos objetivos propostos. A combinação dessas linhas de conhecimento poderá validar a posição de que a competitividade organizacional tem sustentação em uma gestão de conhecimento que, contando com uma estrutura para a recuperação dos dados da organização, permita transformá-los em informações, a partir da contextualização dos mesmos. A contextualização é favorecida pela construção de um cenário que represente a realidade em estudo. Considerando esta premissa, a aplicação de um modelo de competitividade ao âmbito organizacional, permitirá a construção desse cenário, que favorecerá a identificação da informação presente no dado. Sendo assim, o processo de revisão bibliográfica caminha nas áreas de gestão do conhecimento, ontologias, recuperação de informações e competitividade organizacional. 2.1 O PAPEL DA ENGENHARIA A necessidade de aplicar inteligência aos processos é uma característica universal. A natureza a todo instante convida-nos a buscar uma forma mais inteligente de realizar as atividades, uma forma mais econômica de utilização dos recursos. A gestão do conhecimento, a realidade da tecnologia da informação e a necessidade de recuperar dados estruturados ou não estruturados com rapidez e maior precisão são sustentadas por processos que podem ser aperfeiçoados. De acordo com (CARDOSO 1993), é necessário "racionalizar os sistemas produtivos através do desenvolvimento das melhores formas dos métodos de trabalho, visando a produtividade e qualidade do sistema como um todo”. Considerando que a idéia de sistemas produtivos pode ser aplicada a todos os processos, nas mais diversas atividades, temos como resultado conhecimentos, culturas, hábitos e procedimentos. Esses elementos, como produtos 15 de um processo, necessitam ser identificados e utilizados para que possam gerar formas e métodos de trabalho visando a produtividade e a qualidade. Quando se observa a realidade das organizações, percebe-se a importância de dados e informações para o desenvolvimento de seus processos. Para algumas, o conhecimento que se pode extrair dos dados é fator substancial; para outras, vinculadas à pesquisa e educação, é substancial o resultado final da execução de seus processos produtivos. Entretanto, para todas, o próprio conhecimento é fator estratégico. 2.2 DADOS, INFORMAÇÃO E CONHECIMENTO O objetivo de abordar questões relacionadas com dados, informações e conhecimento é o de estabelecer uma relação sob o foco de ciência da computação para o tema. Nesse sentido, o processamento dos dados, da informação e, mais recentemente, do conhecimento é uma questão de modelo computacional suportado por recursos de hardware e software. Sob este enfoque devem ser consideradas as questões aqui abordadas. O conhecimento é a base de toda ação humana. Quanto maior o conhecimento, mais profícua e fecunda é a ação por ele exercida (PECOTCHE 1985). As organizações são criadas e mantidas por ações humanas. Logo a mesma relação que se estabelece entre o ser humano e suas ações pode ser utilizada para as relações entre as organizações e suas ações. As pessoas dentro das organizações, por questões de custos e, conseqüentemente, de competitividade, nem sempre dispõem do tempo que seria necessário para monitorar os dados presentes na própria organização. Esta limitação faz com que haja retrabalho em alguns casos ou desconhecimento de dados importantes para o encaminhamento de ações estratégicas (MELLO, Dorneles et al. 2000). As organizações estão cada vez mais conscientes da importância do conhecimento para entender o próprio negócio e assim atender as necessidades de permanência no mercado cada vez mais competitivo. A gestão do conhecimento é uma atividade cada vez mais estratégica nas organizações. Este tipo de gestão “é um conjunto de processos que define a criação, disseminação e utilização do conhecimento para atingir plenamente os objetivos da organização” (ALVES 2002). A partir do exposto, é possível inferir que a competitividade requer conhecimento e este está calcado nos dados. Assim, obter a capacidade de acesso pleno aos dados da 16 organização e dispor deles orientado por uma metodologia de competitividade é municiar a organização, para que esta mantenha a sua capacidade competitiva. Nos computadores da organização, temos dados estruturados, presentes em banco de dados, por exemplo, e dados não estruturados ou semi-estruturados, presentes em diversos documentos como textos e páginas web. Ter o acesso pleno aos dados da organização é poder acessar os dados estruturados e os não estruturados. Revisemos os conceitos de dado, informação e conhecimento, segundo especialistas: Para (DRUCKER 2001) e (DAVENPORT and PRUSAK 1998), o dado é simplesmente o fato capturado de uma entidade qualquer, que, passa por um processo de organização e interpretação para geração da informação, que por sua vez, passa por um processo de análise/reflexão para geração do conhecimento (discernimento, experiência ou habilidade aplicável a um processo empresarial). Já a informação, para (O'BRIEN 2001), resulta da contextualização do dado. Requer a elaboração de cenário, a identificação dos elementos que atuam nesse cenário, a localização do dado nesse contexto e a avaliação das relações entre o dado em questão e ambiente onde ele está inserido. Por fim, conhecimento, segundo (Serrano 2004), “é a informação que muda algo ou alguém, quer por se transformar em base para as ações, quer por fazer um indivíduo ou uma organização ser capaz de ações diferentes e mais efetivas. O conhecimento é o resultado de um processo entre o saber acumulado e a informação adquirida e é diferenciado, devido a peculiaridade de cada um.” Mello (2000) alerta para o fato de que “a Web vem se tornando um vasto repositório eletrônico de dados” e ressalta que o acesso a estes dados não é tarefa fácil, já que “grande parte destes dados não estão mantidos em bancos de dados por terem uma organização bastante heterogênea, que pode variar de um texto informal até um conjunto de registros bem formatados”. Portanto, capacitar as organizações para acessar esses dados de forma rápida e integrada, independentemente de serem ou não estruturados, tornou-se fator estratégico. Com o aperfeiçoamento dos processos de telecomunicação e dos recursos computacionais, sobreveio um aumento significativo na capacidade de gerar documentos e informações. Tamanho volume de documentos e informações existentes nas organizações, quer nos computadores pessoais, quer na Web acessível a estes computadores pessoais, acaba por trazer problemas no momento de acessá-los. Este problema é caracterizado por Chen (1994) como "sobrecarga de informações", pois o usuário, ao estabelecer um procedimento de 17 pesquisa junto a estas fontes de documento, obtém muitos dados e, em geral, não consegue tratá-los, tendo dificuldade de encontrar o conhecimento procurado. 2.3 BIBLIOTECAS OU REPOSITÓRIOS DE DADOS, UMA REALIDADE PRESENTE Outro fator a considerar, vinculado à engenharia e aos processos produtivos, são as modificações sofridas pelas estruturas destinadas ao armazenamento das informações. No passado, essas estruturas, representadas pelas bibliotecas, tinham uma dimensão eminentemente física. Havia prateleiras, tomos, e uma forma indexada de acessá-los. Com o advento das tecnologias de informação, mais precisamente das redes de computadores e da Internet, as bibliotecas tornaram-se menos físicas e limitadas, para assumirem a condição de intangíveis, virtuais e com características ilimitadas. Antigamente, o acesso ao acervo das bibliotecas se dava por meio da entrada em um ambiente físico que tinha um endereço físico e, fisicamente, se acessava o veículo que continha o dado e a informação. Atualmente, acessa-se um endereço virtual, em um local também virtual. Nesse local virtual, acessa-se o veículo que contém a informação, que pode ser um livro, um artigo, uma planilha ou qualquer outro elemento armazenador de informação, existente nestes ambientes virtuais. Com o advento das tecnologias que transformaram em virtuais os espaços das bibliotecas, estabeleceu-se um paradoxo desafiador. Antes os ambientes físicos de bibliotecas permitiam acesso determinado e controle efetivo sobre a geração de novos volumes, veículos de dados, informações e conhecimentos. Embora localizáveis visualmente e com tangibilidade, as informações estavam restritas a quem, fisicamente, pudesse ter acesso ao ambiente. Atualmente, a intangibilidade do ambiente e a virtualidade de sua localização fazem com que ocorra de forma mais fácil o acesso a esses veículos que contêm as informações e conhecimentos. Porém o controle sobre o produzido, em termos de dados, informações e conhecimentos, torna-se cada vez mais difícil. A disseminação da informação e do conhecimento através de artigos, livros, sites, planilhas e outras formas existentes em meios eletrônicos tem trazido como grande desafio o estabelecimento de mecanismos de acesso e controle destes documentos. A realidade das organizações já não contempla o conhecimento apenas como um insumo em seus processos. Este transformou-se em riqueza, em diferencial de competitividade (DAVENPORT and PRUSAK 1998; ALVES 2002). É crescente o número de organizações que vêem no 18 conhecimento um elemento estratégico, que têm no capital intelectual o valor intangível que, mais que integrar o seu patrimônio, estabelece vantagens competitivas. Considerando o dado como a base da informação e esta como um elemento a ser analisado e também como a base para o conhecimento, vem-se consolidando de maneira efetiva, como fator preponderante nas organizações, a evolução no trato com o os dados, as informações e o conhecimento. Dar aporte para quem necessita da informação e do conhecimento – como elementos substanciais e, ao mesmo tempo, produtos finais – é uma tarefa de demanda crescente e continuada. As organizações, de maneira geral, têm no conhecimento um de seus insumos mais importantes. Com a maior presença de recursos computacionais e de novas e mais eficientes tecnologias o "praticar o que se estuda e estudar o que se pratica".(PECOTCHE 1994), tem se tornado uma busca diária em muitas organizações. Importante é observar que esta prática estabelece desafios. A prática do que se estuda parte da teoria para a ação, e tem, como principal fator de origem, a base teórica existente em bibliotecas. E o estudo do que se pratica tem como origem à análise, avaliação e conclusão dos resultados alcançados que compõem, artigos, manuais, pareceres e recomendações que nem sempre estão organizados em bibliotecas, já que se trata de documentos gerados no escopo das organizações, por vezes inerentes a necessidades pessoais, de setores e departamento que nem sempre está disponibilizado de maneira formal para toda a organização. Considerando que nas organizações pode haver mais de um grupo de pesquisa, cada grupo pode gerar seu próprio acervo. Se não houver uma metodologia e ferramentas adequadas para administrar esta realidade, tem-se redundância e discrepância de dados e informações que podem gerar prejuízos, tais como grupos de trabalho elaborando pesquisas já feitas por outros grupos, decisões incorretas por falta de conhecimentos presentes em outras áreas que poderiam ser de domínio da empresa como um todo e divulgação de dados e informações com valores diferentes para a mesma questão, entre outras. Quando se lida com dados estruturados a construção de indexadores favorece o acesso a estas informações. Geralmente contemplam dados cadastrais, resultados de exercícios contábeis, resultados físicos e financeiros de projetos, saldos em estoques, e similares. Porém, quando o dado ou a informação está em um parágrafo, presente em um título de texto ou em um site, as técnicas para a indexação destes conteúdos assumem relevante grau de dificuldade. 19 A relevância está no fato de que não é tarefa fácil e simples a indexação destes tipos de dado ou informação. 2.4 COMPETITIVIDADE ORGANIZACIONAL Entende-se por competitividade, “a habilidade de uma empresa em aumentar seu tamanho, fatia de mercado e lucratividade" (CLARK and GURY 1998). Neste sentido, percebe-se que há uma relação bastante estreita entre gestão do conhecimento e competitividade organizacional, na medida em que conhecer o mercado e estabelecer estratégias para lidar com ele é a forma de atender o objetivo da organização que, dentre outras metas, busca aumentar seu tamanho de fatia de mercado. Considerando os fatores que determinam a sustentação de estratégias de competitividade, pode-se avaliar a importância da gestão do conhecimento para estabelecer tais estratégias. (CORAL 2002), destaca alguns fatores que são determinantes para competitividade das organizações: • Eficiência: produtividade do trabalho e de capital; • Qualidade: valor percebido pelo consumidor; • Flexibilidade: produto, volume, produção, maquinário, processo e materiais; • Rapidez: inovação, produtos novos em relação ao total de produtos, atendimento das necessidades dos consumidores; • Sinergia interna e relacionamentos com clientes, fornecedores, institutos de pesquisa públicos e privados; • Capacidade de Pesquisa e Desenvolvimento (P&D); • Capacidade de gestão na área de inovações. Um fator primordial na gestão da competitividade organizacional está no desafio de manter a sustentação da vantagem competitiva. A capacidade que a empresa tem em manterse inovadora contribui sobremaneira para estabelecer vantagens. Sendo assim, associar metodologias e combinar competências essenciais favorece a criação de uma ação ímpar de competitividade, dificultando o entendimento e replicação de estratégias, no curto prazo, pelos concorrentes. Para tanto, investir em pesquisa buscando aportes de tecnologia deve constituir ação continuada e rotina a ser estabelecida na organização. Estabelecer ações que propiciem sustentabilidade, portanto, é uma ação fundamental na definição da estratégia de competitividade organizacional. Para (SACHS 1993), a 20 sustentabilidade possui dimensões que podem ser analisadas individualmente ou coletivamente. Os fatores de sustentabilidade, segundo o autor, são os seguintes: • Sustentabilidade social: Significa contribuir para a eqüidade na distribuição de renda entre os habitantes do planeta. • Sustentabilidade ambiental: Utilizar os recursos naturais que são renováveis e limitar o uso dos recursos não renováveis. • Sustentabilidade econômica: Reduzir os custos sociais e ambientais. • Sustentabilidade espacial: Atingir uma configuração de equilíbrio ente as populações rural e urbana. • Sustentabilidade cultural: Garantir a continuidade das tradições e pluralidade dos povos. O Quadro 2.1 apresenta um resumo relacionando competitividade e sustentabilidade das organizações. Quadro 2.1: Resumo comparativo entre competitividade e sustentabilidade (CORAL 2002) Competitividade Baseada em fatores econômicos e operacionais Sustentabilidade Baseada em fatores econômicos, sociais e ecológicos Visão de mundo restrita – empresas contra as Visão de mundo mais ampla – parcerias para forças competitivas obter vantagens competitivas Legislação ambiental = aumento dos custos de produção Legislação ambiental = promoção da inovação Uso de tecnologias de produção tradicionais Uso de tecnologias limpas de produção Questões do meio ambiente natural geralmente são vistas como ameaças Questões do meio ambiental geralmente são vistas como novas oportunidades Foco na redução e eficiência operacional Foco na inovação Individualista Cooperação A competitividade organizacional tomou outra dimensão com os estudos realizados por Porter e outros pesquisadores. Antes desses estudos, entendia-se que a competitividade existia entre fornecedores do mesmo produto ou serviço. Atualmente, entende-se que em um sistema de forças, interno ou externo a um setor de indústria, há a influência de forma coletiva sobre a natureza e a intensidade com que os elementos que integram este setor se relacionam. 21 Observou-se que há um sistema de forças que interfere no potencial de lucratividade (MONTGOMERY and PORTER 1998). Na constituição de um setor de indústria, estão presentes clientes, fornecedores, novos entrantes em potencial, produtos substitutos. E todos esses elementos, em conjunto, estabelecem um sistema de forças. Assim, dependendo da habilidade e das estratégias estabelecidas para interagir com este sistema, um integrante desses grupos de economia em interação influi na lucratividade de todos os demais. O sistema acima delineado é conhecido como “as cinco forças competitivas de Porter” (PORTER 1996). A Fig. 2.1 apresenta os elementos integrantes desse sistema e suas relações. Figura 2.1: Modelo das forças competitivas de Porter (PORTER, 1996) Esse ambiente da indústria, seja ele nacional ou internacional, envolva produtos ou serviços, sempre propiciará situações em que os compradores exercerão pressão sobre as empresas, influenciando no comportamento dos preços que poderão ser praticados. O poder dos compradores poderá exercer influência sobre os custos e investimentos, na medida em que compradores poderosos influenciem no perfil dos produtos ou serviços a serem oferecidos. Os fornecedores poderão influenciar nos preços, na medida que se organizem ou sejam forçados por fatores diversos. A rivalidade entre empresas poderá gerar diminuição de custos, modificação nas vendas. A ameaça de entrada de produtos substitutos pode gerar movimentações nas empresas, fazendo com que haja investimentos em novas áreas de pesquisa ou modificação no perfil do serviço ou produto ofertado. 22 A ameaça da entrada de novas empresas concorrentes pode alterar o perfil da indústria, fazendo com que práticas de negociação, associação de concorrentes e outras operações possam ocorrer. A relação estabelecida por Porter indica que fornecedores e clientes devem se relacionar com a indústria, representando negociação. Já produtos substitutos e entrantes em potencial se relacionam com a indústria como ameaça. Dentro desse ambiente, considerando as forças competitivas e o relacionamento entre elas, os clientes, fornecedores, entrantes em potencial, produtos substitutos e a relação entre todos esses elementos devem ser considerados por cada empresa para compor sua estratégia de competitividade. Para cada elemento constitutivo, um conjunto de estratégias e políticas deve ser desenvolvido, com o objetivo de deter o avanço dos concorrentes e consolidar e ampliar a posição que a empresa ocupa dentro do sistema. a) Fornecedores e compradores poderosos Os fornecedores podem exercer pressão no ambiente da indústria alterando o comportamento das variáveis vinculadas a matéria-prima e insumos. O aumento de preço, bem a variação na quantidade e qualidade do insumo/matéria-prima fornecida podem influir poderosamente no sistema. b) Entrantes em potencial A ameaça de entrada de novas empresas no mercado deverá ser motivo de atenção constante para as que já atuam neste mercado. A ocupação destas organizações é estabelecer barreiras que minimizem a possibilidade de essas entradas ocorrerem. Os fatores a serem considerados nesse enfoque são: • Economia de escala: com isto se consegue declínio no custo em decorrência da otimização de áreas funcionais, integração vertical e/ou horizontal e compartilhamento de recursos. • Necessidade de capital: envolvendo definição de necessidades, disponibilidade, quantidade e risco de negócio. • Definição do produto a ser comercializado: envolve, entre outros aspectos, marca identificada e qualidade no serviço ao cliente. • Custo de mudanças: custo a ser aceito ou vencido em decorrência da decisão de mudança de fornecedores. 23 • Desvantagem de custo independente de escala: este aspecto considera a curva de aprendizado, subsídio, localização e tecnologias. • Política governamental: através das licenças e acessos à matéria-prima e à legislação. c) Concorrentes na indústria A dimensão da rivalidade entre os concorrentes gera disputas de posições e influi sobre os seguintes fatores, sendo também por eles influenciada: • Crescimento lento da indústria, • Altos custos com estocagem e armazenamento, • Concorrentes em grande número ou com um bom equilíbrio, • Ausência de custos de mudanças ou de diferenciação, • Grandes interesses estratégicos, • Foco e aumento da capacidade em grandes incrementos (supercapacidade e redução de preços), • Divergência entre concorrentes: Este aspecto estabelece regras de competição e diferenciação de regras • Elevadas barreiras de saída integradas por ativos especializados, interrelacionamentos estratégicos, custos fixos de saída, barreiras emocionais, restrições de governos etc. d) Produtos Substitutos Este fator representa a ameaça de novos produtos ou produtos alternativos com custos menores, ocupando o espaço no mercado em detrimento dos produtos já existentes. e) Clientes A pressão exercida pelo poder de negociação dos compradores influi no comportamento dos preços, exigindo mais qualidade ou aumento da gama de serviços e faz com que um concorrente dispute com o outro, estabelecendo e acirrando a concorrência. Para este fator, é necessário ter presente que o poder do cliente aumenta quando: • Os produtos que se quer adquirir representam uma significativa fração de seus próprios custos; • Enfrenta poucos custos com as mudanças; • Adquire grandes volumes ou está concentrado em apenas um vendedor; 24 • Os produtos que ele adquire tem diferenciações, ou seguem um padrão; • Ele consegue baixos lucros; • A importância do produto para a qualidade dos produtos ou serviços do comprador não é significativa; • Tem acesso a informação; • Possibilita a integração para trás. f) Fornecedores Este elemento integrante das cinco forças competitivas de Porter, considera o poder dos fornecedores em relação à elevação do preço de produtos e serviços e/ou redução da qualidade dos bens ou dos serviços. Os elementos que influem no comportamento desta dimensão da proposta de Porter são: • É dominado por um pequeno número de organizações, havendo mais concentração do que para a indústria cliente; • Há ausência de concorrência com produtos substitutos; • Há diferenciação de produtos ou o conjunto desenvolveu custos de mudança; • O grupo de fornecedores é uma ameaça concreta de integração para frente; • O produto do fornecedor é um importante insumo para o negócio do comprador. É importante que a empresa conheça as forças que atuam sobre a sua realidade competitiva. Com isto ela será capaz de se posicionar frente às mesmas. O governo, por exemplo, é um fator que não está contemplado como elemento direto do modelo. Porém através de incentivos e subsídios e ele pode influir poderosamente nas variáveis do modelo proposto por Porter. Com base nisso, o governo deve ser analisado considerando cada uma das cinco forças separadamente. A organização deve ser capaz de identificar, estudar e conhecer profundamente todas as forças que atuam sobre si e quais destas forças ela tem efetivo domínio. O resultado desse posicionamento se reflete na capacidade que a empresa terá para elaborar sua estratégia de competitividade. Os sistemas de informação jogam papel fundamental nesse processo de ação estrutural para o posicionamento estratégico de competitividade. Nas organizações, os dados estruturados já estão inseridos nesses sistemas, fazendo parte de bancos de dados ou de processos de busca e recuperação já dominados e amplamente divulgados. O projeto desta tese amplia a ação do sistema de informação, agregando os dados não estruturados e os dados 25 semi-estruturados ao processo de análise para o estabelecimento e sustentação de estratégias de competitividade. Optou-se por inserir este capitulo no trabalho por se constatar na bibliografia uma forte vinculação entre conhecimento organizacional, competitividade e gestão. 2.5 SOBRE GESTÃO DO CONHECIMENTO Não sendo a área de pesquisa deste trabalho, aborda-se o tema por considerá-lo interligado ao escopo do projeto, pois o conhecimento é fundamental para qualquer atividade que envolve o ser humano. No que se refere às organizações, é notória a importância da gestão do conhecimento para transformar talentos em diferencial competitivo. Segundo Serafim (1999), o resultado final de um processo ou produto está diretamente vinculado à forma de confeccioná-lo e à relação entre esta forma o os saberes humanos. Nos tempos modernos, cada vez mais, evidencia-se a importância do diferencial humano como fator de competitividade. Para (FALBO and NATALIA 2003), atualmente, as organizações têm se conscientizado de que o conhecimento é um de seus principais ativos e fator decisivo na competitividade das mesmas. Dada a sua importância, o conhecimento não pode estar centrado somente nos membros da organização, pois se um indivíduo deixa a organização, o seu conhecimento é perdido. Tampouco o conhecimento pode existir somente em documentos e registros em papel, pois essa forma de representação dificulta o acesso, a pesquisa e a atualização. Neste cenário, muitas organizações, e em especial as organizações de software, têm adotado a gerência de conhecimento como forma de melhorar o fluxo de conhecimento entre seus membros, capturar conhecimento organizacional, assegurar a disponibilidade de conhecimento e promover o surgimento de conhecimento novo. Entende-se que muitos são os desafios a serem vencidos pela organização, os quais atuam como fatores catalisadores das mudanças. Um desses desafios é o comportamento do mercado, com o surgimento de novas organizações e a conseqüente concorrência. Com o aperfeiçoamento das organizações e a crescente competitividade, o tema da gestão do conhecimento vem sendo cada vez mais valorizado. Comprova-se isto através do crescente número de matérias, jornais e revistas especializadas abordando essa questão. Tais publicações acompanham e publicam artigos sobre gestão e talentos humanos. Os textos ostentam títulos que mencionam “inteligência competitiva”, “capital intelectual”, “engenharia do conhecimento”, “gestão do conhecimento”, “gestão do talento humano” etc. 26 A gestão do conhecimento, segundo (SERAFIM F. 1999), passa essencialmente pelo compartilhamento dos conhecimentos individuais para a formação do conhecimento organizacional. Sendo assim, a pessoa que detém o conhecimento é que decide se o compartilha ou não. Resgatando a trajetória do pensamento que deu origem à gestão do conhecimento, consegue-se estabelecer um horizonte abrangendo desde a década de 20 até os dias atuais. Como o tema está em desenvolvimento e muitas questões ainda são pontos a serem consolidados, (Serrano 2004) apontam para um limiar que deverá alcançar toda a primeira década deste século. O Quadro 2.2 apresenta um resumo da evolução do conceito de gestão do conhecimento. Quadro 2.2: Evolução do conceito de gestão do conhecimento (SERRANO and FIALHO 2004) Passado Presente Futuro Gestão de Produto Gestão de Processos Gestão do Conhecimento 1920 _____ 1950 _________________ 1980 _________________________ 2010 Diante do quadro apresentado acima, é possível destacar dois grandes desafios para as organizações. O primeiro é ter consciência dos conhecimentos de que dispõe, e o segundo é organizar-se através destes conhecimentos. Os conhecimentos presentes na organização podem ser classificados em tácitos e explícitos. A gestão do conhecimento, dentre outros aspectos, deve prover a organização com recursos para que o conhecimento tácito se transforme em conhecimento explícito (GUIZZARDI, AROYO et al.). Considerando as organizações, de forma geral, Serafim (FILHO 1999) aponta para as seguintes pontos que delineiam a prática da Gestão do Conhecimento: a) Criação do conhecimento Consiste em transformar o conhecimento tácito em conhecimento explicito, ou seja, transformar os conhecimentos individuais em conhecimentos coletivos. O objetivo deste foco é criar oportunidades de reflexão no dia-a-dia na organização, buscando evidenciar o saber 27 que se encontra na ação de cada colaborador. Neste sentido, as atividades de cunho colaboracionista desempenham papel fundamental. A prática de atividades em equipe favorece a observação mútua e assim a possibilidade de identificação de conhecimentos tácitos até então desconhecidos pelo possuidor e pelos demais (GUIZZARDI, AROYO et al. 2002). O resultado final de processos com o foco na gestão do conhecimento é a criação de novos modelos conceituais a serem utilizados pela organização. b) Utilização do conhecimento As organizações necessitam desenvolver um ambiente voltado à pesquisa que propicie o resgate dos conhecimentos já produzidos. Por vezes, os resultados de seminários, cursos e palestras são esquecidos ou não são considerados, por falta do hábito da pesquisa ou por ineficiência no armazenamento dos conhecimentos advindos destes eventos. A organização deve ser capaz de construir e implementar soluções para garantir que o conhecimento seja reaproveitado. c) Retenção do conhecimento Esta atividade inerente à gestão do conhecimento pode ser dividida em duas atividades específicas. Reter a informação para assimilá-la ou reter para preservá-la. Para o caso de se reter o conhecimento para assimilá-lo, a criação de modelos conceituais é importante para estabelecer metodologias que permitam a recuperação da informação de forma consistente. Outro aspecto favorecido pelo desenvolvimento de modelos é a possibilidade de compartilhamento do conhecimento através da aplicação de modelos. A capacidade de compartilhamento da informação é fator de economia e de dimensão estratégica. d) Medição do conhecimento. Este aspecto da Gestão do Conhecimento apresenta dois grandes desafios. O primeiro é a capacidade de reconhecer o conhecimento que a organização já possui e a segunda é a capacidade de identificar novos conhecimentos e armazená-los. Um fato cada vez mais evidente é que a diferença entre o valor de mercado de uma organização e seu valor patrimonial é estabelecido pelo conhecimento que ela possui. Medir o que conhece a organização através do conhecimento explicito não é tão complicado como identificar e medir o conhecimento tácito ou implícito. Este é um desafio que deve ser vencido para garantir melhor condição estratégia para a organização. 28 Para (NATALI and FALBO 2003), é necessário ter-se em conta quais são e quem alimenta os repositórios da organização. Outros fatores apresentados pelos autores se referem ao reuso e recuperação de itens de conhecimento, bem como ao controle e expansão da memória organizacional. A gestão do conhecimento determinará novas práticas organizacionais que representarão um novo estágio nas relações entre grupos e pessoas, empresas, clientes e fornecedores. Para (DIEGN 2000), a gerência de conhecimento visa compartilhar o conhecimento dentro da organização, transformando o conhecimento individual em coletivo. Esse compartilhamento pode ser feito de diversas formas, tais como: disseminação de melhores práticas, melhorias em processos, apoio a novos membros etc. A disseminação de conhecimentos em torno de uma estratégia de competitividade define e identifica um grupo de colaboradores que se caracterizarão por necessidades de manuseio de conhecimentos comuns. Uma gestão eficaz destes conhecimentos garante ao grupo uma melhor perspectiva de atingir seus objetivos e, conseqüentemente, de garantir à organização mais coesão no atendimento das suas necessidades. 2.6 RECUPERAÇÃO DE INFORMAÇÕES E CLASSIFICAÇÃO DE DADOS Com a facilidade de aquisição e operação de recursos computacionais, estes proliferam em residências, organizações e na sociedade em geral. Cada vez mais os computadores ocupam espaços, executando tarefas no auxílio ao ser humano e assim vão-se integrando ao cotidiano de forma a passarem despercebidos. Tem-se computador no celular, no palm, no relógio, no semáforo, no automóvel etc. Atividades controladas por computadores, como a identificação por cartão ou por digital para acesso a locais e serviços, já se tornaram mera rotina e não mais merecem atenção especial. Por outro lado esta “invasão” da Tecnologia da Informação apresenta um grande desafio para as organizações que querem implantar tecnologias para suportar a Gestão do Conhecimento. A quantidade de dados e informações disponíveis nos computadores assume proporções incalculáveis. Esta condição torna cada vez mais difícil o acesso a esses dados e informações (BONIFACIO and Heuser 2002). Um aspecto a considerar no desafio de dominar os dados e informações para estabelecer a Gestão do Conhecimento é a dificuldade de buscar esses elementos. 29 Independentemente de tecnologia, de complexidade ou de meio de armazenamento, o acesso a repositórios de dados e informações necessita de uma forma de indexação para que se tenha algum mecanismo de controle sobre o processo de recuperação. Considerando a realidade das organizações, percebe-se que todas necessitam de conhecimentos para o desenvolvimento de seus processos. Para algumas, o conhecimento é fator substancial, para outras é o resultado final da execução de seus processos produtivos. Organizações vinculadas à pesquisa e à educação apresentam de forma contundente a necessidade de conhecimentos. Independentemente da atividade fim da organização, o problema se apresenta da mesma forma: O grande volume de documentos e informações existentes na organização, quer nos computadores pessoais, quer na Web acessível a estes computadores pessoais, acaba por trazer problemas no momento de acessá-los. Este problema, se caracteriza como "sobrecarga de informações" (CHEN 1994), pois o usuário, ao estabelecer um procedimento de pesquisa junto a estas fontes de documento, obtém muitas informações das quais não consegue tratar, não podendo encontrar o conhecimento procurado, existente nestes documentos. Muita pesquisa se tem desenvolvido para resolver esse problema. A seguir, apresentam-se algumas das técnicas pesquisadas: a) Indexação semântica. Esta técnica considera basicamente dois parâmetros: o interesse do usuário, que é descrito apenas pelos termos de entrada da consulta, e o contexto dos documentos em que o termo está contido. (CHEN 1994) b) Buscas no espaço conceitual do documento. Nesta técnica, define-se um conjunto de palavras como pertencentes a um assunto ou área do conhecimento e, com base neste arcabouço, motores de pesquisa realizam seus procedimentos. c) Freqüência relativa e freqüência inversa como pontos de partida para o desenvolvimento de técnicas de pesquisas. Através destas freqüências, define-se que termos melhor definem um contexto. Se um termo aparece muitas vezes em um documento, seu grau de discriminação será alto; se o termo aparece em muitos documentos, seu grau de discriminação será baixo, pois o resultado da pesquisa envolvendo este termo terá como resultado um grande número de documentos recuperados. Os termos que aparecem em muitos documentos normalmente não são recuperados. Estes termos são chamados stop-words e geralmente são preposições, artigos, pronomes e conjunções. 30 d) Expansão semântica de palavras. A expansão semântica de uma palavra se operacionaliza encontrando outras palavras relacionadas com ela. Com base nesse conjunto de palavras, executa-se o processo de recuperação de documentos. Nessa técnica, é utilizado um dicionário para encontrar as palavras relacionadas. Desta forma, eliminam-se as stop-words. Também se utiliza a modelagem semântica das palavras relacionadas, através de redes semânticas criadas manualmente. O grande problema nesta técnica é o de estabelecer as palavras relacionadas. Algumas metodologias utilizam modelagem de contextos alternativos. Isso permite que contextos diferentes possam ser explorados em paralelo. Segundo Chen (1994), neste tipo de metodologia de recuperação, "a lógica fuzzy é utilizada para diminuir as incertezas advindas do uso de termos lingüísticos e para melhor detalhar a importância dos termos em relação à consulta, a relevância dos documentos para a consulta e o grau em que um termo caracteriza um documento". e) Rede semântica fuzzy. Através desta técnica, representa-se o conhecimento do especialista no processo de expansão semântica da consulta. São usados valores fuzzy para representar pesos, como forma de expressar o quanto um termo está vinculado a outro. Através de valores fuzzy, também se expressa o grau de satisfação dos documentos em relação à consulta. Para avaliar as técnicas de recuperação de documentos, dois conceitos são fundamentais: precisão e abrangência. No quesito precisão, avalia-se se somente documentos relevantes foram recuperados. No quesito abrangência, avalia-se se todos os documentos relevantes foram recuperados. Considerando a questão do desafio do acesso às informações para suportar a gestão do conhecimento, é importante considerar que: atualmente os sistemas convencionais de busca, usam técnicas de base sintática sobre uma forma de adequação léxica mais do que uma aplicação da base de conhecimento do campo de interesse. Em muitos domínios, o usuário está interessado em encontrar informações onde a relevância dos documentos não pode ser medida através do uso de sistemas de busca por palavras chaves (KeyWords). A relevância deve ser preferencialmente estimada num nível de conhecimento profundo do domínio de conhecimento do problema em questão. (BONIFACIO and Heuser 2002) Para resolver esta questão, algumas propostas envolvem a criação de metadados a partir da construção de ontologias. Uma ontologia é um conjunto de termos hierarquicamente 31 estruturados para a descrição de um domínio que pode ser utilizado como uma estrutura, um esqueleto fundamental para uma base de dados. Através da representação computacional desse esqueleto, pode-se estabelecer índices de acessos que transformam o paradigma léxico em uma condição semântica de acesso a banco de dados. A recuperação eficiente dos dados contempla várias dimensões que devem ser observadas como fatores básicos para a construção de um processo eficaz. Nesse sentido, o tempo e a precisão na ação de identificar, selecionar e apresentar os resultados da pesquisa são duas das dimensões mais importantes. São muitos os esforços que buscam desenvolver técnicas para recuperação de dados, que aumentem a precisão e otimizam o tempo de busca, permitindo aos usuários atuarem de maneira mais simples, obtendo resultados melhores. Ter uma visão clara e compartilhada do domínio de conhecimento onde o dado está inserido é uma das possibilidades para o desenvolvimento de técnicas de recuperação de informações. Esse processo passa por uma etapa que consiste em dar uma visão conceitual para o domínio do conhecimento em foco. Segundo (GUIZZARDI 2000), a conceituação tem uma importância fundamental em qualquer atividade de modelagem do conhecimento, pois é impossível representar o mundo real, ou mesmo uma parte dele, em sua completa riqueza de detalhes. Todo modelo de conhecimento é, portanto, comprometido com alguma conceituação, implícita ou explicitamente. O desafio está, portanto, em compor uma estrutura conceitual que represente o domínio dos dados e, através desta estrutura, conceber e implantar uma forma de indexação que permita a recuperação eficiente desses dados. Quando se considera a recuperação eficiente dos dados, alguns fatores passam a ter relevância. Dentre estes se pode destacar a quantidade de dados existentes na base, o tempo para o acesso, o quão estruturados são os dados e a qualidade do acesso a esses repositórios de dados. Nas organizações, o conhecimento é fator substancial, e, pelo comportamento inerente a ele, a geração, disseminação, recuperação, comparação e construção de novas estruturas de conhecimento se realizam com uma velocidade muito intensa. Geralmente os conhecimentos estão presentes em dados estruturados e não estruturados. Como já mencionado, tais dados encontram-se em computadores pessoais, laptops e estruturas centrais de uma rede local ou na Web. Esses dados fazem parte de uma 32 comunidade cujos integrantes interagem com o domínio de conhecimento ao qual pertencem incrementando esses dados, completando-os, excluindo-os, consultando-os para gerar novos conhecimentos. Se todos os dados presentes nesses domínios fossem estruturados, a implementação de chaves de acesso estabeleceria uma forma prática, simples e segura de recuperá-los. Através dessa chave, estabelecer-se-iam consultas dentro de uma estrutura sintática e semântica que poderia garantir a eficiência requerida. Como se trata de um conjunto de dados heterogêneo, como dados estruturados e não estruturados, é necessário encontrar uma forma que permita indexá-los. A modelagem do domínio a que estes dados pertencem favorece a construção de uma visão semântica, e tal visão pode-se constituir em uma base para o desenvolvimento de uma solução para indexálos. Com a ampliação dos recursos computacionais, a questão do processamento de dados tomou dimensões universais. A Internet possibilitou que o armazenamento, recuperação e publicação de dados atingisse dimensões pessoais em amplas faixas etárias. Desde crianças em idade de alfabetização até pessoas de idades avançadas acessam a Internet. O material acessado varia de jogos até resultados de exames médicos. A forma através como os dados se apresentam é um fator importante a ser considerado, pois da forma com que o dado se apresenta depende o esforço computacional para tratá-lo. Segundo (ABITEBOUL, BUNEMAN et al. 2000), pode-se dizer que os dados se apresentam em três formas distintas: a) Dados estruturados: Apresentam uma representação estrutural homogênea, tipada. O esquema de representação é feito de forma documentada, através de descrição de lay-out presente na documentação do aplicativo. Nestes dados inclui-se o cadastro de funcionários, clientes, produtos, tabelas dos bancos relacionais dentre outros. b) Dados semi-estruturados: Apresentam representação estrutural heterogênea, não são completamente estruturados, tipados, porém com alguma estrutura. Neste tipo de dados enquadram-se os publicados na Web. Em determinados casos os dados possuem uma descrição uniforme como catálogos de produtos, em outros casos os dados possuem formato que podem ser identificados como artigos e contratos. Neste tipo de dado a descrição do formato está implícito ao documento. 33 c) Dados não estruturados: São dados em que é impossível ou muito difícil encontrar a forma de representação. Enquadram-se neste tipo de dado as imagens. Neste caso não há informação descritiva associada. A medida que se trata o dado, aperfeiçoa-se sua forma de representação. De acordo com a Fig. 2.2, o aperfeiçoamento da estrutura do dado caminha da forma não estruturada para a estruturada, passando por um processo de semi-estruturação. Dados não Dados semi- Dados estruturados -estruturados estruturados Textos Livres Páginas Html E-mail Banco de dados relacionais Figura 2.2: Tipos de dados conforme sua estrutura Considerando o propósito deste trabalho de pesquisa, tem-se, nos dados não estruturados, uma fonte de informação importante. Mas, em função da forma como esses dados se apresentam, torna-se pesado o processamento computacional para extraí-los, levá-los a uma condição de semi-estruturação e poder incluí-los em ambientes apropriados para o tratamento computacional de forma mais leve. Um aspecto importantes a considerar neste ponto é que existem passos que se pode dar para levar um dado não estruturado à condição de semi-estruturação. (ABITEBOUL, BUNEMAN et al. 2000) apresentam alguns desses passos: a) Definição a priori: Após a existência dos dados, com base em uma investigação de suas estruturas preliminares e da análise de similaridades e diferenças, pode-se definir esquemas para dados semi-estruturados. b) Estrutura irregular: Tendo presente que não existem informações completas sobre a estrutura de um determinado documento e que estas podem ser encontradas em diversos documentos de mesma natureza, coleções de dados poderão estar organizadas de maneiras diferentes, e um estudo analítico poderá identificar um padrão que atenda as várias formas, tornando possível semi-estruturação. 34 c) Estrutura parcial: Para esta questão, deve-se considerar que nem sempre todas as informações esperadas, do ponto de vista semântico, estão completas. Neste caso, apenas parte dos dados que estão disponíveis têm alguma estrutura. Como exemplo, pode-se citar componentes de objetos que são arquivos bitmap. Neste caso, a semi-estruturação é parcial para a parte dos dados possíveis de terem sua estrutura identificada implícita ou explicitamente. d) Estrutura implícita: Há dados cuja estruturação está implícita; essa estruturação básica existe, mas não é evidente. Neste caso, é necessário utilização de recursos computacionais para identificá-la e explicitá-la. e) Estrutura extensa: Esta estrutura existem quando ocorre união de atributos significativos em determinados formatos. Para exemplificar, pode-se supor um conjunto de atributos diferentes para um curriculum vitae. Para este caso, a ordem de magnitude da estrutura existente dos dados é elevada. f) Estruturas descritivas e não prescritivas: Um sinônimo para este tipo de estrutura é estrutura indicativa, devido à natureza evolucionaria e sem regularidade dos dados semi-estruturados. Estas estruturas resumem-se em definir o estado corrente dos dados, com pouca ocorrência e com pouca similaridade. Em decorrência, a possibilidade de prescrever esquemas fechados e restrições de integridade é muito pequena. g) Estrutura evolucionária: Para estes casos, as estruturas de dados se modificam com muita freqüência. Como exemplo, apresenta-se o caso dos dados da Web, que têm a necessidade de variar não apenas o conteúdo, mas também a forma. Para estes casos, as linguagens de marcação dão suporte, e a etapa de semi-estruturação ocorreu anteriormente, para que se pudesse publicar os dados em páginas Web. h) A distinção entre estrutura e dados não é clara: Quando a descrição da estrutura está implícita no dado, é mais trabalhoso separar o dado da estrutura que o representa, ficando para uma análise do conteúdo a possibilidade de compreender e estabelecer esta diferenciação. O exemplo para o caso é um endereço 35 embutido em uma variável string. A identificação do número da casa ou apartamento, quando houver, somente é possível após uma análise do conteúdo da variável. Com relação à modelagem dos dados semi-estruturados, a forma mais atual de executar esta tarefa é utilizando grafos direcionados rotulados (SZWARCFITER, 2004). Neste tipo de representação, os vértices representam objetos identificáveis e as arestas representam os arcos para ligação com outros objetos participantes da estrutura. Um grafo G(V,E) trata-se de um conjunto finito, não vazio V e um conjunto E de pares não ordenados de elementos distintos de V. Os elementos em V são os vértices do grafo e os elementos em E são as arestas. Cada aresta “e”, pertencerá a E, e será representada pelo par de vértices ou nó “e” que será igual a (v,n). Existem vários tipos de grafos, dentre os quais destacam-se: a) Grafo com um ciclo e sem raiz Figura 2.3: Grafo com um ciclo e sem raiz b) Grafo cíclico e com raiz aresta nó Figura 2.4: Grafo cíclico e com raiz 36 c) Árvore Figura 2.5: Árvore A Fig. 2.6 representa dados semi-estruturados utilizando grafos. Para melhor visão da representação de um conjunto de dados semi-estruturados simples em uma lista associada a grafos, apresenta-se um documento tipo artigo na Fig. 2.7. {instituição:”INSTITUIÇÃO”,autor:”nome_do_autor_um”, e-mail:”nome_do_autor_um@INSTITUIÇÃO.br} Figura 2.6: Representação de dados semi-estruturados por grafo 37 Nome_autor_um Nome_autor_dois INSTITUIÇÃO e-mail: {nome_autor-um,nomeautor_dois@instituição.Br Resumo ------------------------------------------------------------------1 Introdução ------------------------------------------------------------------n Conclusão ------------------------------------------------------------------Bibliografia ------------------------------------------------------------------- Figura 2.7: Dado semi-estruturado 2.7 DOCUMENTO SEMI-ESTRUTURADO Para a representação do dado semi-estruturado contido na Fig. 2.7, apresenta-se o grafo da Fig. 2.8. A construção do grafo pode ser conduzida por um conjunto de pessoas ou por uma única pessoa. Atualmente, através de mapas conceituais, pode-se organizar trabalhos colaborativos que agregam pessoas em diferentes áreas geográficas e com diferentes idiomas, comunicando-se através de uma linguagem gráfica suportada por grafos. Este tipo de representação é utilizado para ontologias. 38 documentos artigos Seções Título “Dados SemiEstruturados” Autor Autor Resumo Introdução “nome_autor_um” Resumo.txt “nome_autor_dois” e-mail Conclusão e-mail Introdução Bibliografia Introdução Nome_aoutor_ um@instituição Instituição Nome_aoutor_dois @instituição.br Introdução.txt Conclusão.txt Bibliografia.txt Figura 2.8: Grafo do dado semi-estruturado Este tipo de representação favorece o entendimento e, através de linguagens de marcação, como XML, é possível representar computacionalmente o dado semi-estruturado. A complexidade de um determinado modelo a utilizar para representar o dado depende do quão complexa é a forma em que o dado está representado. Para os casos de dados estruturados, há toda uma tecnologia desenvolvida e dominada que não requer maiores esforços computacionais. Portanto, um modelo que consiste em valor-atributo, nome-atributo dificulta a representação em ambientes baseados em relacionamentos encontrados em sistemas de arquivos como os existentes na Internet, que são heterogêneos. Para estes casos, o modelo de dados complexo é mais apropriado. Esse modelo é baseado em grafos. Quando se consegue representar estes dados através de grafos, torna-se mais fácil o acesso e manuseio destes, pois algoritmos para navegar em grafos já existem e são amplamente conhecidos e 39 estudados. Sendo assim, sua adoção facilita sobremaneira o desenvolvimento de sistemas automatizados. 2.8 ONTOLOGIAS Um grande desafio para a área de Tecnologia da Informação é o de propiciar às organizações, ferramentas e mecanismos que, além da geração, armazenamento e recuperação eficaz das informações, garantam a formação de comunidades de trabalho em torno de conceitos que transcendam as unidades de negócio e propiciem a unificação em torno de um arcabouço de conhecimento organizacional, bem como que contribuam para a formação de comunidades de trabalho. Para tornar possível esta realidade, novos elementos entram em cena para. Um deles é o conceito de Domínio do Problema. Para (ARANGO and PRIETODÍAZ 1994), o domínio do problema representa um conjunto de itens de informação presentes em um certo contexto do mundo real, inter-relacionados de forma bastante coesa, e que desperta o interesse de uma certa comunidade. Tendo presente a definição acima, o elemento substancial do domínio do problema é o conhecimento. Ele dá sustentação aos conceitos que dele recebem base para se manterem presentes e ativos. O conhecimento está presente nas pessoas que integram as organizações. Na medida que a organização interage com as pessoas e estas entre si na mesma organização, o conhecimento vai-se explicitando e formando o valor intelectual da mesma. Por outro lado, é necessário considerar que as pessoas são diferentes, pensam e se comportam diferentemente. Neste sentido, segundo Alves (2002), as ferramentas tecnológicas de suporte ao conhecimento devem ser flexíveis e de fácil utilização, dando a maior autonomia possível aos membros das comunidades de trabalho, com um mínimo de interferência da área. As tecnologias úteis para a gestão do conhecimento são aquelas que permitem criar redes globais para o compartilhamento de conhecimentos e assim favorecer a criação de bases de conhecimentos compartilhadas. Para tanto, é necessário identificar e modelar domínios de conhecimento para que sejam compartilhados. A formalização do conhecimento começa com uma conceituação. Segundo Guizzardi et al. (2002), a conceituação “consiste num conjunto de entidades sobre o qual o conheci- 40 mento é expresso bem como a relação entre estas entidades. A explicação desta conceituação é chamada de Ontologia. Uma Ontologia consiste de termos, suas definições e seus axiomas”. Segundo (FERREIRA 1999), ontologia é substantivo feminino a deriva do grego ont(o) + log(o) + ia – que, pode significar entes tomados como objetos de conhecimento ou estudo filosófico dos entes, ou ainda investigação dos conceitos que permitem determinar as modalidades ônticas. De acordo com Kraemer et al. (2005), a ontologia estuda, “a essência dos entes ou seres antes de serem transformados em conceitos das ciências e depois que nossa experiência sofreu o espanto, o estranhamento de que eles sejam ou não como parecem.” No campo da Inteligência Artificial, segundo Uschold “ontologia é o termo usado para compartilhamento do entendimento de algum domínio de conhecimento usado para resolver um problema de compartilhamento do sistema” (USCHOLD apud (KRAEMER, CARVALHO et al. 2004). Com esta abordagem, pode-se entender ainda uma ontologia como sendo um conjunto de termos que descrevem um domínio, estruturado hierarquicamente, podendo ser usado para uma base de conhecimento. A linha básica de pesquisas em I.A. tem descrito ao longo dos anos uma trajetória que evidencia a atenção que esta área do conhecimento atribui a simular inteligência através de programas de computadores, cuja característica principal é o conhecimento e a sua representação. Segundo Branchman, a maioria dos trabalhos em I.A. estão baseados na crença de que os sistemas inteligentes podem ser construídos do explícito, base de conhecimento declarativo, que por sua vez são operadores gerais, mecanismos de raciocínio formal. Esta hipótese fundamental de I.A. significa que a representação de conhecimento e o raciocínio (o estudo de maneiras formais de extração de informações do conhecimento representado simbolicamente), é de central importância para a área (BRANCHMAN apud CASTRO, 2000). 2.8.1 Aplicações As ontologias têm aplicação na solução de compartilhamento de conhecimentos, no aumento da clareza no nível de comunicação em ambientes colaborativos, na minimização das dificuldades em encontrar as necessidades de um sistema e na definição clara de suas especificações. Permitem também definição clara de métodos de modelagem, estabelecendo 41 paradigmas, propiciando maior clareza no entendimento e facilitando a inter-operabilidade, o potencial para reusabilidade e o compartilhamento de conhecimentos. A utilização de ontologias reduz ou elimina questões vinculadas às terminologias ou aos conceitos pouco claros e favorece a explicitação e compartilhamento de conceitos, à medida que são apresentados de forma clara e unívoca. As ontologias são mas bem indicadas para utilização em aplicações que envolvam comunicação entre pessoas e organizações, em engenharia de sistemas, pela capacidade de favorecer a reusabilidade de componentes, confiabilidade e especificação. Na aplicação em comunicações entre pessoas e organizações, as ontologias favorecem a redução de conceitos e terminologias confusas, facilitando o entendimento. Neste sentido, caracterizam aplicações deste tipo: modelos normativos; redes de relacionamento; consistência e falta de ambigüidade; e usuários interagindo entre si, integrando perspectivas diferentes. O esquema abaixo representa a aplicação de Ontologias em interoperabilidade atuando como uma estrutura inter-língua. As siglas PT, ING, FR e JP signifiocam, respectivamente, português, inglês, francês e japonês. Figura 2.9: Aplicação de ontologia em interoperabilidade. Na engenharia de sistemas, as ontologias são utilizadas para favorecer o desenvolvimento de sistemas, ao permitirem o aperfeiçoamento da comunicação no ambiente colaborativo, inerente ao desenvolvimento do trabalho. Assim, permitem a representação de um domínio do conhecimento bem como de todos os elementos que o integram, a especificação, a confiabilidade e a reusabilidade. Muito embora a palavra ontologia possa denotar uma teoria sobre a natureza ou existência do ser, ela pode ser interpretada em I. A., segundo Gruber (apud FREITAS, 2004) como “o conjunto de entidades com suas relações, restrições, axiomas e vocabulário”. Para o autor, “uma ontologia define o ato de conceituar acerca do domínio estudado para tal fim”. 42 Geralmente, uma ontologia é organizada a partir da hierarquia de conceito (taxonomia). Pode-se considerar a ontologia como sendo “a materialização do conhecimento” (FREITAS 2004) pelo fato de, em um nível ideal, não refletir nenhum formalismo específico e de freqüentemente representar um vocabulário comum entre os sistemas e os usuários. Studer et al. (1998) consideram que “uma ontologia é uma especificação explícita e formal de uma conceituação compartilhada”. Entendem-se por especificação explícita, as definições de conceitos, instâncias, relações, restrições e axiomas. Por especificação formal, entendem-se as definições que contêm uma declaração definida, sendo assim compreensíveis para agentes e sistemas. O aspecto de conceituação compartilhada está contemplado em um modelo abstrato de uma área de conhecimento ou de um universo limitado de discurso. O compartilhamento, por se tratar de um conhecimento consensual, implica o uso de uma terminologia comum da área modelada, ou acordada entre os agentes envolvidos no processo (FREITAS and KLADIS 1995). As ontologias pré-construídas com base em domínios restritos têm tido bastante reutilização e podem se tornar representantes de uma função fundamental, como fornecedoras de conhecimento para a inferência dinâmica realizada por agentes. 2.8.2 Tipos de Ontologias O tipo de ontologia depende do grau de abrangência que assume o delineamento da aplicação (GOMESZ-PERES 1994). Assim, segundo (FREITAS 2004), pode-se classificar as ontologias em 7 tipos: a) Ontologias de representação: definem as primitivas de representação – como frames, axiomas, atributos e outros – de forma declarativa. Essa idéia abstrai os formalismos de representação, porém traz desvantagens (FREITAS 2004); b) Ontologias gerais (ou de topo): trazem definições abstratas necessárias para a compreensão de aspectos do mundo, como tempo, processos, papéis, espaço, seres, coisas etc; c) Ontologias centrais (core ontologies) ou genéricas de domínio: definem os ramos de estudo de uma área/ou conhecimento mais genérico e abstratos desta área. (VALENTE and BREUKER 1996) criaram uma ontologia central do Direito, que inclui conhecimentos normativos, de responsabilidade, reativos, de gerencias legais, comportamentos permitidos etc. A ontologia agrupou esses conceitos e conhecimentos para servir de base para a construção de ontologias de ramos mais específicos do Direito, como direito tributário, de família e outros. 43 d) Ontologias de domínio: tratam de um domínio mais específico de uma área genérica de conhecimento, como direito tributário, microbiologia etc. e) Ontologias de aplicação: procuram dar solução a problemas específicos de um determinado domínio. Para exemplificar, uma ontologia de domínio de cardiologia. Normalmente, ontologias de aplicação referenciam termos de uma ontologia de domínio. As ontologias acima citadas foram apresentadas em ordem decrescente de genericidade. A construção de uma aplicação quase nunca utiliza todos os tipos de ontologia. Deve-se cuidar para que se mantenha a ontologia construída com capacidade de reusabilidade. Para tanto, deve-se ficar atento para que uma ontologia em um nível acima da ontologia em uso esteja ligada a esta ou evitar relacionamentos com uma ontologia específica. Quanto ao teor da ontologia, pode-se aplicar outra classificação. a) Ontologia de tarefas: descreve tarefas de um determinado domínio, como, por exemplo, processos, planos, metas, escalonamentos etc. Esta tem uma visão mais funcional, embora declarativa, de um domínio. b) Ontologia de domínio propriamente dita: tem uma visão mais epistemológica do domínio, focando nos conceitos e objetos do universo de discurso. 2.8.3 Engenharia de Ontologias A concepção e construção de ontologias necessita ser conduzida como um outro projeto qualquer. Deste o início da atividade, há que se ter presente o objetivo, o plano do projeto, definindo com clareza as etapas a serem vencidas, e uma metodologia que favoreça o controle e manutenção de cada etapa a ser executada. Na engenharia de software, estabelecem-se alguns critérios que também são válidos para o desenvolvimento de ontologias. Estas devem ter eficiência, legibilidade, portabilidade, extensibilidade, interoperabilidade e possibilitar o reuso. Para tanto, o projeto em foco deverá basear-se em seu futuro emprego, evitando-se considerar apenas os aspectos filosóficos do conhecimento acerca do domínio representado. Do ponto de vista da engenharia, o projeto de construção de uma ontologia deve gerar como conseqüência um produto ou serviço. Durante esta etapa serão tomadas decisões de projetos. Para (GRUBER 1995), as decisões devem primordialmente considerar: a) Clareza: todas as definições devem ser claras e objetivas. Para tanto uma definição, sempre que possível deve ser declarada através de axiomas lógicos. Deve-se tomar cuidado 44 para que esta definição seja completa com condições necessárias e suficientes. Isso é melhor que uma definição parcial, com condições de apenas necessárias ou suficientes. É importante que todas as definições sejam registradas em linguagem natural. b) Extensibilidade: O vocabulário existente, a partir do qual se elaboram os termos a serem definidos não pode estabelecer contradição se novos termos tiverem que ser definidos, gerando a necessidade de rever as definições previamente existentes. Isto é, deverá possibilitar a inserção de novos termos baseados no vocabulário existente, sem que haja a necessidade de modificar o que anteriormente já foi definido para o projeto como um todo. c) Coerência: Haverá incoerência na ontologia em construção se uma sentença inferida a partir de um axioma contradisser uma definição ou exemplo dado informalmente. Esta contradição fará com que o projeto tenha aplicações circunstanciais e restritas, contrariando o quesito Coerência. d) Minimização com o compromisso de implantação: O nível simbólico ou de codificação não deve interferir na conceituação. Esta deve ser especificada em nível do conhecimento, sem depender de uma codificação em particular. e) Minimização do compromisso com ontologia: Com o objetivo de facilitar o reuso, apenas o conhecimento essencial deve ser incluído. Uma ontologia deve requerer o mínimo suficiente para dar suporte às suas atividades de compartilhamento e de conhecimento desejadas. Para tanto, deve-se ter presente a necessidade de gerar a menor teoria possível acerca de cada conceito. O projeto deve permitir também a criação de novos conceitos, mais especializados ou estendidos. A metodologia para a construção de ontologias começa em 1995, com a metodologia de Uschold e King intitulada “Enterprise Ontology”. Ela trata de modelagem de processos empresariais, e o mais importante sistema desenvolvido por esta metodologia é o “Enterprise Toolset”, que usa arquitetura em agentes para integrar ferramentas avulsas em um conjunto “plug-and-play” (JADE 2004). Também no ano de 1995, surge a metodologia entitulada “TOVE Project Ontology”, de Guininger e Fox, que se baseia no modelamento dos processos e atividades comerciais. Essa metodologia tem importantes aplicações no “Enterprise Design Workbench”, sendo utilizada para explorar os vários processos de uma empresa e compará-los com as outras. Também é usada no “Integrated Supply Chain Management Project Agents”, utilizado para organizar a cadeia de fornecedores numa rede de empresas em cooperação. 45 Em 1996 Berneras propõe uma metodologia para integrar ontologias existentes para construção de uma nova metodologia. A metodologia apresentada identifica especialmente quais são as atividades necessárias para a construção de uma ontologia. Algumas das ontologias mais importantes que foram construídas com a metodologia foram: Chemicals, para a área de elementos químicos e estruturas cristalinas; KA Ontology, própria para ser utilizada pelas unidades de pesquisa, cientistas, universidades e por todos que lidam com aquisição de conhecimentos; The Reference-Ontology, que descreve os relacionamentos entre ontologias a partir de uma organização lógica, como um catálogo de páginas amarelas da Ontologia. Recentemente, surgiu a metodologia Sensus. Trata-se de uma ontologia que usa linguagem natural na definição de uma estrutura conceitual para o desenvolvimento de tradutores automatizados. Esta aplicação utiliza duas Ontologias prontas e as categorias semânticas de um dicionário em inglês. Abaixo se apresenta uma visão esquemática de parte da Ontologia construída no projeto KA, com o objetivo de criar uma organização virtual de pesquisadores, universidades, projetos e publicações entre outros itens, envolvidos como a sub-área de Inteligência Artificial conhecida como Aquisição de Conhecimento. Para exemplificar apresenta-se a definição da classe Documento Científico na Fig. 2.10. Documento científico Ano de publicação Instância Ano Palavra-chave String URL da Publicação String Título da publicação String ... Figura 2.10: Parte dos atributos da Classe Documento Científico (FREITAS) 46 A Fig. 2.11 representa uma parte da Ontologia, salientando as Classes, Eventos e Publicações, bem como suas subclasses e heranças. Figura 2.11: Parte da Ontologia KA (FREITAS 2004) 2.8.4 Metodologias de desenvolvimento de ontologias Com relação à ontologia e as metodologias de aplicação, um ponto a ser considerado é que os modelos apresentados ainda não demonstram um processo suficientemente estruturado a ponto de suportar a construção de ontologias com a formalidade de uma disciplina de engenharia. Falbo et al. (1998) descrevem uma metodologia que une as principais características das metodologias existentes. Discutem também as várias atividades do processo de construção da ontologias e apresentam orientações sobre como proceder durante o desenvolvimento e execução de um projeto. Com o objetivo de estruturar uma metodologia para avaliação da qualidade e documentação do desenvolvimento de uma ontologia, é importante considerar que o processo como um todo pode ser visto como macroatividades. Estas macroatividades podem ser desdobradas em tarefas e assim se torna mais acessível o domínio de todo o projeto 47 envolvendo a construção da ontologia. Segundo (GUIZZARDI 2000/4), “as atividades descritas são organizadas em um ciclo altamente interativo no qual os processos de avaliação da qualidade e documentação se desenvolvem em atividades macro”. As atividades macro propostas por Guizzardi são: • Identificação de propósito e especificação de requisitos; • Captura da ontologia; • Formalização da ontologia; • Integração com ontologias existentes; • Avaliação; • Documentação. Outra metodologia de desenvolvimento é apresentada por (FREITAS 2004). Ambos os autores apresentam a necessidade de aperfeiçoamento nas metodologias, que são inseridas em um processo iterativo que requer revisões constantes. Outro fator a ser observado é que as metodologias propostas apresentam critérios de desenvolvimento similares aos da engenharia de software, a saber: Especificação, conceitualização e implementação (GÓMEZ-PÉREZ, FERNANDEZ et al. 1996). Para (FREITAS 2004), o desenvolvimento de ontologias envolve duas etapas, o desenvolvimento propriamente dito e atividades que ele denomina de suporte. As atividades de desenvolvimento compreendem: • Especificação; • Conceitualização; • Implementação. As atividades de suportem compreendem: • Aquisição, que corresponde à elicitação de conhecimentos necessários para a construção da ontologia; • Avaliação, para verificar se a ontologia atende aos requisitos e propósitos planejados. • Documentação, que envolve todo o registro de requisitos, cenários e motivação, as descrições textuais da conceituação, a ontologia forma e os critérios de projeto adotados. • Integração com ontologias existentes, que é executada durante a fase de formalização ou de captura da ontologia em construção. Nesta etapa, deve-se sugerir ou avaliar a possibilidade de integrá-la com outras ontologias já existentes. 48 A Fig. 2.12 apresenta um modelo esquemático que representa o acima exposto: Figura 2.12: Etapas de desenvolvimento e sua relação com as atividades de suporte (FREITAS 2004) Com relação ao desenvolvimento do projeto de uma ontologia, apresentam-se as seguintes fases a serem consideradas: • Especificação – determina o propósito e escopo da ontologia a ser confeccionada. Esta fase considera uma análise preliminar, para evitar a aplicação de recursos em atividades desnecessárias ou equivocadas. Durante esta fase, deve-se considerar se é possível, necessário ou adequado o reuso de ontologias já existentes. Com relação ao escopo, indica-se a elaboração de uma lista questões de competência (USCHOLD and M. 1996). Essa lista servirá para avaliar a ontologia durante o desenvolvimento. Neste sentido, a questão “até que ponto jornais científicos são considerados eventos científicos?” pode ser considerada um exemplo de avaliação de competência. • Fase de conceitualização – é a fase mais crítica, pois é a mais ligada à definição do conhecimento. Nela ocorrem a maior parte das atividades de suporte de aquisição e avaliação. Nesta fase, alguns procedimentos retirados do tutorial do Protégé (NOY and C.D. 1997) devem ser tidos em conta. São eles: o Enumerar os temos do domínio, sem se preocupar com similaridades, repetições e relação entre eles. Costuma-se usar processo de brain storming para este fim. 49 o Definir as classes. É necessário não confundir nomes de um conceito com o próprio conceito. Existem até sistemas que permitem a inclusão de sinônimos e termos associados a conceitos de uma ontologia; o Definir a hierarquia das classes. Este passo ocorre juntamente com o anterior. Constitui o passo mais precioso do desenvolvimento, devido às sutilezas das hierarquias. A clareza e consistência deve ser preocupação constante quando se definem as classes e subclasses. Por vezes uma classe pode apresentar muitas subclasses. Neste caso, pode-se lançar mão de classes intermediárias. o Definir os atributos e facetas de cada classe. Por ser o responsável pela definição de novas classes, este passo deve interagir com os dois anteriores, exceto em classes terminológicas, como no caso de aplicações em medicina. o Criar as instâncias, tendo como lema que são os conceitos mais específicos de uma ontologia, isto é, os elementos separados pelo menor escopo possível, sem perder a identidade do elemento (granulidade). Se estes conceitos possuem uma hierarquia natural, é necessário revisar a definição das classes. o Convencionar nomes. Estes devem ser facilmente compreensíveis, recomendando-se convenções diferentes para classes, atributos e instâncias. As abreviações que possam confundir os usuários devem ser evitadas. É importante considerar que a ontologia deve ser legível para os que a consultam. • Fase de implementação – transformará a ontologia em algo computável. Fará com que o conhecimento nela representado possa contar com o concurso de máquina para ser identificado e considerado para vários fins. Esta etapa corresponde à geração de arquivos em uma determinada linguagem de representação do conhecimento. • Fase de avaliação – Nesta fase, verifica-se se a ontologia atende aos requisitos especificados na fase de especificação. Mudanças na ontologia podem ocorrer a partir da interação destas duas últimas fases, o que é normal e atende ao caráter iterativo da implantação. 50 2.8.5 Benefícios na utilização de ontologias Considerando a necessidade de ampliar a capacidade das organizações e grupos de pessoas de gerirem conhecimentos e que a ontologia efetivamente pode representar os conceitos e demais elementos presentes em um domínio de conhecimento, apontam-se como benefícios os abaixo citados. • A possibilidade de reuso de ontologias pelos desenvolvedores, mesmo com adaptações e extensões. A construção de bases de conhecimento redunda na tarefa mais cara de um projeto de sistemas especialistas e/ou agentes. Com a possibilidade de reuso, esta fase pode ter significativa redução de custos. Outro benefício é a possibilidade de realizar consultas, comparações e checagem de consistência, permitindo a aplicação da ontologia para recuperação de informações e conhecimentos sob conotação de indexação semântica. • O desenvolvimento de ontologias permite que se lance mão de “ontologias de prateleira” para uso e reuso por pessoas e agentes. Algumas ontologias, já com alto grau de maturidade, em certos casos com mais de 2.000 definições (FREITAS 2004), incluem metadados de imagens de satélites e integração de bases de dados de genoma, catálogos de produtos, osciloscópio, robótica, semicondutores, terminologia médica, etc. • Outro benefício da utilização de ontologias é a aplicação desta tecnologia em tradução para diversas línguas e formalismos de representação do conhecimento. Esta possibilidade concretiza um ideal perseguido por gerações de pesquisadores de Inteligência Artificial. A ontologia favorece a reutilização de conhecimentos. • Manutenção da integridade do conhecimento compartilhado entre grupos de empresas ou de pessoas, através do acesso on-line a servidores de ontologias, capazes de armazenar milhares de classes e instâncias. • A possibilidade de comunicação de agentes diferentes, através do estabelecimento de um mapeamento entre formalismos de conhecimentos diferentes, mediante a aplicação de interfaces inter-operáveis, permitindo o acesso comum a dois formalismos diferentes. 51 2.8.6 Projeto e desenvolvimento de Ontologias. O consorcio W3C, através do Guia (PROTÉGÉ 2004) apresenta uma metodologia para o desenvolvimento de ontologias e o faz através do desenvolvimento de uma ontologia para representar o domínio do conhecimento em uma aplicação de definição de tipos de base, cobertura e os ingredientes que envolvem a elaboração de pizzas. Outras aplicações com a mesma metodologia representam o domínio do conhecimento que envolve vinhos e os pratos que combinam com cada tipo de vinho. Essas ontologias podem ser localizadas nos endereços http://www.co-ode.org e http://ontolingua.stanford.edu/doc/chimaera/ontologies/wines.daml, respectivamente. A metodologia descrita no documento “A practical guide to building OWL ontologies with the protege-OWL plugin, apresenta as seguintes etapas. O desenvolvimento de uma ontologia é gerado pela necessidade de compartilhamento de entendimentos comuns sobre uma estrutura de informação entre pessoas e agentes de softwares, para disponibilizar recursos de conhecimento sobre um domínio, para fazer suposições sobre um determinado domínio, para distinguir domínios de conhecimento através de conhecimentos operacionais ou para analisar domínios de conhecimento. Para o processo de desenvolvimento de uma ontologia a posição dos pesquisadores converge nas seguintes afirmações: • Não há um único caminho correto para fazer a modelagem do domínio; há vários caminhos possíveis. A melhor solução quase sempre depende da aplicação que se possa ter em mente e do alcance da mesma. • O desenvolvimento de uma ontologia quase sempre obedece a um processo interativo. • Conceitos em uma ontologia devem ser como relacionamentos entre objetos de um determinado domínio. Estes serão, na sua maioria, substantivos ou verbos em sentenças que descrevem o domínio em questão. Para o caso em questão, seguir-se-á a metodologia proposta por (HORRIDGE 2004), que propõe um conjunto de sete passos. • Passo 1 – Determine o domínio e o escopo da ontologia. Os autores sugerem iniciar pela definição do domínio e do escopo da ontologia. Estas definições podem ser facilitadas com a resposta às seguintes perguntas: o Que domínio a ontologia deverá contemplar ou considerar? o Para que estamos desenvolvendo a ontologia? 52 o Que tipos de questionamentos ou informações a ontologia deve responder? o Como será a utilização e a manutenção da ontologia? Estas perguntas devem durar enquanto se estiver na fase de definição e entendimento do domínio e do escopo que a ontologia deverá atender. • Passo 2 – Considere a reutilização de ontologias existentes. É importante considerar que outra pessoa já pode ter feito um trabalho com ontologias no mesmo enfoque. Neste caso, o refinamento da ontologia existente pode atender a necessidade que se tenha e assim economizar recursos. Existem vários servidores de ontologias e projetos que as utilizam. Uma pesquisa nesses projetos pode favorecer a identificação e o reuso de ontologias. Existem várias bibliotecas de ontologias que podem ser acessadas. Um exemplo está no endereço: “http://www.ksl.stanford.edu/software/ontolingua” • Passo 3 – Enumere importantes condições para a ontologia. Que questões gostaríamos de apresentar para o usuário da ontologia, que pontos importantes ele poderia obter ou oferecer com a utilização da ontologia? Neste sentido, o Sobre quais questões gostaria de falar com eles? o Que propriedades dessas condições tem-se que considerar? o Que propriedades têm as condições apresentadas pela ontologia? o O que se poderia afirmar a respeito das condições presentes na ontologia desenvolvida, com relação ao domínio do qual ela faz parte? • Passo 4 – Defina a classe e suas hierarquias. Existem diversas possibilidades para desenvolver uma hierarquia de classes. No desenvolvimento top-down, o processo inicia-se com a definição dos conceitos mais gerais e depois parte-se para os mais específicos. No desenvolvimento bottom-up, segue-se o caminho oposto, a partir do específico chega-se ao conceito geral. É possível também a combinação dos dois modelos anteriores, caminhando ora no sentido do específico para o genérico, ora no sentido do genérico para o específico. Com base na lista criada no passo anterior, organizam-se os elementos identificados e estabelece-se a hierarquia através de taxonomias. Sendo assim, se um conjunto de elementos em A tem características que estão presentes na classe B, então a classe A será uma superclasse da classe B. • Passo 5 – Defina as propriedades das classes – slots. Somente a classe não é o suficiente para disponibilizar informações para responder a questões especificas 53 definidas no passo 1. Na medida que se define alguma classe, deve-se descrever a estrutura interna do conceito representado por essa classe. • Passo 6 – Defina as facetas do slots. Os slots podem ter diferentes facetas, descrevendo diferentes tipos de valores, valores permitidos, número de valores e outras características que um slot pode ter. Com relação à cardinalidade, um slot pode ter cardinalidade simples, permitindo um valor no máximo, ou cardinalidade múltipla, permitindo vários valores. Com relação aos tipos de valores do slot, estes podem ser string, número, booleano, enumerado ou instância. Para definir um slot, além da definição dos elementos acima citados, necessita-se definir também o domínio e a imagem do slot (HORRIDGE 2004). • Passo 7 – Crie instancias. O último passo é criar as instâncias individuais das classes. Definir as instâncias individuais de uma classe requer, primeiramente escolher uma classe, depois criar uma instância individual para representar um tipo especifico de objeto e por último preencher os valores do slot. Com a utilização de ontologias, conhecimentos podem ser mais explicitados permitindo maior compreensão dos conceitos intrínsecos, bem como compartilhamento e trabalhos colaborativos na construção destes conhecimentos. A Internet deverá ter nova dimensão com a aplicação de ontologias. A estrutura ontológica, entre outros benefícios, permite a inserção de conotação semântica no processamento da informação. Isto permite considerar um domínio de conhecimento na gestão do conhecimento e utilizar computadores para a utilização desses conhecimentos em aplicações de diversas características e objetivos. Essa característica dotará a Internet de habilidades semânticas, aperfeiçoando seus mecanismos de busca. Segundo Noy e Hafner (1997), para vários fins, pode-se desenvolver projetos de ontologia. Pode-se utilizar ontologias com forma de representar um domínio de conhecimento para compartilhá-lo com uma comunidade interessada, para explicitar fatos consensuais, como forma de separar o domínio do conhecimento do conhecimento operacional, para estabelecer análise sobre um determinado domínio, para reutilização da modelagem de um domínio, ou para tornar disponível e compartilhar estruturas de informação entre pessoas ou disponibilizar para manuseio por agentes presentes em ambientes computacionais. As ontologias ganham cada vez mais espaço nas mais variadas áreas do conhecimento científico. Várias comunidades científicas utilizam ontologias em suas aplicações. Em Ciência da Computação, as ontologias estão sendo utilizadas em aplicações relacionadas à melhoria da 54 eficiência na recuperação de informação, através de estudos e utilização de dados sobre os dados. Esse processo é também conhecido como análise de metadados. Na área de Inteligência Artificial, as ontologias estão sendo aplicadas ao desenvolvimento de sistemas baseados em conhecimento. Nas aplicações vinculadas ao estudo das linguagens naturais, elas estão sendo aplicadas à caracterização do sentido e do significado de palavras. Em estudos sobre recuperação de informações, as ontologias estão sendo utilizadas para permitir abordagens semânticas. E nos estudos sobre banco de dados, aplicam-se ontologias como esquema conceitual e na busca de interoperabilidade semântica. Vários grupos no mundo estão trabalhando para definir um conjunto de preceitos metodológicos para a construção de ontologias. Estes esforços apresentam resultados através da criação de várias metodologias para a construção de ontologias. O quadro abaixo apresenta um estudo realizado por (CORCHO, FERNÁNDEZ-LÓPEZ et al. 2001) sobre os vários tipos de metodologias existentes atualmente. Quadro 2.3: Metodologias para construção de Ontologias Sigla Descrição CO4 Permite que o conhecimento introduzido em bases de conhecimentos seja discutido por vários usuários. O conhecimento somente é aceito quando ratificado por todos. Através do compartilhamento da visão conceitual expressa na ontologia, é possível discutir o conhecimento candidato e inserilo com um grau de aperfeiçoamento, fruto da contribuição de toda comunidade envolvida. Quando uma alteração é proposta, todos são notificados, e o processo de discussão e aperfeiçoamento se repete. Cyc Quando um nível de conhecimento é alcançado pela ontologia, através de codificação de conhecimentos das fontes, utilizam-se ferramentas de linguagem natural para obter um novo conhecimento. (LENAT E GUHA, 1990) Gruninger Metodologia que utiliza linguagem natural para determinar o escopo de uma ontologia, através de identificação de cenários de uso de uma ontologia., também extrai dados sobre conceitos, propriedades, relações e axiomas, os quais são formalmente definidos em Prolog (GRUNINGER E FOX, 1995) (KA)2 Utilizando ontologias definidas por comunidade integrada por pessoas de diferentes localidades, modelam-se formas de aquisição do conhecimento. Para coordenar as atividades, bem como as comunicações entre os membros da comunidade, são utilizados agentes inteligentes.(KIETZ et al., 2000) 55 KACTUS Trata-se de uma metodologia que, utilizando recursividade, apresenta uma proposta inicial para uma base de conhecimento. Através da generalização de uma base inicial, atende-se a necessidade de uma nova base de domínio similar. A generalização da ontologia é uma conseqüência do aumento do número de aplicações (BERNARAS et al., 1996) Metontology Com base em preceitos de reengenharia, constrói uma ontologia sobre outra ontologia. A construção utiliza o conhecimento do domínio. São atividades principais a especificação, a formalização, a conceitualização, a implementação e a manutenção. (FERNÁNDEZ-LOPEZ et al., 1999) Maedche É convertida em modelo uma ontologia que é genérica. A partir das fontes disponíveis, especificam-se textos e se obtêm conceitos do domínio com base nas fontes disponíveis. Removem-se conceitos genéricos, de maneira que apenas os conceitos específicos do domínio permaneçam. A estrutura de conceitos da ontologia está estabelecida e obtêm-se as relações. Novas relações conceituais são utilizadas com base em aprendizado (KIETZ et al., 2000). On-ToKnowledge Através da identificação de metas para as ferramentas de Gestão do Conhecimento, utiliza cenários e contribuições dos provedores e dos clientes de informação da organização. Auxilia na formação de conceitos na organização (STAAB et al , 2001). Sensus Através da identificação de termos relevantes para o domínio, os quais são ligados a outras ontologias mais abrangentes, são selecionados os termos relevantes, e um algoritmo monta a estrutura hierárquica do domínio. Desta forma, a abordagem deriva ontologias a partir de outras existentes (SWARTOUT et al., 1996) Unschold Identifica o propósito, os conceitos e o relacionamento entre eles. Também identifica os termos utilizados para codificar a ontologia e, em seguida, documentá-la (UNSCHOLD E KING, 1996) 2.8.7 Ferramentas para a construção de ontologias. Existem várias ferramentas para a construção de ontologias. A maioria delas é fruto de trabalho de cooperação desenvolvido em várias comunidades científicas distribuídas pelo planeta. A construção de uma ontologia requer canalização de muitos recursos. A ajuda que as ferramentas de desenvolvimento oferecem facilita sobremaneira o desenvolvimento das ontologias. No Quadro 2.4, apresenta-se uma relação das principais ferramentas encontradas na bibliografia. 56 Quadro 2.4: Principais ferramentas para construção de ontologias Sigla Descrição IKARUS (Intelligent Knowledge Acquisition and Retrieval Universal System) Através do ambiente Web, Utiliza uma representação hierárquica gráfica que permite herança múltipla. Com predicado, sintaxe e semântica definidos ou com fragmentos sem estrutura, representam-se as declarações que contêm as informações (SKUCE, 1996). APECKS (Adaptive Presentation Environment for Collaborative Knowledge Structuring) Trata-se de um servidor de ontologia que permite, mediante um trabalho cooperativo, a criação de ontologias pessoais pelos próprios usuários. Através da comparação entre elas é possível discutir diferenças e similaridades (TENNISON E SHADBOLT, 1998). CODE4 (Conceptually Oriented Description Environment) É uma ferramenta de propósito geral, com interface gráfica de fácil utilização, um modo de hipertexto para navegação, e utilitário para leitura de documentos e gerenciamento lexical (SKUCE, 1995). GKB-Editor Ferramenta suportada por sistema de representação baseado em (Generic Knowledge Base frames para navegação e edição de ontologias. Dispõe de Editor) interface gráfica através da qual o usuário pode editar diretamente a base de conhecimento e selecionar a parte que é de seu interesse (PALEY E KARP, 1997). JOE (Java Ontology Editor) Esta ferramenta serve para construção e visualização de ontologias. Permite o gerenciamento do conhecimento em ambientes abertos, heterogêneos e com vários usuários. As ontologias podem ser visualizadas através de diagramas de entidades e relacionamentos, mediante de ferramentas do MS Windows, ou como uma estrutura de arvores (MAHALINGAM EHUHNS, 1997). Ontolíngua Conjunto de serviços que permite a construção de ontologias compartilhadas entre grupos. Dá acesso a uma biblioteca de domínio, a tradutores para linguagens e a um editor para criar e navegar pela ontologia. Através de protocolos, editores remotos podem acessar e editar ontologias (FARQHAR et al., 1996). Ontosaurus Ferramenta constituída por dois módulos, um servidor de ontologia que utiliza LOOM para representação do conhecimento e um servidor de navegação por ontologia, que cria páginas HTML dinamicamente e apresenta a hierarquia da ontologia (SWARTOUD et al., 1996). 57 OilEdit Trata-se de um editor de ontologia de código aberto que permite construir ontologias utilizando a linguagem OIL. Não é um ambiente completo para o desenvolvimento de ontologias. Através da ferramenta FacCT, pode-se fazer a verificação da consistência e a classificação automática da ontologia (HORROCKS, SATTLER, TOBIES, 1999). OntoEdit É um ambiente gráfico para edição de ontologias que permite inspeção, navegação, codificação e alteração de ontologias. Com esta ferramenta, é possível armazenar o modelo conceitual utilizando-se um modelo de ontologia que pode ser mapeado em diferentes linguagens de representação. As ontologias podem ser armazenadas em bancos relacionais e podem ser implementadas em XML, Flogic, RDF´s, DAML+OIL (MAEDCHE et al., 2000). COM (Ontological Constraints Manager) Esta ferramenta verifica a consistência de ontologias através de axiomas ontológicos. Através de duas ferramentas de edição, permite a detecção de conflitos (KALFOGLOU el al, 2001). Protegé 2000 Trata-se de um ambiente interativo, de código aberto, para o projeto de ontologias. Oferece uma interface gráfica para criação e edição de ontologias e dispõe de uma arquitetura para a criação de ferramentas baseadas em conhecimentos. Através da modularidade da arquitetura, é possível a inserção de novos recursos (NOY et al., 2000). VOID Ambiente voltado para navegação, edição e gerenciamento de ontologias. Através de simulação, propicia o estudo de questões teóricas envolvendo o estudo de organização de bibliotecas de ontologias, bem como tradução entre diferentes formalismos (SCHREIBER et a., 1995). WebOnto Ferramenta que propicia a navegação, criação e edição de ontologias, representadas na linguagem de OCML. Permite o gerenciamento de ontologias por interface gráfica, a inspeção de elementos, a verificação e consistência da herança e o trabalho cooperativo. Possui uma biblioteca com mais de 100 ontologias (DOMINGUES, 2001). WebODE Ambiente para engenharia ontológica que dá suporte à maioria das atividades de desenvolvimento de ontologias. Para favorecer a integração com outros sistemas, fornece um API (application programming interface) que favorece a integração com outros sistemas; importa e exporta ontologias de linguagem de marcação (ARPÍREZ et al., 2001). 58 2.8.8 Linguagens para a construção de ontologias. Existem vários tipos de linguagens que podem ser utilizadas para a construção de ontologias. No Quadro 2.5, apresenta-se um conjunto delas. Sem querer ser exaustivo na listagem, apresentam-se algumas linguagens encontradas na literatura. Quadro 2.5: Tipos de linguagem para construção de ontologias. Nome Descrição CARIN Esta linguagem é resultado da combinação de Datalog (linguagem baseada em regras) e lógica descritiva ALN. Uma ontologia CARIN é constituída por dois componentes terminológicos, um conjunto de conceitos com declaração de inclusão e um conjunto de regras que utilizam estes conceitos (LEVY E ROUSET, 1996). CycL Linguagem formal cuja sintaxe é derivada da lógica de primeira ordem. Um vocabulário de termos (constantes semânticas, variáveis, números, seqüências de caracteres, etc) é combinado em expressões, sentenças e, finalmente, bases de conhecimentos (LENAT E GUHA, 1990). DAML + OIL Trata-se de uma linguagem semântica para Web que apresenta extensões para linguagens como DAML (DARP agente markup language), RDF e RDFS, através de primitivas de linguagem baseadas em linguagens lógicas. Permite representar conceitos, taxonomias, relações binárias e instâncias (HORROCKS et al, 2001). Flogic – Frame Logic Esta linguagem integra frames e lógicas de primeira ordem. Os aspectos estruturais da linguagem baseada em frames e orientada a objetos (identificação de objetos, herança, tipos polifórmicos, métodos de consulta, encapsulamentos, etc) são tratados de forma declarativa. Permite a representação de conceitos, taxonomias, relações binárias, funções, axiomas e regras (KIFER et al., 1990). GRAIL Especifica uma ontologia no domínio médico (GALEN). Trata-se de uma linguagem baseada em lógica descritiva, terminologicamente limitada, que permite a construção de hierarquias de primitivas e axiomas de inclusão de conceitos (LEVY E ROUSET, 1996). LOOM Esta linguagem, descendente da família KL-One (Knowledge Language One), é baseada em lógicas descritivas e regras de produção. Permite a representação de conceitos, taxonomias, relações n-áreas, funções, axiomas e regras de produção (BRILL, 1993). 59 Ontolingua Esta linguagem combina paradigmas das linguagens baseadas em frames e lógica de primeira ordem. Permite a representação de conceitos, taxonomia de conceitos, relação n-áreas, funções, axiomas, instâncias e procedimentos. Sua alta expressividade causa problemas no mecanismo de inferência (CHAUDHRI et al., 1998). OCML Esta linguagem permite a especificação de funções, relações e classes, instâncias e regras. É utilizada para aplicações em comércio eletrônico, em sistemas baseados em conhecimento, para gerenciamento de conhecimento e para desenvolvimento de ontologias. É aplicada em memória corporativa, medicina, ciências sociais, portais da Web e engenharia (DOMINGUE et al., 1999; CHAUDHRI et al., 1999). OML – Ontology Markup Language Trata-se de uma linguagem para especificação de ontologias, baseada em lógica descritiva e grafos conceituais. Permite a representação de conceitos organizados em taxonomias, relações e axiomas em lógica de primeira ordem (KENT, 1999). OIL É a precursora da DAML + OIL e a base para o projeto da linguagem para Web Semântica. Combina várias primitivas de modelagem das linguagens baseadas em frames com a semântica formal e serviços de inferência da lógica descritiva. Pode verificar classificação e taxonomias de conceitos (FENSEL et al, 2001). NKL Esta linguagem foi desenvolvida para descrever modelos semânticos para documentos multimídia. É baseada em frames e permite definir conceitos organizados em taxonomias e o relacionamento entre eles. Possui ainda uma sublinguagem para a construção de argumentos complexos (BERTINO et al., 1999). RDF – Resource Description Framework – RDFS(RDF sechema) Esta linguagem foi desenvolvida pelo consórcio W3 Consortium, tendo por objetivo a representação de conhecimento através da idéia de redes semânticas. É uma linguagem não muito expressiva, permitindo apenas a representação de conceitos, taxonomias de conceitos e relações binárias (LASSILA E SWICK, 1999). SHOE - Simple HTML Ontologu Extensions Esta linguagem utiliza extensões ao HTML, adicionando marcações para inserir dados semânticos em páginas Web. Permite representar conceitos, taxonomias, relações, instâncias e regras de dedução (HEFLIN E HENDLER, 2000). XOL Trata-se de um pequeno subconjunto de primitivas do protocolo OKBC. É uma linguagem restrita, na qual apenas conceitos, taxonomias e relações binárias podem ser especificadas. Não possui mecanismos de inferência e foi projetada para o intercâmbio de ontologias no domínio da biomédica (KARP, 1997). 60 Os projetos de desenvolvimento de ontologias obedecem a metodologias que devem ser atendidas com bastante critério. Este cuidado é elemento fundamental no sucesso do projeto. No Quadro 2.6, apresenta-se um sumário das principais diferenças entre algumas metodologias de desenvolvimento de ontologias. Quadro 2.6: Sumário das principais diferenças entre metodologias de desenvolvimento de ontologias Critérios Uschold & King Grüninger & Fox METHONTOLOGY Detalhamento da metodologia muito pouco pouco muito Recomendação de formalização nenhuma lógica nenhuma Estratégia para construção de aplicações independente da aplicação semi-dependente da aplicação independente da aplicação Estratégia para identificação de conceitos “middle-out” “middle-out” “middle-out” Ciclo de vida recomendado nenhum nenhum sim 2.8.9 Roteiro para desenvolvimento de uma ontologia Uma ontologia define um vocabulário comum para pesquisadores que necessitam compartilhar informações de um domínio. Isso inclui definição de motores para interpretação dos conceitos básicos no domínio e da relação entre eles. Para o caso em questão, seguir-se-á a metodologia proposta por (HORRIDGE 2004), que propõe um conjunto de sete passos, já apresentados anteriormente e repetidos aqui por comodidade: • Passo 1 – determinação do domínio e do escopo da ontologia. Os autores sugerem iniciar pela definição domínio e o escopo da ontologia. Estas definições podem ser facilitadas com a resposta as seguintes perguntas: o Que domínio a ontologia deverá contemplar ou considerar? o Para que estamos desenvolvendo a ontologia? 61 o Que tipos de questionamentos ou informações a ontologia deve responder? o Como será a utilização e a manutenção da ontologia? Estas perguntas devem durar enquanto se estiver na fase de definição e entendimento do domínio e do escopo que a ontologia deverá atender. • Passo 2 – Considere a reutilização de ontologias existentes. É importante considerar que outra pessoa já pode ter feito um trabalho com ontologias no mesmo enfoque. Nestes casos o refinamento da ontologia existente pode atender a necessidade que se tenha e assim economizar recursos. Existem vários servidores de ontologias e projetos que as utilizam. Uma pesquisa nestes projetos pode favorecer a identificação e o reuso de ontologias. Existem várias bibliotecas de ontologias que podem ser acessadas. Um exemplo está no endereço: “http://www.ksl.stanford.edu/software/ontolingua” . • Passo 3 – Enumere importantes condições para a ontologia. Que questões gostaríamos de apresentar para o usuário da ontologia, que pontos importantes ele poderia obter ou oferecer com a utilização da ontologia. Neste sentido, o Quais são as questões que gostaria de falar sobre eles? o Que propriedades estas condições têm que se deve considerar? o Que propriedades têm as condições apresentadas pela ontologia? o O que se poderia afirmar a respeito das condições presentes na ontologia desenvolvida, com relação ao domínio do qual ela faz parte? • Passo 4 – Definir a classe e suas hierarquias. Existem diversas possibilidades para desenvolver uma hierarquia de classes. Tpo-dows onde o desenvolvimento do processo inicia-se com a definição dos conceitos mais gerais e depois parte-se para os mais específicos. Bottom-up que segue o caminho oposto da anterior. A partir do específico chega-se ao conceito geral. E a combinação das duas anteriores, caminhando hora no sentido especifico para o genérico hora no sentido genérico para o específico. Com base na lista criada no passo anterior, se organiza os elementos identificados e estabelece-se a hierarquia através de taxonomias. Sendo assim se um conjunto de elemento em A tem características que estão presentes na classe B, então a classe a será uma superclasse da classe B. • Passo 5 – define as propriedades das classes – Slots. Somente a classe não é o suficiente para disponibilizar informações para responder a questões especificas 62 definidas no passo 1. Na medida em que se define algumas classes, deve-se descrever a estrutura interna do conceito representado por aquela classe. • Passo 6 – Define as facetas do slots - Os slotls podem ter diferentes facetas descrevendo diferentes tipos de valores, valores permitidos, numero de valores e outras características que um slot pode ter. Com relação a cardinalidade, um slot pode ter cardinalidade simples, permitindo um valor no máximo, ou cardinalidade múltipla, permitindo vários valores para o slot. Com relação aos tipos de valores do slot, estes podem ser do tipo string, numero, boolean, enumerado e tipo instancias. Para definir um slot além da definição dos elementos acima citados, necessita-se definir também o domínio e a imagem do slot. Este tema é discutido no paper (HORRIDGE 2004) • Passo 7 – Criar instancias – o ultimo passo é criar as instâncias individuais das classes. Definir as instâncias individuais de uma classe requer, primeiramente escolher uma classe, depois criar uma instância individual para representar um tipo especifico de objeto e, por último, preencher os valores do slot. As várias metodologias indicam a necessidade de pesquisar se não há alguma aplicação envolvendo o projeto em questão, para aplicar o reuso e assim ganhar tempo e recurso no desenvolvimento do projeto da ontologia. No Anexo I, apresentam-se endereços com catálogo mundial referente à maioria dos projetos envolvendo construção de ontologias. 2.9 O PROTÉGÉ Segundo a definição encontrada no site do aplicativo (http://protege.stanford.edu/), “o Protégé é um editor de ontologia de código aberto, de livre utilização. É também uma estrutura de base de conhecimentos”. O software foi desenvolvido pela Escola de Medicina da Universidade de Stanford, através da Stanford Medical Informatics. Esta organização conta com vários pesquisadores associados, bem como agências de pesquisas distribuídas no mundo todo. O Protégé é uma ferramenta gráfica que suporta as atividades de construção de uma ontologia. Trata-se de uma ferramenta Java, código aberto, que oferece uma arquitetura extensível para a construção de ferramentas de base de conhecimento personalizadas. Sob o enfoque do aplicativo em questão, a ontologia é considerada um domínio específico de 63 conhecimento. Os conceitos e seus atributos, bem como a relação entre estes conceitos, são representados como um conjunto de classes e slots. Partindo de metodologias propostas para a modelagem do domínio, utilizam-se grafos para representar as relações semânticas de hiponímia e meronímia. No Protégé, a relação de hiponímia se explicita através da utilização de classe e subclasse. Os slots permitem estabelecer a relação de meronímia. A ferramenta permite aos seus usuários construir ontologias, definir formulários para entrada de dados e inserir, consultar, alterar e excluir dados. Permite ainda a manutenção da ontologia através da alteração de classes e slots. Ela também é uma ferramenta gráfica que facilita a visão e compreensão da ontologia. Permite facilmente a inclusão de gráficos, tabelas, mídias como som e imagens, além de poder armazenar estes aplicativos em vários formatos, tais como OWL, RDF, XML e HTML. A Aplication Programming Interface – API ou a Interface de utilização do Protégé permite a utilização, acesso e visualização do conteúdo das bases de conhecimento criados no Protégé. A ferramenta apresenta três elementos básicos, através dos quais é possível construir a ontologia, definindo classes, subclasses e a relação entre elas. É possível também definir a forma através da qual o conteúdo das instâncias será apresentado, bem como incluir, consultar e modificar e excluir instâncias da ontologia. Os três elementos são: Guia Class, Guia Forms e Guia Instances. a) Guia Class A guia “Class” é um editor de ontologias que se pode utilizar para definir classes e hierarquia entre elas, slots, valores de restrição entre eles, bem como os relacionamentos entre estes vários elementos. 64 Na Fig. 2.13, apresenta-se o lay-out da guia “Class” Figura 2.13:Guia “Classes” do Protégé b) Guia “Forms” O guia “Forms” gera os formulários padrão para aquisição de instâncias base, através dos tipos e formas dos slots especificados pelo usuário. Através desse ambiente, é possível formatar a forma desejada para a inserção dos conteúdos das propriedades das instâncias. É possível alterar o formulário padrão reorganizando campos na tela, alterando tamanhos, títulos e outras propriedades do slot. 65 Na Fig. 2.14, apresenta-se o layout do guia “Forms”. Figura 2.14: Guia “Forms” do Protégé c) Guia “Instances” A Guia “Instances” é uma ferramenta de aquisição de conhecimento que se pode usar para adquirir instâncias para as classes definidas na ontologia. Através dela, pode-se inserir, consultar, alterar ou excluir uma instância. A interface em questão permite ainda a seleção das propriedades a serem apresentadas. 66 Na Fig. 2.15, apresenta-se o layout da interface Figura 2.21: Guia “Instances” do Protégé 67 Na Fig. 2.16, apresenta-se uma tela do Protégé representando vários elementos de uma estrutura de ontologia através das interfaces do Protégé Figura 2.22: Apresentação de elementos de uma ontologia no Protégé A descrição de cada elemento constitutivo destas interfaces, bem como sua forma de utilização, estão presentes no Anexo II e disponibilizados no site da ferramenta. 3 O MODELO PROPOSTO 3.1 CONDIÇÕES DE CONTORNO A implantação do modelo proposto requer condições preliminares, sem as quais várias etapas terão sua execução prejudicada, comprometendo o projeto como um todo. O projeto em questão necessita de um ambiente organizacional com maturidade na utilização de controles como fator essencial para acompanhar o desenvolvimento organizacional. É fundamental que a organização tenha adquirido habilidades e competências básicas neste sentido para poder dar suporte às demandas que o projeto apresenta. Outro fator fundamental é a identificação e escolha de uma estratégia de competitividade. O modelo proposto necessita que a organização tenha uma estratégia de competitividade e que seja capaz de dar sustentação à mesma. Caso a organização não tenha definido com clareza a estratégia de competitividade, é necessário fazê-lo. Para definir a estratégia de competitividade, apresentam-se duas possibilidades. A primeira contempla a aplicação de metodologia para definir a própria estratégia de competitividade. Varias metodologias de planejamento poderão auxiliar nesta etapa. No Anexo II, apresenta-se uma metodologia desenvolvida no Núcleo de Desenvolvimento Empresarial – NDE, vinculado ao Núcleo de Pesquisa e Extensão – NPE, do Centro Federal de Educação Tecnológica de Santa Catarina – CEFET SC. A segunda estratégia contempla a aplicação de metodologia já definida, presente no mercado. Para o caso deste projeto, utilizar-se-á o modelo da cinco forças competitivas de Porter. 3.2 FATOR DELIMITATÓRIO PARA APLICAÇÃO DO MODELO Como já mencionado, considerando as características necessárias para a aplicação do modelo proposto, aborda-se a questão do controle organizacional como fator fundamental para o êxito, considerando que 69 controle é a ação necessária para verificar se os objetivos, planos, políticas e padrões estão sendo obedecidos. O controle pressupõe o estabelecimento e a comunicação dos objetivos, políticas e padrões aos administradores responsáveis pela sua realização (GOMES.J.S. and SALLES 1999). Entende-se, que o controle favorece a conquista dos objetivos da organização, sendo uma das funções básicas da Administração, ele exige e oferece condições que definem o perfil da organização. Aborda-se esta questão apresentando no Quadro 3.1 uma síntese das condições que deve ter uma organização, em se tratando de controle. Quadro 3.1: Resumo das características do controle (Adaptado de Gomes e Salles, 1999) Aspectos Perspectiva limitada Perspectiva ampla Filosofia Controle de cima para baixo Controle realizado por todos Controle como sistema Controle como atitude Cumprimento Desenvolvimento de uma consciência estratégica orientada para o aperfeiçoamento contínuo. Ênfase Melhora da posição competitiva Considerações do contexto social, organizacional e humano. Limitado. Ênfase no desenho de aspectos técnicos. Amplo. Contexto social, sociedade, cultura, emoções, valores. Fundamento teórico Economia, engenharia Antropologia, sociologia, psicologia. Mecanismo de controle Controle baseado no resultado da Contabilidade de Gestão. Formal e informal. Outras variáveis, aprendizado. Normas rígidas, padrões, valores monetários. O Quadro 3.1 evidencia as características do controle nas questões: filosofia; ênfase; conceito de controle; considerações do contexto social; organizacional e humano; fundamento teórico e mecanismo de controle. Para a implantação do modelo, necessita-se de condições apresentadas na coluna que localiza as características de empresa ampla, a saber: controle realizado por todos como atitude; motivação e autocontrole; desenvolvimento de uma consciência estratégica orientada para o aperfeiçoamento continuo; melhoria da posição competitiva; condições de fundamentação teórica em antropologia, sociologia e psicologia em nível suficiente para 70 favorecer o relacionamento e a visão de mundo; mecanismos de controle formal e informal voltados para a identificação de processos, variáveis de pró-atividade, para considerar o processo como um fator de sustentação das atividades e como objeto de estudo e aperfeiçoamento. Sob o foco do contexto social, as organizações apresentam condições que favorecem ou dificultam a implantação de tecnologia como a proposta por este trabalho de pesquisa. Neste sentido, o quadro abaixo apresenta um resumo da dimensão organizacional sob o foco social. Neste quadro, classificam-se as organizações, buscando propor um perfil para as que apresentam condições de visibilidade local e as que conseguem enquadrar-se em nível de dimensões internacionais, a partir das características distribuídas nas linhas da tabela. Quadro 3.2: Contexto social no estabelecimento do controle organizacional (GOMES E SALLES, 1999) Contexto social Local Pequena Internacional Centralizada Descentralizada Controle familiar Controle ad-hoc Limitada Formalização Dimensão Controle burocrático Controle por resultados Grande Elevada Formalização Do quadro, depreende-se que o controle descentralizado, feito com flexibilidade, dentro de uma formalização, favorece o aumento dos horizontes da organização, bem como o controle por resultados. A manutenção de sistemas formalizados de acompanhamento expande a possibilidade das organizações e as habilita para desenvolver projetos com as características similares às do projeto que se apresenta nesta tese. Sob outro enfoque, o Quadro 3.3 apresenta características em termos de processo e infra-estrutura que caracterizam as organizações. Percebe-se que as características presentes nos dois últimos estágios consolidam condições que permitem às organizações movimentar-se no sentido de garantir sistematicamente políticas de competitividade e outras condições, tornando-se permeáveis e viáveis no que tange ao aporte de tecnologia. 71 Quadro 3.3: Características em termos de processo e infra-estrutura (SILVA et al., 1992) Estágios Características organizacionais Empreendimento – estrutura organizacional fluida – regras e procedimentos personalizados – planejamento e coordenação incipientes – poder altamente centralizado – ênfase em inovação e criatividade – estratégia de alto risco em relação ao mercado – informações gerenciais predominantemente informais e rudimentares – formação de nicho – captação e ordenação de recursos Formalização – estrutura organizacional funcional – políticas, regras e procedimentos institucionalizados – planejamento e coordenação sistemáticos – poder relativamente centralizado – ênfase no conservadorismo – estratégia de estabilidade e eficiência – sistema de informações gerenciais predominantemente centralizado – relacionamento estável com o ambiente externo Flexibilização – estrutura organizacional divisionada e semi-autônoma – políticas, regras e procedimentos institucionalizados, mas flexíveis – planejamento sistemático de longo prazo – poder descentralizado – ênfase em inovação e criatividade – estratégia de diversificação de domínio em relação ao mercado – sistema de informações gerenciais predominantemente descentralizado – relação adaptativa com o ambiente externo Apresentados os fundamentos, propõem-se condições de contorno delineadas para o estudo em questão que contemplem a condição estrutural para que a organização estabeleça e dê sustentação a mecanismos de planejamento e controle compatíveis com o que requerem as etapas integrantes do modelo em construção. Para maior clareza, apresentam-se as condições de contorno necessárias para a implantação, classificando-se as organizações, segundo a bibliografia apresentada, em três grandes grupos, assim definidos: Grupo I – organizações indiferentes; Grupo II – organizações em transição; Grupo III – organizações alinhadas 72 estrategicamente. As características desses grupos são apresentadas abaixo e aparecem resumidas na Fig. 3.4. 3.2.1 Grupo I – Organizações indiferentes Este grupo caracteriza-se por apresentar um grau de indiferença significativo com relação a buscar sólida posição com relação ao conhecimento sobre o comportamento do mercado. Sem dar importância a procedimentos baseados na tecnologia, a organização caminha de forma desordenada, buscando entender o mercado a partir de procedimentos não estruturados, extemporâneos, baseados em ações localizadas sem abrangência e patrocínio da organização como um todo. Esta situação gera altos valores de desperdício de recursos, e as ações não apresentam objetividade a ponto de propiciar uma tomada de posição eficaz da organização como um todo. Percebem-se processos inacabados, rotinas incongruentes e muito esforço operacional para garantir o mínimo de equilíbrio para vencer as demandas que inercialmente estão presentes nos vários processos da organização. Nesta etapa da vida organizacional, dá-se muita atenção para posições visionárias, sem o cuidado de sustentar as ações advindas destas posições em algum tipo de metodologia. Esquece-se que um visionário sem metodologia aproxima-se do reino das fadas (MINTZBERG and QUINN 2001). As organizações integrantes deste grupo não dispõem de visão do mercado e por isso são incapazes de compartilhá-la com os seus colaboradores. 3.2.2 Grupo II – Organizações em transição Este grupo apresenta uma condição bastante característica: Quer ser o que não é e é o que não quer ser. Essa etapa das organizações se caracteriza por intensa atividade na busca de novas soluções. O clima organizacional está voltado para reestruturações, e a organização está permeável ao aportes de tecnologia nas várias áreas de atuação da organização. Nesta etapa, a organização já conta com um grau de maturidade para perceber o movimento do mercado e já estabelece um acompanhamento em paralelo do comportamento do mesmo. O grande desafio está na busca pela visão antecipada dos fatos. Geralmente a 73 organização atua de forma reativa, pois entende o que está acontecendo, porém é tomada de surpresa com o surgimento dos fatos. Com relação à visão estratégica, as organizações que se encontram nesta fase já apresentam visões de cenários, que, em alguns pontos notadamente, começam a ser compartilhadas. 3.2.3 Grupo III – Organizações alinhadas estrategicamente As organizações que integram este grupo apresentam visões claras quanto ao comportamento do mercado, capacidade para implantar um modelo de gestão do conhecimento por já haverem implantado um nível de planejamento organizacional que estabelece para todo o âmbito da organização um cenário uniforme e compartilhado. Estas organizações dispõem de planejamento global e apresentam programas que buscam aumentar o grau de envolvimento estratégico e de ações alinhadas com este pensamento. A gestão do conhecimento é uma atividade possível de ser executada em um ambiente com estas características. Com relação aos elementos de gestão do conhecimento, composição de cenário, informação e dado, apresenta-se uma visão esquemática que representa o acima referido. Um fator a ressaltar é que o modelo proposto aplica-se às organizações que migram do segundo grupo para o terceiro. Na verdade, o modelo favorece esta migração. 74 Figura 3.1: Estágios das organizações 3.3 DESCRIÇÃO DO MODELO O objetivo do modelo é dotar a organização de um processo estruturado para recuperação de informação a partir de documentos não estruturados, a fim de dar sustentação a uma estratégia de competitividade. O modelo está organizado em atividades agrupadas em fase, para transformar o referencial teórico modelado em domínio de conhecimento a ser modelado. Para efeito de implantação do modelo proposto, aplicar-se-á o referencial teórico baseado nas cinco forças competitivas de Porter (PORTER 1996). O referencial teórico permite a construção do cenário, fator básico para a aplicação do modelo. Definido o referencial teórico, aplicam-se as quatro fases que compõem o modelo. Cada fase é o resultado de um conjunto de ações baseadas em orientações metodológicas que fazem com que o referencial teórico definido seja compreendido, ajustado 75 à realidade da organização e preparado para que se possa dar ao modelo uma estruturação computacional. A Fig. 3.2 apresenta as fases do modelo proposto. Figura 3.2: Fases do modelo proposto 3.3.1 Fase I: Localização ou Acoplamento Durante esta fase, duas ações necessitam ser encaminhadas. A primeira se concentra na formação da visão compartilhada da estratégia a ser implementada. Durante esta etapa, a área envolvida na implantação do cenário deverá ser alvo de grande volume de horas de 76 treinamento. O referencial teórico será o elemento propulsor da construção de um cenário a ser considerado nos passos seguintes. A segunda etapa é a identificação dos elementos integrantes do cenário construído, que emerge com a modelagem do cenário criado com a aplicação do modelo teórico. A terceira etapa identifica os elementos estratégicos que deverão ser considerados na fase II. Para tanto aplicam-se ao cenário construído metodologias como Strenghts – Weakness – Opportunities – Threats (S.W.O.T.) (PRADO 2004) para identificar os elementos a serem considerados. O resultado desta fase é uma visão conceitual que dá sustentabilidade semântica aos elementos presentes no cenário em questão. 3.3.2 Fase II: Apropriação ou Posicionamento Após definido, compreendido e localizado o referencial teórico na organização, inicia-se a fase II com um conjunto de conceitos que serão a base para a formação da estrutura ontológica. A partir do ambiente semântico estabelecido na fase I, modela-se o domínio do conhecimento sustentado pelo referencial teórico e compreendido pela organização. Com a identificação dos recursos presentes na modelagem do cenário, pode-se construir classes, estabelecer atributos e relações entre classes e objetos (PROTÉGÉ 2004). O resultado desta fase é a definição dos elementos sujeito, objeto e predicado, que permitirão construir uma estrutura que represente o domínio modelado. Identificados este elementos, inicia-se a fase III. 3.3.3 Fase III: Construção do modelo do domínio Esta fase se caracteriza pela construção de modelo esquemático que represente o domínio do conhecimento sustentado pelo referencial teórico. O modelo construído representa a relação entre classes e objetos e define também o relacionamento entre os elementos do domínio modelado, os objetos, sujeitos e predicados. O resultado desta etapa permite a construção da ontologia. Uma ontologia representa uma visão compartilhada de um domínio (FÉRNANDEZ, GÓMEZ-PÉREZ et al. 1997). Com a representação do domínio expressa através de uma estrutura ontológica, pode-se construir um modelo computacional que permitirá o processamento em computadores de regras de 77 negócios pertinentes ao domínio de conhecimento modelado a partir do referencial teórico proposto. 3.3.4 Fase IV: Construção do modelo computacional Esta fase caracteriza-se pela construção de uma representação em código processável pelo computador, para representação da ontologia construída. O modelo computacional é a ferramenta que dará suporte à estratégia adotada, propiciando a identificação de informações importantes para o escopo estratégico, presentes em documentos semi-estruturados. A partir de parâmetros de validação e controle, a ferramenta recupera e analisa dados presentes na Intranet da organização, disponibilizando o resultado do processamento para os responsáveis pela sustentação do posicionamento estratégico. O resultado desta etapa é uma ferramenta computacional, um modelo a ser validado e utilizado. 3.4 UTILIZAÇÃO DO MODELO Após a construção do modelo computacional, sua aplicação permitirá à organização monitorar os vários elementos que foram identificados como integrantes do discurso do domínio que devem ser considerados pelos gestores. Para exemplificar, considere-se que um dos discursos de domínio seja: “Necessita-se manter a melhor relação possível com os clientes”. Esse elemento de discurso está sustentado na ontologia através da modelagem do recurso documento, que é uma classe que se vincula a clientes. Para o caso, considera-se que um contato feito com a organização, que tenha como remetente um cliente e que este contato tenha como tema reclamação, atenda a premissa estabelecida pelo discurso “necessita-se manter a melhor relação possível com os clientes”. Portanto, deve ser identificado e selecionado. Esta propriedade, presente em um contato de cliente, é um agravo ou um sintoma de que o discurso do domínio “necessita-se manter a melhor relação possível com os clientes” está sendo prejudicado. Para o caso, estabelece-se uma ação, um comportamento a ser adotado pela organização. Este comportamento pode ser o envio de uma correspondência para o cliente, ou para o canal que o atende. Para fins de ensaio e validação, elaborou-se uma regra indicando que, quando um cliente da classe “A”, fizer contato com a organização através de um meio não estruturado de 78 comunicação, sendo o contato com tema de reclamação, o documento será identificado e uma mensagem “Há reclamação do cliente nome-do-cliente” será gerada. Para fins de modelo, a geração desta frase significa que se pode tratar o evento (chegada de correspondência do cliente com reclamação) da forma que se entender adequada para fins de construção de ferramenta utilizando a solução construída. O processo de tratamento dos documentos não estruturados será feito através de processo de marcação por funcionário que dá suporte burocrático à organização. O funcionário não necessita ter ciência do processo a que será submetido o resultado da tarefa de marcação que ele fará, porém a execução da ação indicada no modelo da ontologia fará com que um aplicativo, que não faz parte do escopo deste projeto de pesquisa, dispare um procedimento, que pode ser um comunicado ao diretor de vendas ou o envio imediato de correspondência acusando recebimento e providências para o tema em questão. Com isso, a premissa de que o cliente reclamante será atendido não depende mais do envio da correspondência para o diretor, ou da necessidade de que o funcionário recorde esta rotina implantada pela estratégia de competitividade. Este elemento de suporte de gestão apresenta as seguintes vantagens: a) A tarefa de marcação pode ser feita através de ferramenta desenvolvida para este fim. É de fácil manejo, não requerendo grande nível de formação acadêmica para sua operação. b) O executor do processo de marcação não precisa conhecer as diretrizes que nortearão o comportamento do ambiente. Ou seja, o anúncio de que chegou um contato de cliente com reclamação será disparado para o gerente sem a menor interferência do executor da marcação. c) O documento contendo dados não estruturados, através do processo de marcação e do suporte da ontologia, pode ser convertido para um documento semi-estruturado, permitindo tratamento computacional em vários níveis para vários propósitos. Um deles é o de dar consecução a diretrizes estabelecidas a partir da estratégia de competitividade estabelecida pela organização. d) A efetividade na ação de supervisão das diretrizes da estratégia de competitividade é uma realidade, pois conta com suporte computacional que, além de rápido, é preciso e constante. e) A localização do documento em questão pelos gestores é imediata. Isto facilita a ação do gestor no sentido de dar sustentação à estratégia de competitividade, pois o tempo para iniciar atividades corretivas é bastante diminuído. 79 Se o elemento descrito na ontologia estiver alinhado com a estratégia de competitividade, o produto da ação do modelo será um fator sustentador para a estratégia. A simulação da chegada do documento será feita no ambiente do Protégé, pois não é objetivo deste trabalho a construção do ambiente de marcação que atua em correspondência com o ambiente da ontologia. A Fig. 3.6 apresenta esquema do funcionamento do modelo. 3.5 VALIDAÇÃO DO MODELO A validação do modelo se dará através de aplicação de recursos baseados em preceitos da Lógica formal e da teoria dos conjuntos, executados em nível computacional, utilizando recursos da ferramenta que permite construir a ontologia (MUSEN and al. 1995). A partir do funcionamento da Ontologia, é possível estabelecer regras de validação que irão conferir regras suportadas pelo discurso do domínio. Essas regras são as diretrizes condutoras para o comportamento da Ontologia. Figura 3.3: Representação esquemática do funcionamento do modelo Documento recebido Ontologia do modelo Think Cientific-Document Event Scientific-Event Live-Scientific-Event Chegada na Empresa Correio ou E-mail Part-Publication Keyowrd Marcação Instance Special-Inssue- Documentos marcados Metadados, segundo o referencial teórico de competitividade Dividable- Scientific-Publication-Eventn-Title Proceeding Book String Special-Inssue-Magazine Aplicações futuras, fora do escopo da pesquisa. Aplicativo Digitalização quando via correio Documento em marcação Decisão 1 Decisão 2 Decisão 3 Decisão n 80 4 CONSTRUÇÃO DA ONTOLOGIA Seguindo os passos propostos pela metodologia para construção de ontologias, apresentada em (NOY and McGuinness 2005), apresenta-se abaixo a ontologia que representa o domínio do conhecimento apresentado pelo referencial teórico de Porter. Inicialmente considera-se que: a) Existem vários caminhos para modelar o domínio do conhecimento envolvido no referencial teórico de Porter. b) A melhor solução depende da aplicação que se tenha em mente e da extensão que se queira dar para esta aplicação. Para o caso, a aplicação deverá servir de suporte à estratégia de competitividade concebida por Porter, dando condições para que se acessem informações em documentos não estruturados. c) O desenvolvimento de uma ontologia envolve, necessariamente, um processo iterativo. A ampliação e amadurecimento da compreensão sobre o domínio do conhecimento em estudo favorecem o aperfeiçoamento da ontologia. Sendo assim, a segunda proposição para a ontologia em desenvolvimento será um aperfeiçoamento da primeira, e a solução n será um aperfeiçoamento da solução n-1. d) Os conceitos em uma ontologia devem ser comparados a objetos e o relacionamento entre eles. Provavelmente serão verbos ou objeto em uma relação presente no domínio ao qual pertencem, descrita através de uma sentença. Para o caso em estudo, têm-se conceitos como clientes, fornecedores, concorrentes, concorrentes entrantes, indústria e produtos substitutos. E, como propriedades, temos verbos que ligam elementos de um conjunto representado pelos conceitos acima a um individuo deste conjunto. Por exemplo: A empresa “A” é integrante do conjunto de clientes. O elemento “é integrante” constitui uma propriedade que liga a empresa “A” ao conjunto ao qual ela pertence, chamado “clientes”. A figura 4.1 representa esta relação 82 é integrante A é integrante Clientes B é integrante C Figura 4.1: Taxonomia entre a classe Cliente, a empresa A e a propriedade “é integrante”. 4.1 SEQÜÊNCIA DE PASSOS – APLICAÇÃO DA METODOLOGIA Seguindo o que indica a metodologia. O primeiro passo consiste em determinar o domínio e o escopo da ontologia. 4.1.1 Passo 1 Para atender a esta questão, quatro perguntas devem ser formuladas. a) Qual domínio a ontologia envolverá? O domínio da ontologia está ligado à estratégia de competitividade organizacional definida por Porter. Através dela, serão descritos os conceitos e propriedades de classes e objetos de um domínio. Sendo assim, teremos cinco forças que atuarão em um cenário de competitividade organizacional. São elas os clientes, os fornecedores, os produtos substitutos e os clientes entrantes. Recuperando o apresentado na Fig. 2.1, a Fig. 4.2 expressa o domínio do conhecimento a ser representado pela ontologia. 83 Figura 4.2 – Domínio do conhecimento a ser modelado pela ontologia b) Para que se vai utilizar a ontologia? Utilizar-se-á a ontologia para acessar documentos não estruturados, segundo critérios por ela representados, a partir do domínio acima explicitado. A ontologia em questão permitirá à organização estabelecer critérios de acesso a documentos não estruturados que favorecerão a sustentação da estratégia de competitividade em questão. c) Que tipos de perguntas ou informações a ontologia deverá responder? A ontologia deverá ser capaz de responder perguntas vinculadas a cinco referenciais, base para o estabelecimento de ações, a partir da observação de parâmetros assim delineados: I) Ações para concorrentes entrantes em potencial: Este aspecto refere-se à entrada de novas empresas no mercado e para impedir estas entradas, pode-se estabelecer barreiras considerando: • Economia de escala: Item a ser monitorado: Declínio no custo em decorrência da otimização em áreas funcionais, integração vertical ou horizontal e compartilhamento de recursos. Sob esse enfoque, pode-se considerar as seguintes informações: o Qual o valor do custo operacional de cada área funcional? o Qual o valor de custo operacional de determinado projeto? 84 o Qual a redução de custos provenientes de condições sinérgicas na utilização de base operacional, equipamentos ou estruturas herdadas a partir de relacionamentos construídos com o tempo de operação com clientes, fornecedores ou outras parceiras? o Determinado projeto envolve quais áreas funcionais? o Determinada área funcional está envolvida em quais projetos? o Que recursos de tecnologia e de logística são necessários para o desenvolvimento, implantação ou sustentação à determinado projeto? o Que concorrentes se pode ter para determinado produto fornecido pela organização? o Que nível de custo operacional deve ser mantido para inviabilizar investidas de novos concorrentes no mercado onde a organização atua? • Diferenciação do produto: Itens a serem monitorados: Aspectos vinculados à marca já identificada pelo mercado e/ou qualidade do produto ou serviço oferecido ao mercado. Pare este enfoque, pode-se ter as seguintes perguntas ou informações: o Quais marcas de concorrentes existem no mercado? o A que tipos de clientes estas marcas atendem? o Que coincidência existe entre estas marcas e as da minha organização? o Que diferenciação existe entre a minha marca e a dos concorrentes? o Que quesitos na qualidade do meu produto devem ser considerados para fins de diferencial de competitividade? o De que forma estes quesitos são considerados pelos clientes ou pela concorrência? o Que nomes diferentes existem para o produto que minha organização oferece? • Necessidade de Capital: Item a ser monitorado: Alinhamento da organização em torno da necessidade de capital para desenvolver, implementar ou sustentar determinado serviço ou produto no mercado. Este enfoque pode considerar as seguintes perguntas ou informações: o Que projetos existem para serem implementados? o Quais os valores de investimentos por projeto? 85 o Quais as fontes de financiamentos disponíveis? o Quais as fontes de financiamentos possíveis? o Quais as regras para obtenção de linhas de créditos? o Quais as oportunidades de contato com investidores nacionais e internacionais? o Existem editais de órgãos fomentadores de desenvolvimento regional? o Que editais estão presentes para serem aproveitados por minha organização? o Quais documentos na organização que fazem referência a instituições financiadoras de produtos, serviços ou de capital de giro? o Quais os projetos internos em desenvolvimento capazes de serem financiados? • Custo de mudança: Para que um cliente mude de produto ou de fornecedor, existe um custo e um risco que podem ser utilizados como fatores determinantes de barreiras para evitar a entrada de novos concorrentes. Itens a serem monitorados: o Quais os custos de treinamento? o Qual a estrutura necessária para a utilização do serviço ou produto em questão? o Qual o tempo e risco presentes no processo de mudança de produto ou de serviço em questão? o Quais os elementos presentes na documentação da organização que evidenciam fatores de risco que poderão catalisar a disposição e minimizar a sensação de risco a correr com a troca do produto ou serviço oferecido pela organização? o Quais os outros produtos candidatos a substitutos do que a organização oferece? • Acesso aos canais de distribuição: Dentro desta questão, o foco deve ser voltado para a existência, manutenção e ampliação da estrutura capaz de fazer com que o produto ou serviço seja escoado. Itens a serem monitorados: o Quem integra os canais de distribuição da organização? o Como estão estes canais e projeções para o futuro? o Qual a possibilidade de surgimento de novos canais capazes de sustentar o ingresso de novos concorrentes entrantes no mercado? 86 • Desvantagem de custos independentes da escala: Este enfoque envolve a necessidade de se estar atento à presença de tecnologias, subsídios, curva de aprendizagem e localização. Itens a serem monitorados: o Que novas tecnologias associadas aos produtos e serviços da organização estão presentes nas documentações não estruturadas? o Que tipos de tecnologias podem melhorar os custos operacionais de concorrentes entrantes, tornando-os concorrentes entrantes? o Que tecnologias envolvem o meu produto ou serviço e como estas estão sendo tratadas ou consideradas por concorrentes em potencial? o Que centros de excelência estão vinculados a tecnologias existentes nos produtos da organização? o Que leis envolvendo subsídios existem na região ou no mercado onde atuo? o De que forma estes subsídios podem afetar meu produto ou serviços? o Que leis existem ou estão em fase de mudança ou em fase de construção? o Que características tem a cura de aprendizado relacionada ao meu produto ou serviço? o Que fatores influem no comportamento desta curva? o De que forma estes fatores estão presentes na organização? o Que documentos os referenciam? o Que características existem no mercado onde o produto ou serviço é oferecido? o Que dissonância com este mercado pode ser percebida? o Como a dissonância com o produto ou serviço oferecido pela organização se manifesta no mercado em análise? o Que leis ou políticas governamentais presentes estão vinculadas aos produtos da organização? o Que leis favorecem e representam oportunidades para a manutenção e/ou ampliação da fatia de mercado do produto em questão? o Que leis dificultam e representam ameaças para a manutenção e/ou ampliação da fatia de mercado do produto ou serviço em questão? 87 II) Ações para Concorrentes presentes no mercado: Este aspecto refere-se à presença dos concorrentes que disputam com a organização as fatias de mercado. Para estes tipos de ameaça pode-se estabelecer barreiras com os seguintes enfoques: • Concorrentes numerosos ou bem equilibrados Este aspecto remete a questões vinculadas ao número de ofertas do mesmo produto ou serviço por diferentes fornecedores e à capacidade de absorção do produto ou serviço pelo mercado. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Número de fornecedores por produto ou serviço, foco de monitoramento. o Comportamento do mercado em termos de consumidores para o produto ou serviço em questão. o Presença de referências a fornecedores em documentos não estruturados da organização, para os produtos em monitoramento. • Crescimento lento da indústria: Este fator considera o comportamento da indústria/mercado em relação ao produto/serviço em questão. Itens a serem monitorados: Sob este enfoque pode-se ter as seguintes informações: o Comportamento do crescimento do mercado/indústria. o Comportamento do crescimento da aceitação do produto/serviço. o Fornecedores, concorrentes, ou produtos concorrentes presentes em dados não estruturados nos computadores da organização. • Altos custos com armazenamento Este fator se volta para questões vinculadas a barreiras estabelecidas pelo custo de estocagem e armazenamento. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Valores aplicados em armazenamento e estocagem de produtos o Acompanhamento das sazonalidades, para determinar seu comportamento. o Identificação de coincidência de produtos e estoques desses produtos. o Acompanhamento dos custos com armazenamento. 88 • Ausência de diferenciação ou custo de mudanças. Este aspecto favorece o monitoramento da diferenciação do produto ou serviço e a forma através da qual barreiras podem ser estabelecidas favorecendo a fidelização ou dependência do mercado ao produto ou serviço em questão. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Diferencial do produto da em questão. o Conceitos envolvendo o produto que geram relação exclusiva com os clientes. o Acompanhamento da aplicação de conceitos similares a produtos concorrentes para estabelecer o grau de ameaça. o Identificação de conceitos e ou imagens que possam ser aproveitadas para favorecer a fixação de produtos e serviços ao mercado e assim ampliar a participação nele. o Estabelecer estudos para definir a forma de utilizar os conceitos praticados na caracterização de produtos e serviços pela concorrência, para utilizá-la em favor do estabelecimento de estratégia de competitividade. • Capacidade aumentada em grandes incrementos. Este aspecto está relacionado com a questão da super capacidade e redução de preços. Neste sentido, acompanhar a capacidade de produção própria e da concorrência, bem como o comportamento das negociações entre indústria e canais de distribuição, pode definir caminhos para a construção de barreiras e assim consolidar uma estratégia de competitividade neste aspecto. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Identificação de formas de aumento de produção ou produtividade. o Identificação de comportamento de acordos firmados entre a própria organização ou organizações concorrentes para com canais de distribuição. o Acompanhamento de indicadores ou de referências que definam as tendências para a estratégia de produção própria e dos concorrentes. • Concorrentes divergentes. Neste sentido, o desafio é estabelecer barreiras que considerem formas de competir com regras diferenciadas para serem identificadas e construídas. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Como identificar as regras que definem a conduta de cada concorrente? 89 o Que critérios devem ser considerados para estabelecimento de regras de concorrência? o Que diferenciações podem ser identificar nas regras de concorrência praticadas? • Grandes interesses estratégicos. A identificação da relação estratégica entre o produto ou serviço, o fornecedor e o cliente favorece a consolidação de características a serem incrementadas ou mantidas nos produtos e serviços, de tal forma que se estabeleça um vinculo estratégico que possa ser utilizado como barreira. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Que grau de dependência o cliente tem em relação ao produto ou serviço fornecido? o O que agregar ao meu produto ou serviço que favoreça a inclusão do produto fornecido na lista dos itens estratégicos para o cliente. o Que conceitos regem a realidade do mercado? o Como incluir este conceito nos produtos e serviços que ofereço ao mercado? o Como acompanhar a evolução destes conceitos e identificar novas oportunidades para agregar novos conceitos que possam ser aceitos pelo mercado? • Utilização de estratégias para estabelecimento de barreiras de saídas elevadas. Neste sentido, uma estratégia de competitividade pode ser estabelecida através da implantação de ativos especializados, custos fixos de saída, inter-relações estratégicas, barreiras emocionais, ou restrições de ordem governamental ou social. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Quais formas de celebrar contratos levam à implantação desta forma de barreira? o Que legislação dará suporte a esta estratégia? o Que leis ou resoluções estão em tramitação nos órgãos governamentais? o Que políticas são praticadas que favorecem esta estratégia? o Onde estão os documentos da organização que tratam destas questões? o O que a concorrência tem utilizado quanto aos aspectos acima citados como elementos formadores de barreiras? 90 o Que conceitos ou cenários devem ser considerados para o estabelecimento de comportamentos que culminem na criação de barreiras para impedir ou equilibrar a ação da concorrência? o Que promoções ou ações de marketing são desenvolvidas e que conceitos são explorados por elas? o Como reage o mercado em presença de ações estratégicas desta ordem? III) Produtos substitutos: Este aspecto refere-se aos produtos similares que podem ocupar o espaço de um produto existente. Através do aperfeiçoamento tecnológico ou mudança de comportamento do mercado, um determinado produto pode ser substituído por outro. A ameaça de produtos que possam substituir outros advém da presença de competição extrema entre produtos alternativos com custos mais baixos e que desempenhem a mesma função, ou com o mesmo custo mas desempenhando funções adicionais. Estes aspectos são fatores a ser em monitorados e, através deste processo de monitoramento, deve-se identificar, estabelecer ou neutralizar barreiras apoiadas nos seguintes fatores: • Funções a serem desempenhadas por produtos ou serviços. Este aspecto favorece o monitoramento sobre as necessidades dos clientes e de que forma um determinado produto atende estas necessidades. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Como o produto ou serviço atende o cliente ou mercado? o Que necessidades são apresentadas pelos clientes? o Que novos conceitos têm sido considerados pelo mercado? o Que relações entre conceitos e necessidades dos clientes ou mercado podem ser estabelecidas? o Que produtos ou serviços existentes podem ocupar o espaço do produto em questão? o Como incrementar produtos e serviços para atender a novas necessidades dos clientes? o Como agregar funcionalidades que permitam que o mesmo produto ou serviço amplie seu espectro de atendimento a necessidades do mercado ou cliente? 91 • Produtos ou serviços que desempenham funções equivalentes. Neste sentido, a estratégia de estabelecimento de barreiras pode ser exercida ao agregar novas funcionalidades ou diminuição de preços ou incremento de tecnologia, definindo vantagens em termos de durabilidade, design ou consumo de energia. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Que funções desenvolve determinado produto ou serviço? o Que serviços ou produtos desenvolvem determinada função? o Que conceitos tecnológicos dão sustentação a determinado produto ou serviço? o Que perspectivas de melhorias determinado produto ou serviço pode ter? IV) Fornecedores: Este aspecto se refere ao poder de negociação de fornecedores em relação a qualidade, elevação de preços ou outros fatores que possam comprometer o equilíbrio ou as condições de operações desejáveis para os negócios da organização. Neste sentido, barreiras necessitam ser estabelecidas para atender as seguintes questões de interesse da organização. • O mercado é dominado por poucas companhias fornecedores, sendo mais concentrado do que as indústrias para as quais vende. Este aspecto pode tornar frágil a capacidade de negociação por parte da indústria. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Identificação de novos fornecedores. o Produtos substitutos de outros fornecedores. o Tendência na oferta dos produtos e inovações tecnológicas que possam favorecer a substituição do insumo ou matéria-prima em questão. • O fornecedor não concorre com produtos substitutos: A exclusividade no fornecimento de produtos ou serviços favorece o monopólio e o conseqüente domínio dos clientes que necessitam do insumo ou matéria-prima em questão. Este aspecto também pode tornar frágil a capacidade de negociação por parte da indústria. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Produtos possíveis de substituir o produto em questão. o Novas tecnologias que favoreçam a substituição do insumo ou matéria-prima em questão. 92 o Novos produtos que atendam as mesmas necessidades dos clientes, porém que utilizem outros insumos ou matérias-primas. • O produto do fornecedor é um insumo importante para o negócio do comprador. Este fator deve ser considerado como um item a ser neutralizado através de barreiras a serem construídas. A partir desta posição delicada, o poder de negociação e o domínio sobre variáveis importantes em nível de custos ou outros aspectos podem comprometer a conquista dos objetivos da organização cliente. Itens a serem monitorados: O mesmo enfoque das questões anteriores aplica-se aqui, a saber: o Produtos possíveis de substituir o produto em questão. o Oportunidades de encontrar insumos ou matérias-primas substitutas. o Desenvolvimento de novos produtos que atendam as mesmas funções, porém que utilizem outros insumos ou serviços. • Os produtos são diferenciados ou o grupo desenvolveu custos de mudanças. • O grupo de fornecedores é uma ameaça concreta de integração para frente. As duas oportunidades de barreiras oferecidas acima por fornecedores são similares às demais anteriormente tratadas. Entende-se que as informações a serem obtidas ou as perguntas delas decorrentes têm o mesmo contorno e já foram contempladas. V) Clientes Este aspecto contempla as questões oriundas do cliente que podem estabelecer focos para o desenvolvimento de barreiras que impeçam a entrada de novos concorrentes, a opção por novos produtos ou a evasão de clientes da carteira da organização. Para este enfoque, é importante considerar que há possibilidade de serem exercidas pressões sobre os preços no sentido de fazê-los baixar, estabelecerem-se movimentos que aumentem o poder de negociação e barganha de clientes organizados em entidades de classes ou similares, haver exigência de melhor qualidade ou mais serviços e assim jogarem-se os concorrentes uns contra os outros. Neste sentido a atenção deve ser voltada para os aspectos apresentados a seguir: • Concentração ou aquisição de grande volume de um mesmo vendedor. Este aspecto pode retirar capacidade de negociação e estabelecer um ponto de 93 fragilidade na relação cliente-fornecedor. Neste sentido, pode-se desenvolver uma ferramenta para monitorar as seguintes questões dentre outras. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Estou sendo refém de clientes ou grupos de clientes? o Existe possibilidade de estabelecer-se uma condição de domínio por parte dos clientes? o Como está o grau de satisfação destes? o De que forma se relacionam comigo como fornecedor e parceiro deles? o Quando foi a ultima vez que se recebeu-se correspondência deste cliente? o O que pode estar o cliente esperando dos fornecedores? o Como se classificam os clientes em níveis de importância? • Os produtos que o cliente adquire representam uma fração significativa de seus próprios custos ou compras. Ter conhecimento do grau de dependência que o cliente tem do produto que a organização fornece é poder estabelecer um conjunto de medidas que criem barreiras para consolidar posições de parceria. O comportamento do custo para a troca de produto pode representar um impacto desfavorável. Assim o conhecimento e a métrica deste comportamento pode representar um fator de competitividade a ser utilizado. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Produtos fornecidos por cliente o Solicitações de produtos por clientes o Forma de comunicação entre empresa fornecedora e cliente • Os produtos que os clientes compram são padronizados ou não diferenciados: Caracterizar o tipo de produto oferecido para cada cliente pode estabelecer outro foco de análise para estabelecimentos de estratégias de competitividade. Questões a serem monitoradas: Sob este enfoque, pode-se ter as seguintes informações: o Enfoque técnico da comunicação entre clientes e fornecedores o Tipos de temas tratados nas correspondências. o Identificação, segundo classificação prévia, do nível estratégico do cliente para a organização. o Classe ou característica do produto fornecido para o cliente 94 • Ele enfrenta poucos custos de mudança. Se o produto fornecido for de fácil substituição, a relação entre cliente e fornecedor adquire baixa consistência. Para que haja um fortalecimento nesta relação, outros fatores devem intervir de forma a estabelecer um grau de dependência que fortifique a relação. Neste sentido, o enfoque estratégico necessita encontrar elementos que ao serem acionados atinjam os objetivos de fortalecimento do vinculo e criação de barreiras para novos fornecedores ou para troca por produto similar. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Tipo de contato que o cliente faz com a organização. o Temas dos contatos. o Interesses explícitos dos clientes. o Motivos de contato entre cliente e organização fornecedora • Ele consegue lucros baixos: Se o impacto do produto fornecido não tiver muita significação, o interesse pela operação entre clientes e fornecedores fica comprometido. Este contexto pode representar ameaças para os interesses da organização fornecedora. Neste sentido, monitorar fatores paralelos ao objeto da negociação é uma das formas de se estabelecerem barreiras para favorecer a permanência do cliente na carteira da organização fornecedora. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Grau de satisfação do cliente. o Conhecimento dos planos estratégicos em execução pelo cliente o Conhecimento dos objetivos da organização cliente o Perceber a intenção do cliente, através das comunicações e dos produtos que o mesmo adquire na organização fornecedora. • Possibilidade de integração para trás. O avanço da tecnologia proporciona mudanças no perfil de produtos e serviços, as quais podem gerar o total desinteresse pelo fornecimento de determinados elementos que passam a integrar processos anteriores ou são substituídos por módulos mais completos que incorporam funções. Neste sentido, estar atento às necessidades dos clientes e às tendências tecnológicas representa um fator a ser focado pelos gestores da estratégia de competitividade. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Comportamento da tecnologia inerente ao produto. 95 o Necessidades do mercado. o Surgimento de novos produtos. o Consultas feitas pelos clientes. o Ofertas feitas pelos fornecedores. o Temas presentes em conclaves científicos o Linha de fomento à pesquisa. • O produto da indústria não é importante para a qualidade dos produtos ou serviços do comprador. A contribuição a ser dada pelo produto a ser fornecido pode ser um fator que garanta a consolidação de negócios duradouros. Neste sentido, perceber o impacto do produto fornecido no negócio do cliente deve ser um fator a ser considerado como elemento de competitividade. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Considerações feitas pelo cliente quanto aos produtos recebidos o Mudança do comportamento do cliente frente a não conformidades ou a mudanças efetuadas nos produtos o Relação de reclamação e nível de distorção apresentado pelo produto em termos de prazo de entrega, qualidade ou preço. • Acesso à informação. Monitorar o interesse do cliente pelo produto ou serviço em nível de informações permite monitorar fatores que têm importância para o cliente e que podem ser explorados ou melhor controlados pelos fornecedores. Neste sentido, estudar e estabelecer estratégias para disponibilizar ou receber informações de serviços e produtos pode se constituir em um elemento de relevância na ação estratégica de competitividade a ser implementada. Itens a serem monitorados: Sob este enfoque, pode-se ter as seguintes informações: o Interesse do cliente por tecnologias relacionadas com o produto dele. o Temas sob o enfoque de produtos e serviços presentes na comunicação exercida com a organização. o Comportamento do cliente com relação a variações de características de parâmetros de entrega, preço, prazo, qualidade, etc. 96 4.1.2 Passo 2 Construído um conjunto de questões e perguntas com a execução do que é indicado na metodologia, realizado no passo 1, inicia-se pesquisa para ver a possibilidade de reuso de ontologias já existentes na organização, ou presentes em servidores de ontologia na Web. Para tanto, a organização deve manter documentação das ontologias para permitir o acesso a projetos anteriores, ou referências a projetos já desenvolvidos que possam oferecer subsídios para que se inicie de um ponto a frente, em relação à posição em que a organização está. O site http://www.cs.utexas.edu/users/mfkb/related.html apresenta um cadastro de projetos de ontologias existentes no mundo. Ele pode ser a base para uma pesquisa externa à organização. A questão que deve guiar esta etapa do processo é a necessidade de identificação, em nível interno ou externo á organização, das ontologias existentes que atendem parcial ou totalmente as necessidades em questão. Para este caso, considera-se o apresentado no Anexo I – que contém uma listagem dos projetos que envolvem ontologias, pesquisados pelo autor em sites. Nenhum deles apresenta projeto que possa atender aos quesitos desta pesquisa. Sendo assim, é necessário desenvolvêla sem poder aproveitar parcial ou totalmente um projeto existente. 4.1.3 Passo 3 Enumerar importantes condições da ontologia. Nesta etapa do processo, é importante listar as condições que se gostaria de declarar para alguém que estivesse no papel da ontologia a ser projetada. Questões como: A respeito de quais condições se gostaria de dizer algo? Que propriedade essas condições devem ter? O que se quer dizer a respeito destas condições? Neste sentido, apresenta-se a lista das condições importantes a serem consideradas pela ontologia a ser projetada: • Atuar em informações não estruturadas; • Identificar questões relacionadas com o referencial teórico, listadas no passo 1, dentre os quais destacam-se: o Identificação de clientes, concorrentes, concorrentes entrantes, produtos, fornecedores e produtos substitutos; 97 o Identificar tipos de documentos segundo classificação estabelecida; o Identificar temas presentes nos documentos; o Identificar origem e destino das informações não estruturadas; o Identificar características de produtos; o Identificar necessidades dos clientes; o Identificar a freqüência de comunicação de clientes; o Estabelecer nível de clientes; o Identificar ações de concorrentes; o Identificar a presença de produtos substitutos; o Determinar a reação de clientes frente à variação de padrões de fornecimento; o Estabelecer associação de produtos ou serviços, clientes e/ou fornecedores; o Identificar o volume de clientes por produto fornecido. Como já mencionado, a construção da ontologia tem caráter iterativo. Assim, outras condições poderão surgir durante o desenvolvimento do projeto, em função do aperfeiçoamento gerado pela iteratividade. Portanto, a relação acima não pretende ser completa, mas sim uma primeira visão das questões que devem envolver o projeto. Em função da dimensão da ontologia e do objetivo da tese, dar-se-á mais atenção às questões relacionadas às dimensões do cliente. Procurar-se-á atender de forma mais completa este aspecto da ontologia. Sendo assim, relacionam-se abaixo as condições relevantes para esta dimensão competitiva, considerando os enfoques presentes nesta etapa, propostos pela metodologia, a saber: A respeito de quais as condições se gostaria de dizer algo? Deve-se controlar os documentos contendo informações de clientes. Não deve passar despercebido nenhum documento com referências a clientes. Deverão ser identificados documentos com conteúdos que impliquem ameaça à estratégia de competitividade sob o enfoque de clientes. A direção da organização deverá saber se documentos contendo nomes de clientes de níveis determinados contiverem temas que comprometam a estratégia de competitividade da organização. Deve-se ter condições de identificar documentos por clientes, documentos por temas, tipos de documentos por clientes e tipos de documentos por tema. A estratégia de competitividade deverá ser referência para estabelecer identificação e seleção de documentos. 98 O processo de marcação deverá ocorrer por pessoal não especializado, que desconheça a estratégia de competitividade e o procedimento de seleção de documentos. • Que propriedades estas condições devem ter? o Os clientes deverão estar classificados por níveis; o Deve ser possível identificar clientes e classificá-los por níveis; o As correspondências devem poder ser identificadas por temas, por tipos, por remetentes e por destinatário; • O que se quer dizer a respeito destas condições? o Toda informação não estruturada deverá ser marcada e sofrer identificação; o Todo documento com tema reclamação deverá ser identificado e separado; o Todo documento com tema reclamação e com cliente nível “A” deverá ser identificado e separado; o Sempre que houver um documento com remetente do nível “A” com tema classificado como Reclamação, este deverá ser identificado e sua ocorrência ser notificada para o diretor ou responsável, ao qual está delegada o controle do processo de gestão da estratégia de competitividade. 4.1.4 Passo 4 Definição das classes e das hierarquias das classes. Inicia-se a definição das classes com uma ampla identificação dos conceitos que integram esta parte do domínio do conhecimento. Neste sentido, como se está referindo à comunicação entre a empresa e o cliente, mais especificamente aos documentos emitidos pelos clientes, nota-se que todos os documentos têm os seguintes conceitos envolvidos: • Todo documento é de um determinado tipo; • Todo documento tem um remetente; • Todo documento tem um destinatário; • Todo documento tem um tipo de tema; • Todo destinatário tem um tipo de classificação; • Todo remetente tem um nível de classificação no qual se enquadra; 99 Outros conceitos podem ser identificados posteriormente e agregados à ontologia. Como já frisado anteriormente, o processo de construção de uma ontologia é interativo e, a cada iteração, novas modificações irão aperfeiçoando a ontologia. Neste sentido, temos uma primeira relação de propriedades que deverão ser modificadas, reduzidas ou ampliadas para melhor atender o objetivo da ontologia, que é o de fornecer uma visão do domínio do conhecimento que representa, a qual se seja possível de ser compartilhada. Com base no acima apresentado, temos o seguinte conjunto de conceitos a serem considerados: • Remetente; • Destinatário; • Tema; • Tipo de documento; • Clientes. As definições das propriedades devem levar em consideração a relação entre os conceitos. 4.1.5 Passo 5 Para estabelecer a associação entre as classes acima definidas, apresenta-se a seguinte relação de propriedades: • temNome; • é de Um. Considerando as classes e as propriedades acima definidas, pode-se construir as seguintes sentenças: • Documento tem Um Tema; • Tema é de Um Documento; • Documento tem Um Destinatário; • Destinatário é de Um Documento; • Documento tem Um Cliente; • Cliente é de Um Documento; • Nível tem Um Cliente; • Cliente é de Um Nível; 100 • Documento tem Um Tipo; • Tipo é de Um Documento. 4.1.6 Passo 6 Definição das facetas dos slots A definição dos slots ou facetas considera uma classificação que estabelece a relação entre o domínio e a imagem dessa taxonomia. Os tipos de classificação são: • Object property: Um Object property liga indivíduos. • Datatype: Um Datatype property liga um indivíduo a um literal. • Annotation property: Um Annotation property liga classes a um literal ou string. Considerando esta classificação, definem-se os slots como segue: • Documento: Data; Tipo; Tema; Remetente; Destinatário. • Tipo: Carta; Memorando; E-mail; Certificado; Relatório; Parecer; Lei; Manual; Declaração; Certidão. 101 • Tema: Elogio; Reclamação; Esclarecimento; Homenagem; Recordação; Reiteração; Ratificação; Retificação; Convite; Recusa; Proposição; Contestação; Informação; Consulta. • Remetente: Nível A; Nível B; Nível C. • Destinatário: Nível A; Nível B; Nível C 4.1.7 Passo 7 Criação das instâncias. Este processo envolve o preenchimento das propriedades acima definidas. Em muitos casos, a operação se dá em nível de dados. Sendo assim, esta etapa será desenvolvida diretamente no software utilizado para implementar a ontologia. Para exemplificar, apresenta-se um elemento da ontologia. 102 Ocorrência: Um documento tipo carta, com uma reclamação, enviado pela Alfa, que é um cliente Classe A, para o departamento de vendas. Super-classe Classe Slot Instância Tipo Slot Documento Tipo documentoTipo “Carta” Datatype Documento Tema temaTipo “Reclamação” Datatype Documento Remetente remetenteNome “Alfa” Datatype Documento Destinatário destinatárioNome “Vendas” Datatype Documento Nível classeNivel “A” Datatype Figura 4.3: Relação entre os elementos da ontologia 4.2 CONSTRUÇÃO DO ESBOÇO DA ONTOLOGIA Percorrida as etapas definidas na metodologia, deve-se construir um esboço da ontologia, para favorecer a compreensão da mesma. Para maior clareza, apresenta-se o esquema da ontologia em três níveis de abstração. O nível 0 considera as cinco forças competitivas e a relação delas entre si. O nível 1 considera cada força com suas subclasses e o relacionamento entre elas. O nível 2, considera cada subclasse e as propriedades que ligam as instâncias pertencentes a ela. 103 4.2.1 Nível 0 Visão macro do escopo que envolve a ontologia. Concorrentes entrantes temNegociação temAmeaça éAmeaça temNegociação Clientes Fornecedores Concorrentes na Industria éNegociação éNegociação Competição éAmeaça temAmeaça Produtos Substitutos Figura 4.4: Visão macro do escopo que envolve a ontologia Descrição dos elementos: a) Concorrentes entrantes em potencial: Este aspecto refere-se à entrada de novas empresas no mercado e às estratégias para impedir essas entradas. b) Concorrentes presentes no mercado: Este aspecto refere-se à presença dos concorrentes que disputam com a organização as fatias de mercado. c) Produtos substitutos: Este aspecto refere-se aos produtos similares que podem ocupar o espaço de um produto existente. 104 d) Fornecedores: Este aspecto se refere ao poder de negociação de fornecedores em relação a qualidade, elevação de preços ou outros fatores que possam comprometer o equilíbrio ou as condições de operações desejáveis para os negócios da organização. e) Clientes: Este aspecto contempla as questões oriundas no cliente que podem estabelecer focos para o desenvolvimento de barreiras que impeçam a entrada de novos concorrentes, a opção por novos produtos ou a evasão de clientes da carteira da organização. 4.2.2 Nível 1 Visão de cada força competitiva que envolve a ontologia Entrantes em potencial Fornecedor temCliente Clientes temFornecedor éCliente éFornecedor Entrantes em temProduto Potencial Produtos éNome temNome Similares Nome éProduto é temContato Contato Figura 4.5: Classes e propriedades de Entrantes em Potencial 105 Concorrentes Fornecedor temCliente Clientes temFornecedor éCliente éFornecedor Concorrentes temProduto éNome temNome Produtos Nome éProduto éContato temContato Contato Figura 4.6: Classes e propriedades de Concorrentes Produtos Substitutos Fornecedor temCliente Clientes temFornecedor éCliente temProduto éFornecedor Produtos Similares Produtos Ameaçados éNome temNome Nome éProduto éFicha temFicha Ficha Técnica Figura 4.7: Classes e propriedades de Produtos Substitutos 106 Fornecedores Insumos de Fornecedores temCliente Meus Concorrentes temInsumo éCliente éInsumo Fornecedores temProduto Produtos dos Insumos éNome temNome Nome éProduto éContato temContato Contato Figura 4.8: Classes e propriedades de Fornecedor Clientes: Fornecedor temSimilar éFornecedor Produto Similar temFornecedor Comunicação éSimilar temComunicação Clientes temProduto éComunicação éNome temNome Produto Nome éProduto éContato temContato Contato Figura 4.9: Classes e propriedades de Clientes 107 4.2.3 Nível 2 Este nível compreende o aprofundamento em cada elemento constante do nível anterior. Por questão de escopo do projeto, apresenta-se o desdobramento da dimensão Cliente. Considere-se que, para o caso Cliente, um aspecto a ser monitorado é a manifestação deste em relação a qualquer aspecto que diga respeito à imagem que a organização está formando perante ele. Neste sentido, estabelecer-se-á monitoramento sobre as correspondências que chegam à organização oriundas de clientes. Este monitoramento terá como objetivo identificar as que tiverem como tema Reclamação e como nível de cliente os integrantes da classe “A”. Objetiva-se identificar o Cliente, o nome do arquivo que contém o documento, o tipo de documento, bem como o departamento da empresa a que foi endereçado. Comunicação ClasseB temClasse ClasseA éClasse temTema éDestinatario Nome_do_arquivo éNome temClasse temClasse Tema temNome Destinatário temDestinatari Comunicação temTipo Data temData ClasseC temRemetente éRemetente éData Remetente temClasse temClasse temClasse ClasseA ClasseB ClasseC Figura 4.10: Classes e propriedades de Comunicação Tipo 108 Para a representação computacional da ontologia, utilizar-se-á um editor de ontologias. Existem vários tipos já mencionados. Neste projeto de pesquisa, utiliza-se o Protégé. A escolha se deu em função de ser o mais difundido no grupo de pesquisa do qual o autor faz parte. Este software é um projeto desenvolvido com a colaboração de várias comunidades científicas do mundo. Sua base é a Universidade de Stanford. Maiores informações estão disponíveis no site http://protege.stanford.edu/plugins/owl/ . 4.3 DESENVOLVIMENTO DA ONTOLOGIA NO AMBIENTE PROTÉGÉ Para o desenvolvimento da ontologia, adotou-se a estratégia de avançar na implantação por versões. A cada etapa vencida, fazia-se uma verificação e assim os erros e falhas eram detectados por camada, facilitando a localização e correção. Optou-se por não dar o passo seguinte sem que o anterior estivesse consolidado. Para o trabalho em questão, este procedimento auxiliar foi de grande valia, muito embora de difícil execução, em função da dinâmica que assume o processo. Considerando o apresentado pelas metodologias de construção de ontologias, o processo é interativo e não há um único caminho correto para o desenvolvimento do trabalho. Isto é percebido quando se implanta o modelo no ambiente computacional. Nesse momento, é necessário criar estruturas auxiliares ou alterar o planejado para atingir o objetivo do desenvolvimento da ontologia e manter-se no escopo. 109 A Fig. 4.11 representa o discurso do domínio modelado para a teoria das Cinco Forças Competitivas de Porter. Concorrentes entrantes temNegociação temAmeaça éAmeaça temNegociação Clientes Fornecedores Concorrentes na Industria éNegociação éNegociação Competição temAmeaça éAmeaça Produtos Substitutos Figura 4.11: Discurso do domínio modelado para a teoria das Cinco Forças Competitivas de Porter 110 Nas figuras 4.12 a 4.22, vêem-se algumas das principais telas editor de ontologias Protégé. Figura 4.12: Classes representando os elementos do referencial teórico 111 Figura 4.13: Propriedades da ontologia Figura 4.14: Elementos constitutivos da ontologia, representando os dados referentes às forças que integram o ambiente de competitividade de Porter 112 Figura 4.15: Modelagem da força competitiva Cliente Figura 4.16: Representação da força Entrantes em potencial 113 Figura 4.17: Força competitiva Fornecedores 114 Figura 4.18: Produtos substitutos em potencial 115 Figura 4.19: Querie elaborada para testar o funcionamento da ontologia. 116 Figura 4.20: Resultado da avaliação do teste de consistência entre a ontologia proposta e a ontologia inferida pelo aplicativo 117 Figura 4.21: Resultado do teste de inconsistência da ontologia 118 Figura 4.22: Esquema percebido pelo ambiente da construção da ontologia Após esta etapa, verificou-se a antologia quanto a inconsistências e realizaram-se ajustes para atender as premissas inerentes à etapa. Passou-se então à implantação de outros conceitos referentes ao modelo em questão. Um fator a observar quando se está implantando o modelo referencial, é que o incremento de um recurso, classe ou propriedade atende um ou mais fatores do modelo referencial. O projeto foi executado em cinco versões, em função da implantação de propriedades e classes. A cada versão se implantava uma nova classe e novas propriedades. O critério para o estabelecimento de cada versão se baseava no grau de complexidade da etapa a vencer. Para representar a ontologia, foram definidos três níveis, 0, 1 e 2. Em cada um deles, um nível de abrangência foi atingido. Abaixo, apresenta-se a versão final da ontologia, após a edição e construção de três fases intermediárias, constantes do Anexo III. 119 4.4 VERSÃO FINAL DA ONTOLOGIA A seqüência de telas apresentadas nas Fig. 4.23 a 4.33 contempla os elementos da ontologia em questão. Figura 4.23: As classes da atual fase da ontologia 120 Figura 4.24: Classe Cliente nível A 121 Figura 4.25: Classe Cliente nível B 122 Figura 4.26: Classe Concorrentes na Indústria 123 A classe Documento, apresentada na figura abaixo, não pertence ao nível 0 no plano de representação esquemática, porém foi desenvolvida para fins de validação do modelo, já que a premissa a ser atendida por esta fase da pesquisa está baseada na necessidade de monitorar o relacionamento da empresa com seus clientes através das correspondências enviadas por eles. Figura 4.27: Classe documentos 124 Figura 4.28: Entrantes em potencial 125 Figura 4.29: Classe Fornecedores e algumas instâncias 126 A figura abaixo apresenta a classe Produtos atuais. Incluiu-se esta classe na fase atual do projeto para estabelecer relação com os clientes e com os produtos substitutos. A relação entre os clientes é que os produtos atuais são os fatores que ligam os clientes às empresas participantes da indústria, e os produtos substitutos o são na medida em que se considera que há produtos a serem substituídos. Figura 4.30: Classe Produtos atuais 127 Figura 4.31: Classe Produtos substitutos 128 A figura abaixo apresenta versão atual da classe Tema dos documentos. Esta classe permite a seleção de documentos por tema. Um dos temas a serem considerados é Reclamação. É possível inserir um número indefinido temas e controlar documentos não estruturados a partir deles. Figura 4.32: Classe Tema dos documentos 129 A classe Tipo de documento, mostrada na figura abaixo, está vinculada aos documentos que a empresa recebe. Através dela, pode-se identificar quando chega um e-mail, um relatório, um parecer, uma carta, um convite, entre outros. Figura 4.33: Classe Tipo de documento As telas seguintes apresentam as propriedades definidas nesta ontologia. Cada propriedade apresenta um conjunto de atributos que permitem que se dê consistência e se estabeleça relação entre as classes. Através das propriedades, pode-se fazer perguntas para a ontologia, bem como definir restrições. As propriedades apresentadas relacionam classes entre si. Sendo assim são classificadas como object property (HORRIDGE 2004). 130 4.4.1 Propriedades da ontologia projetada 4.4.1.1 Propriedade “é ameaça entrante” Nesta tela, pode-se perceber o domínio e a imagem vinculadas à propriedade. Pode-se perceber também a utilização de propriedade inversa. Através dela, consegue-se inverter o sentido de pesquisa ou pergunta para a ontologia. Figura 4.34: Propriedade “é ameaça entrante” 131 4.4.1.2 Propriedade “é cliente remetente” Esta propriedade está vinculada ao documento, e a tela apresenta as classes de domínio e de imagem para esta propriedade. Figura 4.35: Propriedade “é cliente remetente” 132 4.4.1.3 Propriedade “é fornecedor atual” Esta propriedade relaciona os produtos produzidos pelos participantes da indústria com os fornecedores dos insumos destes produtos. Quando um comportamento destes fornecedores se altera, os participantes da indústrias deverão saber quais produtos que eles produzem poderão ser afetados. Figura 4.36: Propriedade “é fornecedor atual” 133 4.4.1.4 Propriedade “é negociação com cliente” Esta propriedade relaciona os clientes com os participantes da indústria. Estes participantes da indústria concorrem entre si e são as empresas que disputam neste ambiente de competitividade clientes e fatias de mercado. Figura 4.37: Propriedade “é negociação com o cliente” 134 4.4.1.5 Propriedade “é negociação com fornecedor” Esta propriedade relaciona o participante da indústria com o fornecedor dos insumos para os produtos que ele oferece aos clientes. Figura 4.38: Propriedade “é negociação com fornecedor” 135 4.4.1.6 Representação da propriedade “é produção atual” Esta propriedade relaciona o participante da indústria com o produto que ele produz. O cliente compra dele este produto, e ele, o produtor, necessita estar atendo aos produtos substitutos que o são para os produtos que ele fornece aos clientes. Figura 4.39: Propriedade “é produção atual” 136 4.4.1.7 Propriedade “é produto atual” Esta propriedade relaciona o cliente ao produto fornecido pelos participantes da indústria em questão. Figura 4.40: Propriedade “é produto atual” 4.4.1.8 Propriedade “é produto similar” A propriedade “é produto similar”, representada na Fig. 4.41, apresenta a relação entre os produtos atuais, fornecidos pelos participantes na indústria e os produtos substitutos, que representam ameaça. O enfoque desta propriedade é o de identificar que clientes podem trocar de produto. A similaridade é com os produtos atualmente fornecidos pelos participantes da indústria aos clientes. O cliente compra produtos, e estes têm outros que são similares. 137 Através desta propriedade, pode-se identificar os clientes alvo para os produtos substitutos identificados. Figura 4.41: Propriedade “é produto similar” 138 4.4.1.9 Propriedade “é produto substituto” A propriedade “é produto substituto”, representada a seguir, relaciona os produtos produzidos pelos participantes da indústria com os que podem substituí-los. A relação nesta propriedade é apenas entre produto atual e produto substituto. Figura 4.42: Propriedade “é produto substituto” 139 4.4.1.10 Propriedade “é tipo documento” Esta propriedade relaciona o documento com um tipo classificado. Com ela, pode-se dizer quantas cartas chegaram na empresa, que tipo de documento mais chega na organização, quantos relatórios, e-mails, pareceres, manuais, etc. chegaram na empresa. Através desta propriedade, o modelo pode dizer que chegou uma carta e que ela tem reclamação de cliente. Figura 4.43: Propriedade É tipo documento 140 4.4.1.11 Propriedade “é tipo tema documento” Esta propriedade refere-se ao tipo de tema constante no documento. Para dar suporte à estratégia de bom relacionamento com clientes, as regras de restrição identificarão temas de documento que tenham reclamações. Figura 4.44: Propriedade É tipo tema documento 141 4.4.1.12 Propriedade Tem ameaça entrante Esta propriedade é a propriedade inversa da “é ameaça entrante”. Permite navegar no sentido oposto à propriedade da qual ela é a inversa. Utiliza-se este recurso para dar mais flexibilidade e robustez ao modelo. Dentre outras, a característica desta propriedade é a inversão das classes domínio e imagem. Figura 4.45: Propriedade “tem ameaça entrante” As demais propriedade presentes nestas telas são propriedades inversas, conforme já mencionado, todas têm uma oposta que permite avaliar sua configuração bem como, os domínios e as imagens 142 4.4.1.13 Propriedade “tem nome” Trata-se de uma propriedade diferente das anteriores. Esta propriedade relaciona classes com seus indivíduos, a quem atribui características tais como nome, data, tipo, status, etc. Todas as classes mencionadas em domain utilizam esta propriedade. Figura 4.46: Propriedade “tem nome” 143 4.4.2 Visão esquemática do estágio atual da ontologia O ambiente de desenvolvimento da ontologia disponibiliza várias ferramentas bastante úteis para suporte ao projeto de desenvolvimento. A figura 4.47 apresenta uma tela com a visão esquemática atual da ontologia. Figura 4.47: Visão esquemática do estágio atual da ontologia 144 5 VALIDAÇÃO DO MODELO 5.1 PROCESSO DE VALIDAÇÃO DO MODELO Para validar o modelo, resgata-se o problema da pesquisa: Como acessar os dados presentes em documentos não estruturados de uma organização para dar sustentação a uma estratégia de competitividade? O projeto de pesquisa responde a pergunta através do modelo criado. Partindo do referencial teórico de competitividade apresentado por Porter, modelou-se um domínio, construiu-se uma estrutura ontológica que representasse o domínio do conhecimento em questão e fizeram-se perguntas à estrutura, que devolveu respostas coerentes, como se pode observar. 5.1.1 Situação A tela da Fig. 4.48 mostra a classe Produto atual, bem como outras classes que com ela se relacionam, a saber. Produtor do produto atual, Fornecedor para os insumos deste produto, Cliente e Produto substituto. A tela apresenta também o nome do produto e a ficha técnica. Para a pergunta “Que empresa produz o produto atual?”, observa-se que a resposta pode se dar através de análise visual na tela da ferramenta, o que constitui processo pouco seguro em função de limitações humanas e de processo. Com a elaboração de um processo automático de pesquisa à ontologia, através de queries, pode-se obter a resposta. 145 Figura 4.48: Classe produto atual bem como outras classes que com ela se relacionam 146 A Fig. 4.49 apresenta a tela com pergunta e resposta. Comparando a tela que apresenta a classe e o conjunto de outras classes e propriedades com que ela se relaciona, tem-se a base para validar a consistência da resposta dada. Figura 4.49: Tela de validação da querie A figura acima mostra o resultado do processamento da querie que pergunta sobre a(s) empresas que fornece(m) o produto atual. Todo processo pode ser representado em formatos que permitem aplicar linguagens de marcação e assim processar o código. Os conceitos que deram suporte à resposta estão presentes no modelo da ontologia que utilizou o referencial teórico de Porter. Sendo assim, afirma-se que é possível dotar uma organização de modelo para acessar dados não estruturados e com ele dar sustentação a um processo de competitividade organizacional. No Anexo IV, apresenta-se o código em OWL, HTM e RDF do resultado da marcação dos documentos não estruturados. Outra questão para a qual o modelo necessita dar suporte é a estratégica de atender bem ao cliente, ou ter uma ação rápida para os casos em que houver reclamação dos clientes. 147 Para tanto, elaborou-se uma querie que identifica os documentos recebidos pela organização e identifica os que são de interesse da equipe de estratégia competitiva da organização. A Fig. 4.50 apresenta os documentos já marcados, bem como a maneira através da qual a ontologia representa esses dados. Tela com os indivíduos da classe Documento, bem como as demais relações e instâncias que o modelo estabelece. Figura 4.50: Tela com os indivíduos da classe Documento 148 A tela da Fig. 4.51 mostra os clientes e as empresas das quais eles são clientes. A tela da Fig. 4.52 apresenta as correspondências que contêm reclamação e são dos clientes classe A. Figura 4.51: Clientes e as empresas Observa-se que as caixas das propriedades informam e apresentam a relação entre as classes e os indivíduos que as integram. 149 Para finalizar a averiguação, apresenta-se a tela com os clientes nível A. Figura 4.52: Correspondências que contêm reclamação e são dos clientes classe A 150 A Fig. 4.53 apresenta a empresa que produz determinado tipo de produto. Para o caso, clientes da empresa 3. Figura 4.53: Empresa que produz determinado tipo de produto para um cliente 151 A Fig. 4.54 apresenta o resultado de processamento de querie chamada Produtos atuais da empresa 1. Conforme o nome, a querie resgata todos os produtos que a empresa 1 produz. Figura 4.54: Resultado de processamento de querie chamada Produtos atuais da empresa 1 152 O funcionamento da querie que identifica todos os clientes pode ser visto através da Fig. 4.55. Figura 4.55: Funcionamento da querie que identifica todos os clientes 153 A identificação de todos os clientes da classe A, também é uma atividade modelada na estrutura que fornece este tipo de informação. A figura 4.56 apresenta o resultado da aplicação desta querie. Figura 4.56: Identificação de todos os clientes da classe A Outras queries podem ser executadas, e os resultados ratificam o que se conclui sobre o resultado do trabalho de pesquisa desenvolvido. Para finalizar esta etapa de validação. Apresenta-se a querie que identifica e informa que empresas da classe A enviaram correspondência com reclamação. 154 A Fig. 4.57 apresenta o resultado do processamento de queries identificando os clientes que enviaram correspondência com reclamação. Figura 4.57: Queries identificando os clientes que enviaram correspondência com reclamação 5.2 CONCLUSÃO DA VALIDAÇÃO O processo funciona. Tanto a metodologia para o desenvolvimento do modelo, quanto os resultados intermediários e agora definitivos demonstram que o modelo é válido e contribui para acessar documentos não estruturados e assim auxiliar em uma estratégia de competitividade. 155 6 RESULTADOS, CONTRIBUIÇÕES E CONCLUSÕES Esta tese ocupou-se do problema de pesquisa “Como acessar os dados presentes em documentos não estruturados de uma organização para dar sustentação a uma estratégica de competitividade?“. Para investigá-lo, definiu-se o objetivo geral “desenvolver um modelo para recuperação de dados não estruturados a partir de um referencial de competitividade organizacional”, além dos objetivos específicos “modelar um domínio de conhecimento com base em uma estratégia de competitividade”; “construir uma ontologia para representar o domínio do conhecimento modelado”; “implementar a ontologia”; “executar testes em nível conceitual, para validar o modelo desenvolvido”. Obtiveram-se os resultados a seguir: 6.1 RESULTADOS OBTIDOS Existem muitas formas de fazer acessos a documentos estruturados, semi-estruturados e não estruturados. Para documentos estruturados, o domínio da tecnologia atingiu um nível que faz com que a atividade seja trivial. A disponibilidade de soluções é grande, está difundida e é de fácil acesso. Com relação a dados semi-estruturados, as linguagens de marcação e toda uma gama de códigos e algoritmos permitem seu manuseio com relativa facilidade. Com a necessidade gerada pela Web, as soluções para o manuseio desses tipos de dados estão ao alcance de todos. Um ponto a destacar neste tipo de ambiente de programação ou de utilização de aplicativos é a necessidade de se familiarização com orientação a objeto, em um mínimo de referências conceituais. Com relação a dados não estruturados exige-se um pouco mais de esforço. As soluções computacionais existem e estão disponíveis em um grau de disseminação que requer familiarização com o tema para localizá-las. A recuperação de dados não estruturados é uma atividade que exige metodologia de modelagem de domínio para que se possa mapear o dado não estruturado e identificar o conteúdo do mesmo. Como o formato deste dado está implícito no próprio documento e a 156 identificação do formato do mesmo somente ocorre após uma análise do formato e conteúdo, é fundamental encontrar uma ferramenta que auxilie no desenvolvimento desse modelo conceitual. As ontologias dão a essa tarefa uma dimensão de simplicidade e eficiência. Através da modelagem do domínio do conhecimento, estabelecendo relações entre as várias propriedades do ambiente de domínio modelado, pode-se representar o documento de forma a associá-lo a uma estrutura capaz de ser compreendida por toda uma comunidade. Com o auxílio das linguagens de marcação e tirando proveito da capacidade que estas ferramentas de construção de ontologias têm em gerar códigos XML, HTML, RDF e outros, a utilização de recursos computacionais sobre o resultado deste trabalho torna resolvido o problema do acesso aos dados não estruturados. A modelagem do domínio do conhecimento presente no documento não estruturado e a possibilidade de representar seu conteúdo através de tags de linguagem de marcação elevam o documento para uma categorização de documento semi-estruturado, e a solução em termos de tecnologia computacional para o tema é conhecida e amplamente dominada. Sendo assim, com o modelo apresentado está resolvido o problema de capacitar a organização para acessar os dados não estruturados. Um outro aspecto presente no problema de pesquisa a ser encaminhado estava vinculado à associação do documento não estruturado a uma estratégia de competitividade. Este aspecto também foi resolvido com a aplicação de ontologias. As ontologias foram o grande elemento estrutural que, associado aos documentos não estruturados, possibilitou o aporte de dois elementos significativos para a solução ao problema da pesquisa. Com a representação do conhecimento através de estruturas ontológicas, ficou superada a necessidade de indexação do documento, já que, através dos axiomas, das classes, propriedades e restrições, tornou-se possível o acesso aos documentos devidamente marcados. A possibilidade de representação de conteúdos semânticos, vinculados a um referencial teórico de competitividade, resolveu a questão de dar à recuperação dos dados um método definido por este referencial. Embutidas no método estão as regras de negócio, as restrições e as taxonomias que favorecem a utilização de critérios para a recuperação de documentos não estruturados que se enquadrem em determinada situação. Com isso, ficou resolvido o problema de acessar documentos não estruturados presentes na organização, segundo um referencial teórico que dê sustentação a uma estratégia de competitividade. Sem o modelo desenvolvido por esta tese, a solução para a questão de pesquisa proposta está vinculada a uma grande quantidade de aplicação de recursos computacionais, 157 necessários para dar sustentação a pesados métodos computacionais que fazem o rastreamento e indexação dos documentos não estruturados da organização, apresentados no capítulo da revisão da literatura. O volume de recursos computacionais necessários e o grau de complexidade para disponibilizar a informação desencorajam sua utilização, fazendo com que os documentos não estruturados fiquem relegados à possibilidade de análises a posteriori, sujeita ainda as falhas dos sistemas suportados por ações humanas, repetitivas e rotineiras. Estes sistemas têm-se mostrado ineficientes por rotatividade das pessoas que dão suporte aos mesmos e pela inerente condição de susceptibilidade a falhas humanas. Considerando o objetivo geral, o modelo foi desenvolvido e está definido. Ele permite o atendimento a cinco questões nevrálgicas no que se refere à implantação de processos e ao envolvimento de metodologias para dar sustentação aos mesmos. As cinco questões são as seguintes: 6.1.1 Compreensão e compartilhamento do referencial teórico a ser implementado. Com a metodologia apresentada no referencial teórico, é possível estabelecer atividades que permitam compreender o conteúdo do referencial teórico e compartilhar esta compreensão com os demais membros do conjunto responsável por dar sustentação à estratégia de competitividade. 6.1.2 Localização do modelo de competitividade à realidade da organização. Este aspecto assume grande importância, na medida que toda empresa tem suas idiossincrasias. Sem considerar este aspecto, corre-se o risco de gerar muitas inconsistências na implementação das ações que darão suporte à estratégia de competitividade. Desde a localização de recursos físicos e tecnológicos até o acoplamento dos novos conceitos à cultura organizacional, muito há que fazer para estabelecer o melhor ajuste possível e assim localizar (adaptar) o referencial à estratégia de competitividade. A localização estabelece o modus operandi do processo inerente ao referencial teórico considerado, estabelece políticas, regras de negócio, rotinas, responsáveis e recursos de tecnologias que deverão ser contemplados para a sustentação ao processo. O modelo garante esta posição com aplicação de metodologia estruturada e detalhada no processo. 158 6.1.3 Adequação dos recursos necessários à sustentação do projeto. Esta etapa fica assegurada com o atendimento aos planos operacionais que derivam da etapa anterior. Uma grande desafio a ser vencido quando se estabelecem planos de trabalho é identificar as tarefas e definir prazos e recursos necessários para a sua execução. A metodologia integrante do modelo construído favorece a execução desta etapa, na medida que o processo de localização do referencial teórico contempla, necessariamente, a elaboração de planos operacionais com indicações precisas para o que deve ser feito, quem fará, quando fará, onde e por que desenvolverá a atividade. 6.1.4 Modelagem do domínio do conhecimento presente no referencial teórico que dá suporte à estratégia de competitividade. Este aspecto torna possível o registro e explicitação gráfica da compreensão do conhecimento contido no referencial teórico, presente na estratégia de competitividade. Esta etapa descreve os conceitos e os relacionamentos entre eles e permite enunciar axiomas que nortearão a conduta de cada elemento responsável pela manutenção da estratégia de competitividade. 6.1.5 Construção da ontologia e disponibilização de ferramentas para utilização de recursos computacionais na operacionalização do processo. Esta etapa consolida a eficiência do modelo, na medida que permite a utilização de recursos computacionais na operacionalização do modelo. Com o concurso do computador, estabelece-se velocidade, precisão, invariabilidade de critérios, redução de custos e constância operacional ao processo. A utilização do modelo em meio computacional transfere para o computador a responsabilidade de aplicar inteligência ao processo. Sem o computador, a análise de critério precisaria ser suportada e desenvolvida por pessoas. Isto implicaria identificar, treinar e garantir constância e invariabilidade de operação a um ser humano. Ou seja, esta pessoa não poderia ficar doente, não poderia ter seu ânimo alterado em função de variações ambientais, tais como temperatura e luminescência, deveria ser imune a mecanismos de rejeição de outras pessoas ou de atividades, deveria ter critérios inalteráveis para estabelecer avaliações com 159 relação a conteúdos de conhecimento e executar estas atividades, associadas a outras, com a mesma eficiência. Estas são algumas das várias questões que, se não atendidas amplamente, põem a perder todo o processo estabelecido. O computador, municiado pelo conhecimento modelado, executa as tarefas com discrição, rapidez, constância, invariabilidade e precisão que dão a esta parte do processo um grau de estabilidade impossível de alcançar com o concurso humano, por mais treinado e comprometido que seja. Com relação à construção da ontologia, as tecnologias existentes permitem acesso a metodologias que favorecem a execução desta tarefa de forma segura e eficiente. O processo é iterativo e as iterações vão dando precisão e aperfeiçoamento. As ferramentas disponíveis para a construção das ontologias têm um grau de aperfeiçoamento significativo, dando rapidez e segurança ao desenvolvimento. E os recursos que estes ambientes disponibilizam permitem a elaboração de perguntas e o estabelecimento de inferências que dão ao modelo grande capacidade e flexibilidade. A possibilidade de traduzir os conceitos e propriedades da ontologia em linguagens interpretadas por máquinas permite aplicarem-se recursos computacionais e assim implementar todas as características desejáveis para tornar o resultado da aplicação do modelo uma resposta ao problema da pesquisa em questão. Sendo assim, é possível recuperar dados não estruturados para dar sustentação a uma estratégia de competitividade, e as organizações podem dispor desta solução em função do baixo custo e pouca complexidade para a implantação da solução construída. 6.2 CONTRIBUIÇÕES As contribuições que esta tese proporciona estão vinculadas a sete questões assim identificadas: 6.2.1 Incorporação de tecnologia nas organizações A execução do modelo traz como conseqüência secundária a incorporação pela organização de toda uma gama de conhecimento presente no referencial teórico em questão. A aplicação das primeiras etapas do modelo permite a incorporação, não apenas de referencial teórico de competitividade, mas também de outros preceitos metodológicos que a empresa queira internalizar. 160 6.2.2 Gestão de processos As várias atividades inerentes ao desenvolvimento do modelo, bem como as metodologias presentes nestas atividades, habilitam a organização a aperfeiçoar a gestão de seus processos. Inicialmente orientado para a estratégia de competitividade, o modelo pode ser desmembrado e ser utilizado para a implantação de outras estratégias. 6.2.3 Implantação de estratégia de competitividade Sendo objeto deste trabalho de pesquisa, a efetiva implantação de uma estratégia de competitividade é o resultado final da aplicação do modelo construído. As várias etapas do modelo e as metodologias presentes em cada uma destas fases garantem a implantação do referencial eleito. O cuidado em estabelecer e compartilhar as compreensões e o conjunto de atividades suportadas por metodologia estruturada e da fácil aplicação garantem o perfeito acoplamento do referencial à organização, dando efetividade ao processo de implantação. 6.2.4 Alinhamento estratégico da organização Com a compreensão e compartilhamento da visão estratégica presente no referencial teórico que dará sustentação à estratégia de competitividade, a organização passa a contar com um elemento de acordo semântico fundamental para favorecer o entendimento entre seus gestores e a definição de balizas para nortear as ações. O comportamento constante e preciso estabelecido pela utilização de recursos computacionais libera o corpo diretivo envolvido para desenvolver outras atividades, e o referencial estabelecido, em conjunto com a aplicação do modelo, favorece a compreensão de aspectos da organização que levam a um melhor alinhamento estratégico. 6.2.5 Estabelecimento de controle sobre a execução da estratégia Sendo uma das funções básicas da organização, o estabelecimento de controle sobre os processos é fundamental para mantê-los e aperfeiçoá-los. Com a definição clara do escopo do processo, inerente à aplicação do modelo proposto, a organização dispõe de recursos para estabelecer o controle sobre os processos inerentes à estratégia de competitividade em questão e pode desdobrar essa habilidade para 161 outras áreas. A participação no processo de implantação do referencial teórico dará ao integrante do processo habilidades que o capacitarão para estabelecer esta função básica na administração de qualquer processo organizacional. 6.2.6 Facilidade e baixo custo da implantação da solução Por envolver atividades e metodologias conhecidas, a aplicação do modelo apresenta facilidade de execução e baixo custo de operação. O desenvolvimento das atividades iniciais inerentes ao modelo envolve pessoas e metodologia de domínio da comunidade das organizações e dos centros de tecnologia em geral. O desenvolvimento da modelagem do domínio do conhecimento, a construção da ontologia e a implantação em recursos computacionais seguem um avanço que aponta para a diminuição de custos e a consolidação de uma estabilidade já presente em grande parte das metodologias e dos ambientes voltados para esta atividade. Sendo assim, fazendo paralelos com as várias tecnologias existentes para a implantação de soluções similares, que dêem às organizações condições de desenvolver o que o problema de pesquisa desta tese apresenta, fica claro que a solução proposta é fácil e de baixo custo. 6.2.7 Metodologia de análise e solução de problemas inerentes às questões da organização Presente no modelo proposto, um conjunto de metodologias para análise e solução do problema é oferecido nos passos intermediários para a internalização dos preceitos inerentes ao referencial teórico em questão. As habilidades que serão desenvolvidas pela equipe participante do projeto dão à organização condições de aplicar esta metodologia para analisar e resolver outros problemas existentes na organização. 6.2.7 Apropriação de conhecimentos pela organização Com a modelagem do domínio de conhecimento, a localização e o desenvolvimento da ontologia, o conhecimento inerente ao referencial teórico fica apropriado pela organização. Com a implantação de recursos computacionais o conhecimento inerente ao referencial teórico passa a fazer parte dos processos da organização dando-lhes vida e efetividade, nem sempre possíveis quando o conhecimento fica ao encargo de pessoas. 162 A execução do projeto desta tese evidenciou a necessidade de mais pesquisa no desenvolvimento de soluções em nível da habilitação semântica para os processos computacionais. As características dos dados existentes nas organizações e o nível de necessidades geradas pela modificação do ambiente onde as organizações estão inseridas apontam para a premente necessidade de equipá-las para fazer frente aos desafios que as esperam. Capacitar as organizações para sobreviverem ao embates do dia-a-dia é garantir uma sociedade mais sólida e justa para todos. Os dados presentes nos computadores das organizações têm muito a oferecer. Pouca atenção ainda se dá a esses dados. Percebe-se que o despreparo de dirigentes e a dificuldade de acesso às tecnologias podem ser dois dos motivos para isso. Este projeto de pesquisa mostrou como é possível reverter este processo e como é significativo o resultado a que se pode chegar com a aplicação destas tecnologias aos processos da organização. 163 REFERENCIAL BIBLIOGRÁFICO ABITEBOUL, S. (1997). Querying Semistructured Data. INTERNACIONAL CONFERENCE ON DATABASE THEORY, Delphi, Greece. ABITEBOUL, S., P. BUNEMAN, et al. (2000). Data on the Web: from relations to Semistructured Data and XML. San Francisco. ABREU, A. F. (1999). Gestão da Inovação: Uma abordagem orientada à gestão corporativa. Florianópolis, IGTI/UFSC. ALVES, R. (2002). A gestão do conhecimento e as tecnologias de informação. 2004. ARANGO, G. and R. PRIETO-DÍAZ (1994). Domain Analisys Concepts and esearch Directions. WORKSHOP ON SOFTWARE ARCHITECTURE, Los Angeles, 1994, USC Center for Software Engineering. Anais... ATZENI, P., G. MECCA, et al. (1997). Semistructured and Structured Data in the Web: Going Back and Forth. SIGMOD Record. v.26: p.16-23. AURELIO, N. D. (1994). Novo Dicionário da Lingua Portuguesa. Rio de Janeiro, Editora Nova Fronteira. BONIFACIO, A. S. and C. A. Heuser (2002). Ontologias e Consultas Semânticas: uma aplicação ao caso Lattes. CARDOSO, O. R. (1993). Foco da Qualidade Total de Serviços no Conceito do Produto Ampliado. Departamento de Engenharia de Produção. Florianopolis, Universidde Federal de Santa Catarina. CASTRO, P. A. D. (2000). Representação de Conhecimento. 2004. CHEN, H. (1994). A textual database/knowledge-base coupling approach to creating computer-supported organizational memory. CLARK, J. and K. GURY (1998). Innovation and Competitiveness: A review. Techonology Analysis & Strategic Management. V.10. CORAL, E. (2002). Modelo de Planejamento Estratégico para a Sustentabilidade Empresarial. Emgenharia de Produção e Sistemas. Florianópolis, Universidade Federal de Santa Catarina. 164 CORCHO, O., M. FERNÁNDEZ-LÓPEZ, et al. (2001). ontoweb, thechnical roadmap. 2005. DAVENPORT, T. H. and L. PRUSAK (1998). Conhecimento Empresarial. Como as Organizaçòes Gerenciam o seu Capital Intelectual. Rio de Janeiro, Campus. DIEGN, R. (2000). Knowledge Management and the Internet. IEEE Intelligent Systems. v. 15: pp. 14-17. DRUCKER, P. (2001). O Advento da Nova Organização. In Gestão do Conhecimento, Ed. Campus. ECIB (1994). ECIB - Estudo da competitividade da industria brasileira. Campinas - SP, Ed. Papirus. FALBO, R. A. and A. C. C. NATALIA (2003). Gerência de Conhecimento em ODE. XVII Simpósio Brasileiro de Engenharia de Software (SBES'03), Manaus, Brazil, outubro de 2004, Anais. FÉRNANDEZ, M., A. GÓMEZ-PÉREZ, et al. (1997). METHONTOLOGY: From Ontological Art Towards Ontological Engineering. Working Notes. California, Ontological Engineering, Stanford University. FERREIRA, A. B. H. (1999). Novo Dicionário da Lingua POrtuguesa. Rio de Janeiro, Aurélio Buarque de Holanda Ferreira e J.E.M.M. Editores Ltda. FILHO, P. S. (1999). A Gestão do Conhecimento e a motivaçào nas Organzaçoes. 2005. FREITAS, F. L. G. (2004). ONTOLOGIAS E A WEB SEMÂNTICA. Santos - S.P. Brasil, Universidade Católica de Santos. FREITAS, H. and C. M. KLADIS (1995). O Processo Decisorio: Modelos e Dificuldades. Revista Decidir ano II. n.08: p. 30 a 34. FURLAN, J. D., I. M. IVO, et al. (1994). Sistemas de Informações Executivas. São Paulo, Makron Books. GOMES.J.S. and J. M. A. SALLES (1999). Controle de Gestão: Uma Abordagem Contextual e Organizacional. São Paulo, Atlas. GOMESZ-PERES, A. (1994). "From Knowledge Basead Systemsto Knowledge Sharing tecnology: Evaluation and Assessment." GÓMEZ-PÉREZ, A., M. FERNANDEZ, et al. (1996). Tawards a Method to Conceptualize Domain. WORKSHOP ON ONTOLOGICAL ENGINEERING (ECAI'96, Budapeste, 1996. GRUBER, T. R. (1995). Toward Principles for The Design of Ontologies used for Knowledge Sharing. Int. J. Human-Computer Studies. v.43. 165 GUIZZARDI, G. (2000). Uma Abordagem Metodológica de Desenvolvimento para e com Reuso, Baseada em Ontologias Formais de Domínio. Departamento de Ciência da Computação, Universidade Federal do Espirito Santo. GUIZZARDI, G. (2000/4). UMA ABORDAGEM METODOLÓGICA DE DESENVOLVIMENTO PARA E COM REUSO, BASEADA EM ONTOLOGIAS FORMAIS DE DOMÍNIO. Departamento de Ciência da Computação, Universidade Federal do Espirito Santo. GUIZZARDI, R. S. S., L. AROYO, et al. (2002). Help&Learn: A Peer-to-Peer Architecture to Support Knowledge Management in Collaborative Learning Communities. 2004. HERMENEGILDO, J. (2002). Ver titulo da tese dele. HORRIDGE, M. (2004). A Pratical Guide To Building OWL Ontologies With The ProtégéOWL Plugin. JADE, N. B. d. (2004). Ontologia, Núcleo Brasileiro de JADE. 2005. KRAEMER, A., D. W. CARVALHO, et al. (2004). Ontologia. 2005. LAUS, J., R. A. AZAMBUJA, et al. (2002). Sistema de E-Commerce, gerenciado por um Eis. 2004. MELLO, R. d. S., C. F. Dorneles, et al. (2000). Dados Semi-Estruturados. XV Brazilian Database Simposium, João Pessoa, PB, Brazil. MINTZBERG, H. and J. B. QUINN (2001). O Processo da Estratégia. Porto Alegre, Bookman. MIRANDA, M. (1981). Organizações e Metodos. São Paulo, Ed. Atlas. MONTGOMERY, C. A. and M. E. PORTER (1998). Estratégia: a busca da vantagem competitiva. Rio de Janeiro, Campus. MUSEN, M. A. and e. al. (1995). PROTEGE-II: Computer support for development of intelligent systms from libraries of component. MEDINFO'95 - WORLD CONGRESS ONF MEDICAL INFORMATICS, 8, Anais. NATALI, A. C. C. and R. A. FALBO (2003). Infra-Estrutura para Gerência de Conhecimento. X Sessão de Ferramentas do Simpósio Brasileiro de Engenharia de Software SBES'2003, Manaus - Amazonas, outubro de 2003. Infra-estrutura para Genhecimento NOY, N. F. and H. C.D. (1997). The State of Art in Ontology Design: A Survey and Comparative Reviw. AI Magazine. NOY, N. F. and D. McGuinness (2005). Ontology Development 101:Guide to Criating Your First Ontology. 2005. 166 O'BRIEN, A. J. (2001). Sistmas de Informação e as Decisões Gerenciais na Era da Internet. São Paulo, Saraiva. OLIVEIRA, D. P. R. (2002). Sistemas de Informações Gerenciais. São Paulo, Editora Atlas. PECOTCHE (1994). Curso de Iniciação Logosófica. São Paulo, Ed. Logosófica. PECOTCHE, C. B. G. (1985). Exegese Logosófica. São Paulo, Ed. Logosófica. PORTER, M. E. (1996). Vantagem competitiva: criando e sustentando um desempenho superior. Rio de Janeiro, Campus. PRADO, L. J. (2004). A estratégia por 10 caminhos. PROTÉGÉ (2004). A Pratical Guide To Building OWL Ontologies With The Protégé-OWL Plugin. SACHS, I. (1993). Estratégias de Transição para o Século XXI: Desenvolvimento e meio ambiente. São Paulo, Studion Nobel, Fundap. SERAFIM F., P. (1999). A Gestão do Conhecimento e a motivaçào nas Organzaçoes. 2005. Serrano, A. (2004). Gestão do Conhecimento O novo paradígma das organizações. 2004. SERRANO, A. and C. FIALHO (2004). A ORGANIZAÇÃO DO CONHECIMENTO. 2004. USCHOLD, M. and G. M. (1996). ontologies: Principles, methods and applications. The knowledge Engineering Review. v.11: p.93-136. VALENTE, A. and J. BREUKER (1996). Toward Principled Core Ontologies. Banff, Canada, In B.R Gaines and M. Mussen, Proceedings of the KAW-96. YOGESH, M. (2004). "Integrating Knowledge Management Technologies in Organizational Business Processes: Getting Real Time Enterprises to Deliver Real Business Performance." Journal of Knowledge Management(Knowledge Management and Technology’, Q3). 167 ANEXO I – Listagem de projetos que envolvem ontologias Endereço 1: http://ksl-web.stanford.edu/kst/ontology-sources.html O endereço acima está vinculado a universidade de Stanford, base de operação para grandes projetos na área, apresentado abaixo. Sites Relevant to Ontologies and Knowledge Sharing The information on this page is far from complete. Please send suggestions to Richard Fikes. The information on this page has been collected from a number of sites, all of which are included here. Table of Contents • Specific Projects • General Resources Pages • Sources for Implemented Ontologies Specific Projects • Knowlege Sharing and Ontology work at Stanford's Knowledge System's Lab including the o Ontolingua system for distributed collaborative ontology editing and use. o The How Things Work (HTW) Project. • The KIF Knowledge Interchange Format standard • IEEE Standard Upper Ontology (SUO) Working Group • KQML - Knowledge Query and Manipulation Language • The ARPA Intelligent Integration of Information I³ project • The Process Interchange Format (PIF) project. • The Toronto Enterprise Integration Laboratory • The Planning Initiative (ARPI) • The PROTÉGÉ-II Research Project at Stanford. • The Cyc Project General Resources Pages • • • • Ontology resources collated by Nicola Guarino (Padova, Italy) Ontology resources collated by Doug Skuce at the University of Ottawa Knowledge-base Projects collated by Bruce Porter's group at the University of Texas, Austin. Classification Research Home Page (SIGCR, ASIS) 168 • Knowledge Representation and Reasoning group, collated by Enrico Franconi at IRST, Povo TN, Italy • TOP: Ontology resources page maintained by KR&R, Inc. • Aristotle - A clearinghouse devoted to projects, research, products and services devoted to • • • • • • • • • • • • • • • • • • • • • • 'automated categorization'. Untangle - Intelligent information access by providing a deep representation of information using description logics. University of Twente, the Ontology Collection homepage ESPRIT Projects relevant to knowledge sharing and ontologies: o EuroKnowledge - ESPRIT Project to co-ordinate and encourage standardisation activities in the area of knowledge technology. o KACTUS - ESPRIT Project on "modelling Knowledge About Complex Technical systems for multiple USe" o KADS-II - ESPRIT Project on "An Advanced and Comprehensive Methodology for Integrated KBS Development"; o KEML - Knowledge Engineering Methods and Languages, archive and mailing list. o FERMI - ESPRIT Project on "Formalisation and Experimentation on the Retrieval of Multimedia Information." o COMMET and KREST - Components of Expertise Method and Toolkit(Free University of Brussels) o TRADE, LCM and TCM - Toolkit for Requirements and Design Engineering (Free University of Amsterdam) o Linguistic Geometry - applications to manufacturing, space navigation, robotics, planning, scheduling, VLSI design and other systems o SPACENET - European Qualitative Spatial Reasoning Network Internet Medical Terminology Resources. o GALEN - Generalised Architecture for Languages, Encyclopaedias and Nomenclatures in Medicine. o Unified Medical Language System - (UMLS®). SHOE - A proposed small extension to HTML which allows HTML authors to annotate their web documents with formal knowledge-representation semantics. Language Analysis & Knowledge Engineering (LAKE) Research Group at Ottawa; SRI Artificial Intelligence Center - Representation and Reasoning Technologies; o the GKB-Editor: graphical browser/editor for declarative knowledge Knowledge reuse and ontologies research at Osaka University. Mizoguchi Lab, Japan - Ontology Engineering Shelter - an environment for collaborative, team development of large knowledge based systems in a manner facilitating sharing and reuse. Sensus - Ontology Creation and Use in the Pangloss project (papers) The Enterprise Ontology and Project at AIAI, University of Edinburgh The ThoughtTreasure ontology, as part of the ThoughtTreasure artificial intelligence program/tool set. The MIKROKOSMOS Ontology - from the Computing Research Laboratory, New Mexico State University. The Moby lexicon project. The Reuse Center - An Intelligent Distributed Data Base for OO Software Components. Ontological Foundations of Knowledge Representation - The AI & Robotics Group of LADSEB, Padua, Italy The ARPA/Rome Laboratory Planning Initiative (ARPI)Planning Ontology Construction Group (POCG), growing out of the older Knowledge Representation Specification Language (KRSL) effort. The MIT LCSClinical Decision-Making Group Guardian Angel project The MIT LCSPlanning Ontology Project The USC ISI SENSUS project The Edinburgh Plan Ontology Project 169 • ARPA Knowledge Sharing Effort library • The ThoughtTreasure ontology. This ontology is available under the terms of the GNU General Public License. It consists of 21,521 concepts and 37,162 assertions and is part of the ThoughtTreasure artificial intelligence program/tool set, which contains much else besides the ontology. • The Mikrokosmos ontology: An in-depth, broad coverage ontology for multilingual Natural Language Processing Sources for Implemented Ontologies • The MIKROKOSMOS Ontology - from the Computing Research Laboratory, New Mexico State University. • The Generalized Upper Model 2.0 developed originally to support natural language processing, but • • • • • • with extended goals towards more general domain modeling. The Toronto Virtual Enterprise (TOVE) project Generalized Upper Model - GMD, Darmstadt, Germany Planning and Reasoning Ontology at MIT; the Knowledge Representation Specification Language (KRSL); Planning Ontology Construction Group (POCG); the Edinburgh Activity/Process/Plan Ontology Project. Bibliography There is a growing literature on ontology development and use as distinct from general work in knowledge representation, knowledge-based systems, and conceptual modelling. As time allows, I will include references to such work here. • What is an Ontology? (Gruber) • Data and Knowledge Engineering (DKE) journal, Elsevier, 1996 special issue on Modelling Parts and Wholes; Alessandro Artale, Enrico Franconi, Nicola Guarino and Luca Pazzi: Part-Whole Relations in Object-Centered Systems: An Overview. Webmaster Last modified: Tue Jan 16 2001 170 Endereço 2: http://www.cs.utexas.edu/users/mfkb/related.html O endereço acima apresenta um catalogo de projetos em ontologia apresentado abaixo Some Ongoing KBS/Ontology Projects and Groups Quick Index: [ A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | VWXYZ] Also: [ Mailing Lists | On-Line Proceedings ] If you are working on or know of related work not mentioned here, please email me ([email protected]). Other useful Ontology and KR collections include: • • • • Stuart Russell's AI on the Web WPI's Webliography (on AI in Design) John Bateman's Ontology Portal David Chalmer's Philosophy of Mind bibliography. Knowledge-Base Projects, Groups, and Related Material 1.1.1 A • Algernon - (Univ. Texas at Austin). A frame-based knowledge representation language using access-limited logic for inference. New for 2003: Algernon in Java! • AOS - The Agricultural Ontology Service. A federated clearinghouse for terms, definitions and relationships in the agricultural and related domains for use by the agricultural community. (Kickoff meeting to be held in November 2001). • ARPI - The DARPA/Rome Laboratory Planning and Scheduling Initiative (now finished). Research in planning systems. The ontology group (within this) aims to design an ontology to enable knowledge sharing between the collaborating groups, and ultimately between computer systems directly. • AskJeeves - A question-answering Web search engine. • The Air Traffic Services (aviation) Ontology, part of a larger knowledge management program by the FAA. 1.1.2 B • BSR - The Basic Semantic Repository (Developed to support the EDI efforts, is "an internationally agreed register of multilingual data concepts"). • The BRICO Ontology - combines WordNet, Roget's Thesaurus, and the top-level of the Cyc ontology (MIT Media Lab). • WordsEye - a Natural Language Understanding system that converts English text into threedimensional scenes that represent that text. 171 • The Buffalo Ontology Site - Pointers to the philosophy, history, and some computational work in ontologies. • BPMO - The Business Process Management Ontology - an integrated information model which helps to better align IT with business, bringing together business process design, project management, requirements management, and business performance management (from Jenz & Partner, GmBH). 1.1.3 C • Carter - (Postscript paper). A (now defunct) tool for assisting experts in agreeing on what should • • • • • • • • • • • • • • • • • go into a consensus knowledge base. This paper was eventually published as: Trice A, Davis R, "Heuristics for reconciling independent knowledge bases", Information Systems Research, 4 (3), pp262-288, Sept 1993. Cerebra - A Description Logic reasoner which provides a way for applications to understand each other. "This may come as a surprise to some other software companies..." (from Network Inference). Chimaera - a software system that supports users in creating an maintaining ontologies, in particular merging multiple ontologies together and diagnosing individual or multiple ontologies (KSL, Stanford). CIA World Factbook - a popular resource for building a world-savvy KB. CKML - Conceptual Knowledge Markup Language. An application of XML and an extension of OML. (Also see white paper on CKML). CLASSIC (AT&T Labs, NJ) - a description logic. CLIPS - A public domain, expert system shell written in C. Also see the (non-public-domain) successor JESS. CODE4 - A graphical knowledge-base editor and knowledge management tool, from the Language Analysis and Knowledge Engineering Lab (LAKE), Univ. Ottawa, Canada. CommonSense Reasoning - See the Common Sense Problem Page, and Proc 4th Symp on CommonSense Reasoning. Also see Cyc, OpenMind, and PDKB. The Common Sense Problem Page - A list of benchmark problems in commonsense reasoning. CommonKADS - A comprehensive knowledge engineering methodology. See also: o Free University Brussels - older summary of KADS o KEML - Knowledge Engineering Methods and Languages. A mailing list and publication archive which evolved from the KADS project. o Integral Solutions Ltd - development of AI/KBS tools, including sale and support of the CommonKADS WorkBench, and involvement in the KACTUS project. Common Logic (CL) Standard - a new (2003) attempt to define a (ISO) standard language and semantics for use in Ontology and Knowledge Engineering. Also see earlier work on KIF. Common Logic Controlled English - a formal language with an English-like syntax (by John Sowa). The Component Library (CLib) - a knowledge base of formally represented, general, domainindependent concepts (Univ Texas at Austin), represented in the KM knowledge representation language. ConceptNet - A freely available commonsense knowledge base and natural language processing toolkit, generated automatically from the 700,000 sentences (as of 2004) of the Open Mind Common Sense Project. Concept Maps - A graphical notation for organizing and representing knowledge in an informal way. Also see this introduction to Concept Maps. For some examples, see the IHMC CMap Tools page (view with Internet Explorer) and the Graphic Organizer Concept Maps page. Conceptual Dependency - A summary of Roger Schank's conceptual primitives for representing simple sentences. Conceptual Grammar (TM) - A hierarchical knowledge base management system (KBMS) bundled with the VisualText (R) integrated development environment (IDE) and NLP++ (R) programming language (from Text Analysis International). 172 • Conceptual Graphs - Researchers using Peirce/Sowa's conceptual graphs theory for knowledge representation. FAQ. o Online Course in Knowledge Representation using Conceptual Graphs (by Ulrik Petersen, Univ Aalborg) o Mailing List and Mailing List Archives o CG Shorthand - Notes on a Visual Shorthand for Conceptual Graphs (Robert McNally) o The CG Standard. o Harry Delugach's Conceptual Structures homepage. o CGWorld - A workbench for Conceptual Graphs development, from LARFLAST, Univ Sophia, Bulgaria. (see here for the original announcement). o CharGer - A CG visual editor, running under a Java VM. o LINEAR - Mike Wermelinger's pointers to discussions/proposal for the CG linear (text-based) notation. o Reasoning and Unification over Conceptual Graphs - book by Dan Corbett, Univ South Australia. o Peirce Holdings International - Research and development of CG-based tools. o Project Peirce - A collaborative project for developing a CG workbench (see also ftp site). o Prolog+CG - A Prolog implementation of (part of) CGs. Also (non-computer-related) on Peirce: o PEIRCE-L - An email discussion forum on Peirce's Philosophy. o PORT - The Peirce On-line Resource Testbed: a massive effort to make Peirce's 100,000 pages of hand-written manuscripts available world-wide. • Contexts - Univ. Maine's collection of pointers. • Controlled Languages - Rolf Schwitter's collection of pointers. • CPR - Core Plan Representation. A planning ontology which supports the representation needs of many different planning systems, designed to facilitate information sharing and the creation of common planning services. • CRACK - A description logic with an on-line, Web-based interface (from IRST, Italy). • CYC - A massive ongoing effort to formalize common-sense knowledge. An open source version is now available as OpenCyc, including (parts of) the ontology, axioms, inference engine, and knowledge acquisition tools. Also see the CYC FAQ, and Jorn Barger's collection of Cyc resources on the Web. • CycL - the representation language of CYC. 1.1.4 D • DAML - DARPA Agent Markup Language. A DARPA program to develop a language and tools • • • • • • • • to facilitate the concept of the semantic web. DAML-S - The DAML Services ontology for specifying Web-based services (e.g., for ecommerce applications). The DARPA Knowledge Sharing Effort - See Knowledge Sharing Effort (DARPA). Description Logics. Also see Enrico Franconi's excellent course and overheads on DLs, and the DL systems Cerebra, CLASSIC, CRACK. DLP, FaCT, GRAIL, KRIS, LOOM, PowerLOOM, and RACER. Also see the Description Logic Handbook. Design Patterns - Repository of reusable, object-oriented programming abstractions. Dictionaries - Stauffer Library's collection of pointers to on-line dictionaries. DLML - A Description Logic Markup Language (Jerome Euzenat, INRIA, France) DLP, a Description Logic System (Bell Labs). DOLCE - a Descriptive Ontology for Linguistic and Cognitive Engineering, from the Laboratory for Applied Ontology (LOA), Italy. See here for publications about DOLCE. 173 1.1.5 E • eMystics.org - the world's first ontology of Vedic wisdom. • The Enterprise Ontology - a collection of terms and definitions relevant to business enterprises (AIAI, Edinburgh, UK). • EPILOG - (Episodic Logic). Len Schubert et al.'s knowledge representation language, for use in natural language processing. • Evaluation Methods for Knowledge Engineering - Lots of useful information. • EXPECT - an environment for developing knowledge-based systems that includes knowledge acquisition tools to extend and modify KBs (ISI, Los Angeles). 1.1.6 F • FaCT - An optimized, tableaux-based DL (Ian Horrocks, Manchester, UK) • F-Logic - A novel formalism that accounts in a clean and declarative fashion for most of the structural aspects of object-oriented and frame-based languages. • FLORA - An object-oriented KB language and application development platform. The programming language supported by FLORA is a dialect of F-logic with numerous extensions, which include a natural way to do meta-programming in the style of HiLog and logical updates in the style of Transaction Logic. • FLORID - A deductive, object-oriented database system employing F-logic as data definition and query language; FLORID has been extended for handling semistructured data in the context of Information Integration from the Web. • FrameNet - "an online lexical resource for English". Contains an extensive, semantic analysis of verbs and their case-frame representations. Also see (independent project) WordNet. • Functional Representation and Reasoning Community - Some pointers. 1.1.7 G • The Gene Ontology (GO) - a controlled vocabulary that can be applied to all organisms even as knowledge of gene and protein roles in cells is accumulating and changing. • Generalized Ontological Language (GOL) - see GOL. • GALEN - Generalized Architecture for Languages, Encyclopedias and Nomenclatures in • • • • • • Medicine. GALEN is a medical terminology server for supporting the development of clinical coding schemes, built using the description logic GRAIL. The Generalized Upper Model -- a linguistically motivated ontology that supports NL processing; a multilingual outgrowth of the Penman Upper Model. The Generic Frame Protocol - not a language, but a standardized set of low-level access functions for frame-based KR systems. GFP has been recently renamed as OKBC (The Open knowledge Base Connectivity Protocol). The Generic Knowledge-Base Editor - a graphical KB editor, implemented in Lisp+CLIM, from SRI. Supports the Generic Frame Protocol. GOL - General Ontological Language - A formal framework for building and representing ontologies. GOL provides a library of top-level ontologies which can be used as a framework for building more specific ontologies. (Univ. Leipzig, Germany). GRAIL - a Description Logic. Used in the GALEN and TAMBIS projects. GT - The Generic Task Toolkit. Chandrasekaren et al., Lab for AI Research, Ohio State Univ. A kit of domain-independent, method-specific, composable tools from which expert systems can be constructed. 174 1.1.8 H • Halo - a long-term, knowledge-based research program aimed at developing inference-capable • • • • applications which can acquire knowledge directly from domain experts, answer novel questions, and solve advanced problems in a broad range of scientific disciplines (Vulcan Inc.). HOMER - An "intelligent agent" integrating many aspects of AI, operating in a (simulated) microworld for unmanned submarines. HowNet - An on-line, common-sense KB for multilingual Natural Language Processing. It contains inter-conceptual relations and inter-attribute relations as connoted in Chinese lexicons and their English equivalents. (Also see this overview). HPKB - DARPA's High-Perforance Knowledge Base program, an initiative in constructing largescale, knowledge-based systems. This program finished in 2000, with the follow-up RKF program now underway. HTW - The How Things Work project at Stanford; use of a KB and interactive explanation facilities (through WWW) to assist understand/manage/etc. engineered products. 1.1.9 I • IBROW3 - An intelligent brokering service for knowledge-component reuse on the world-wide web (an Esprit project). • ICOM - A CASE tool for Intelligent Conceptual Modeling (Univ Manchester, UK).. It includes handling of multiple E-R diagrams, and logical specification verification. • IEEE Standard Upper Ontology (SUO) Working Group - see Standard Upper Ontology (SUO) Working Group. • Ikarus - an experimental, Web-based knowledge management system (from LAKE, Univ Ottawa, Canada). • Inference Engines: See Languages and Inference Engines for knowledge representation • InfoQuilt - A research project that support human-directed knowledge discovery in a multi- ontology, multi-agent environment. • Internet Business Logic - Writing and running English business rules with unlimited vocabulary, using a browser. Automatic generation and execution of SQL. (from Reengineering LLC). • Internet Medical Terminology Resources • IRST - Knowledge Representation and Reasoning Group (Povo, Italy) 1.1.10 J • JESS - Java Expert System Shell. JESS is a rule engine and scripting environment, originally inspired by the CLIPS expert system shell. • JOE - Java Ontology Editor (Center for IT, Univ South Carolina). Based on entity-Relation diagrams. Will read ontologies stored in KIF format. 1.1.11 K • KA2 - The Knowledge Annotation Initiative by (and of) the Knowledge Acquisition Community: o The community web portal for accessing this knowledge. o OntoBroker - the underlying system for ontology-based services. • KACTUS - An interactive environment for browsing, editing and managing ontologies (Univ Amsterdam). • KADS: See CommonKADS. • KAON - The KArlsruhe ONtology and Semantic Web infrastructure, an open-source ontology management infrastructure targeted for business applications. It includes a comprehensive tool suite allowing easy ontology creation and management, as well as building ontology-based applications. • KAW - Knowledge Aquisition Mailing List. 175 • Knowledge Acquisition Tools: See EXPECT, Shaken, and additional systems under Ontology Building Tools. • KIF - Knowledge Interchange Format: A proposed, logic-based format for exchanging knowledge • • • • • • • between computer programs (more details here). Also see the newer effort on the ISO Common Logic standard. KM - A frame-based knowledge knowledge representation language used by the Knowledge Representation Group at Univ Texas at Austin. The Knowledge Sharing Effort (DARPA) and related work. A large, collaborative project to research and promote knowledge-base reuse. o Ontology editor - log in and select the ontology editor to view/create Ontolingua ontologies. o email archive (email exchanges) o KIF - Knowledge Interchange Format: A proposed, logic-based format for exchanging knowledge between computer programs. o Stanford Ontology Editor - log in and select the ontology editor to view/create Ontolingua ontologies. Knowledge Systems Group - Univ Sydney, Australia. Research in belief revision. KOMET - A text generation system producing connected, natural language texts in multiple languages. Uses the Generalized Upper Model ontology, a multilingual outgrowth of the Penman Upper Model. KRIS - a description logic ( German Research Center for AI, GmbH) KRSL - Knowledge Representation Specification Language. Part of ARPI (DARPA/Rome Planning Initiative). KSL - Stanford's Knowledge Systems Lab; doing extensive, pionering research in knowledge representation, reuse, and sharing. 1.1.12 L • Laboratory for Applied Ontology (Italy) - a new (2002) laboratory resulting from the fusion of two former groups LADSEB-CNR and ITBM-CNR. • Language Analysis and Knowledge Engineering Lab (LAKE), Univ. Ottawa, Canada. o CODE4 - A frame-based Knowledge Management system for various applications (especially • • • • linguistics/terminology) o Ikarus - an experimental, Web-based knowledge management system. o ClearTalk - An English-like, formal language for expressing information. Languages and Inference Engines for Knowledge Representation: o For description logic languages, see Description Logics. o For conceptual graph tools, see Conceptual Graphs. o For other languages, see Algernon, CycL, EPILOG, F-Logic, KM, and SNePS. o In addition, the theorem proving/ automated reasoning community have developed numerous theorem provers operating on representations expressed in standard first-order logic syntax (e.g., see here). LIFE - (Logic, Inheritance, Functions, Equations). A programming language with some powerful mechanisms for KB construction (no longer supported). LOOM - a description logic (ISI, CA). Also see its successor PowerLOOM, and Bob MacGregor's Retrospective on LOOM o The Ontosaurus - a Web-based interface to LOOM. o ON9 - The ontology library at the Laboratory for Applied Ontology (Italy), developed using the ONIONS methodology and implemented in LOOM. o SHELTER - "SHELTER is intended to offer an environment for collaborative, team development of large knowledge based systems in a manner facilitating sharing and reuse.". Uses LOOM as it's underlying representation language. LSDIS Lab - The Large-Scale Distributed Information Systems Lab (Univ Georgia). Doing extensive research and education on the Semantic Web. 176 1.1.13 M • Machine Learning - David Aha's extensive list of researchers. • Mailing Lists - for various KR topics. • MADEFAST - an experiment in collaborative engineering over the Internet. Also see the Stanford KSL page on MADEFAST. • Medical Terminologies and Ontologies: See o the Gene Ontology (GO) o UMLS and MeSH o Medical Terminology Resources (a collection of pointers). o Medical Nomenclatures - some searchable, online databases (in French). o MAOUSSC - a multiaxial, medical representation (in French). • MeSH - The National Library of Medicine's subject thesaurus, also a principle component vocabulary of UMLS. Try out the MeSH browser! • The Meteor Project - researching Semantic Web services and their composition. • Mikrokosmos - An in-depth, broad coverage ontology for multilingual NLP from the Computing Research Laboratory, New Mexico State University. • MindNet - Microsoft's automatically derived, structured KB build using NLP on dictionaries and the Encarta encyclopedia. • Mizoguchi Lab - Japan. Some interesting papers and ontologies. • Moby - A public domain suite of lexical resources (word lists, part-of-speech lists, thesaurus, etc.). See here for a quick summary. • Multiple Ontologies - see Ontologies - Dealing with multiple ontologies. 1.1.14 N • NASA's Thesaurus - covering aerospace (available for a nominal fee). • Building/using KBs via natural-language processing (NLP) techniques: See START, and MindNet. • Notio - a Java class package to provide an implementation-independent interface for manipulating Conceptual Graphs (Univ Guelph, Canada). 1.1.15 O • Observer (Ontology Based System Enhanced with Relationships for Vocabulary hEterogeneity Resolution) - A project dealing with multi-ontology query processing. • OCML - Operational Conceptual Modeling Language. Used as the modeling language in • • • • • • • • WebOnto. ODE - The Ontology Design Environment (Univ Madrid, Spain). See here also. OIL - Ontology Interchange Language. A proposed standard for specifying and exchanging ontologies, drawing together ideas from Web languages (e.g., XML, RDF), Description Logics, and frame-based systems. OilEd - a simple ontology editor for building ontologies using DAML+OIL. OKBC - The Open Knowledge Base Connectivity Protocol (formerly called GFP, the Generic Frame Protocol). Not a language, but a standardized set of low-level access functions for framebased KR systems. OK Station (in French) - The Ontological Knowledge Station, a commercial modeling tool dedicated to the acquisition, definition and manipulation of knowledge bases and ontologies, based on the OK ontological model (Univ Savoie, France). OMCSNet - A semantic network derived from the OpenMind commonsense database, now superceded by the more recent OpenMind derivative knowledge base ConceptNet. OML - Ontology Markup Language. ON9 - The ontology library at the Laboratory for Applied Ontology (Italy), developed using the ONIONS methodology and implemented in Loom. 177 • ONIONS - a methodology for building a library of generic ontologies, and generating domain ontologies (the Laboratory for Applied Ontology, Italy). • OntoBroker - A system using ontologies for both annotating Web documents, and providing ontology-based answering services. OntoBroker is being used as part of the KA2 initiative • OntoEdit - An Ontology Engineering Workbench. OntoEdit is a development environment for design, adaptation and import of knowledge models for application systems. • ONTOGEO - The Geospatial Ontology Research Group in the National Technical University of • • • • • • • Athens. This is a repository for the research and teaching activities of the OntoGeo Group in Geographic Information Science, addressed primarily to researchers. Ontolingua - a language and set of tools for ontology development (from Stanford). Includes a Sharable Ontology Library. Ontology - Definitions and perspectives o What is ontology? (from Ontology Works) The Ontology Page (TOP) identifies world-wide activity aimed at developing formalized ontologies as the basis for shared and modularly-structured knowledge. Ontologies: History and Philosophy - See: o Ontologies (Descriptive and Formal Ontologies) - A collection of bibliographies on leading ontologists from Nineteenth Century to our days and a discussion of some philosophical problems related to ontology (by Raul Corazzon). o The Buffalo Ontology Site The ANSI Ad Hoc Group on Ontology Standards Ontologies - examples and collections (also see Thesauri). See o Air Traffic Services (aviation) Ontology (from the FAA) o BPMO - The Business Process Management Ontology o The Component Library (CLib) - A knowledge-base of formally represented, general concepts. o CYC (and the derivative PDKB) o DAML-S The DAML Services ontology. o DOLCE - a Descriptive Ontology for Linguistic and Cognitive Engineering. o The Enterprise Ontology (for business enterprises) o Ontologies for ethology (animal behavior), in particular for the Loggerhead Turtle o the Gene Ontology (GO) o FrameNet (lexical reference) o the Generalized Upper Model (for NLP) o various medical terminologies o Mikrokosmos (for NLP) o MindNet (derived from NLP on dictionaries) o ON9 (the CNR-ITBM Ontology Library) o the Ontolingua Ontology Library o The OpenMind database and the ConceptNet knowledge base derived from it o PharmGKB - the Pharmacogenetics and Pharmacogenomics Knowledge Base o PSL (process specification) o QoS (computers and networks) o SENSUS (for NLP) o discussions for an IEEE Standard Upper Ontology o STEP (for product data exchange) o SUMO (the Suggested Upper Merged Ontology) o the Twente Ontology Collection o VerbNet a semantically rich verb lexicon o WebKB-2 (a lexically oriented KB, includes a "tidied up" version of WordNet 1.7) o the Wilkins' ontology (17th century!) o WordNet (lexical reference) Ontology Building Tools - For building and managing ontologies. See Michael Denny's survey of ontology editors (2002), and also the following specific tools: o Chimaera 178 o o o o o o o o o o o o o o o o o CODE4 EXPECT the Generic Knowledge-Base Editor Ikarus JOE (Java Ontology Editor) KAON KACTUS OilEd OntoEdit Ontosaurus Protege Sigma Shaken Snobase the Stanford Ontology Editor SymOntos WordMap and additional systems under Knowledge Acquisition Tools. • Ontology Learning Tools - Automated/assisted techniques for building an ontology. See o ECAI'2000 Workshop on Ontology Learning (online proceedings) o IJCAI'2001 Workshop on Ontology Learning (online proceedings) o The Ontology Learning "community portal" - a nascent (as of July 2001) portal for information on this topic. • Ontology Merging Tools - See Chimera and PROMPT. Also see Carter, a tool for helping experts build a consensus KB. • Ontologies - Dealing with multiple ontologies - See InfoQuilt, Observer. • Ontology Works - Ontology Works is a leading source of ontology construction software, • • • • • • ontology-based database software, and ontology-based information integration software. The Ontology Works IODE is software designed to produce ontologies - true-to-the-world information models. These models may be implemented in the Knowledge Server and High-Performance Knowledge Server. (Also see their page What is ontology?) OntologyStream Inc. - a Virginia-based company focused on incorporating knowledge science and technology into eGovernment and intelligence applications. Ontosaurus - a Web-based interface to LOOM. For a demo, browse the Sensus KB using it. OntoWeb - Ontology-based information exchange for knowledge management and electronic commerce. A collaborative network of European researchers and industrials, which aims to strengthening the European influence on Semantic Web standardisation efforts such as those based on RDF and XML. OpenCyc - The open source version of the Cyc technology (including selected parts of the ontology, axioms, inference engine, and knowledge acquisition tools). Public OpenCyc servers (as on Dec 2002) are: Thinker, Turing, McCarthy. The OpenMind Initiative - a collection of projects to develop "intelligent" software. Note in particular OpenMind CommonSense (below). OpenMind CommonSense - A new web site for collecting "commonsense" knowledge, as English sentences, en masse from people on the Web. The database can be downloaded for free. Also, a semantic network/knowledge base called ConceptNet mined from this corpus is available. (Also see Push Singh's homepage). 1.1.16 P • Pangloss and Penman - natural language projects at USC Information Sciences Institute. The creation and use of large ontologies forms a key component of this research. 179 • Panlingua - A universal theory of linguistic structure (by Chaumant Devin). • The PARKA Project - a frame-based AI system which claims to scale to extremely large KB applications (Univ Maryland at College Park). • PDKB - the Public Domain Knowledge Bank, planned as a public domain, common-sense KB • • • • • • • • based on the Cyc ontology. PharmGKB - The Pharmacogenetics and Pharmacogenomics Knowledge Base - an integrated resource about how variation in human genes leads to variation in our response to drugs. PIF - Process Interchange Format PowerLOOM - A KL-ONE-style knowledge representation language (the successor of LOOM). Project Peirce - A collaborative project for developing a CG workbench (see also ftp site). Prolog+CG - A Prolog implementation of (part of) conceptual graphs. PROMPT - An interactive ontology merging tool. Part of Protege-2000. Protege-2000 - An extensible KR tool for constructing ontologies, customizing knowledgeacquisition forms, and entering domain knowledge. (Also see here and here). PSL - The Process Specification Language Ontology. 1.1.17 Q • The QoS Ontology - about computers and networks. • Question-Answering Systems: See Halo (knowledge-based question-answering), START (NLP), TRAINS and TRIPS (NLP + interactive planning), AskJeeves (Web search), TextMap (TREC/Web search, ISI), and Webclopedia (NLP and information retrieval). 1.1.18 R • RACER - an expressive Description Logic, implemented with a highly optimized ABox tableaux calculus (Univ Hamburg, Germany). • RDF - Resource Description Framework: A lightweight ontology system to support the exchange of knowledge on the Semantic Web. • REMOTE (Request Management fOr Task Execution) - An ontology-based application providing users of wireless devices with new software applications (developed like web services), in order to avoid the dependence on the performance of their devices. From the Distributed Information Systems Group, Univ Zaragoza, Spain. • RKF - DARPA's new initiative in Rapid Knowledge Formation, developing methods to allow Subject Matter Experts (SMEs) to construct knowledge bases directly. • Roget's Thesaurus o Bibliography on Roget - A bibliography of research using this for natural language processing (Mario Jarmasz, Univ Ottawa, Canada). o The 1911 Version online - part of the ARTFL project. o MICRA's version - A note on the availability of MICRA's modified version of Roget. Also see Pat Cassidy's call for collaborators in FACTOTUM, an electronic encyclopedic KB project (starting from Roget). • RosettaNet - An industry consortium established to create open e-business standards. Includes establishing standardized terminologies (dictionaries). 1.1.19 S • SCORE - (Semantic Content Organization and Retrieval Engine), patented technology being incorporated into a set of comprehensive Semantic Web products offered by Voquette/Semagix. • The Semantic Business Process Management (SBPM) Working Group - working towards the mechanization of Business Process Management by using Semantic Web techniques, especially Semantic Web Services. • The Semantic Enterprise - (Amit Sheth's graduate course). 180 • The Semantic Web - A vision of having data on the web defined and linked in a way that it can be used not just for display purposes, but also in various applications by machines. Also see: TRIPLE, FLORA, Meteor, and work by LSDIS. KAON several keynotes on the Semantic Web Amit Sheth's graduate course on the Semantic Web WonderWeb - Ontology infrastructure for the Semantic Web. Two one-minute overviews (posters) on The Semantic Web and RDF vs. XML (from Semaview). o RDF o The Semantic Business Process Management (SBPM) Working Group SENSUS from ISI, Los Angeles. A large concept taxonomy for natural language processing and other applications. Click here to browse it using the Ontosaurus browswer. Shaken - A knowledge acquisition and reasoning tool built by the SRI Team, as part of DARPA's Rapid Knowledge Formation project. (Contact [email protected] for access to the software itself). SHOE - HTML extensions to allow knowledge-representation semantics to be added to Web pages, using explicit user-defined ontologies. See also its successors OML and CKML. Sigma Knowledge Engineering Tool - An environment for developing, viewing and debugging theories in first order logic. Sisyphys III - Third in a series of experiments begun in 1990 by the KAcq community, to compare techniques for constructing knowledge-based systems. Also see KAW'98 papers on this experiment here. SMDF - The Shared Meanings Design Framework (in a very early stage, as of August 2000). An HCI-centered methodology for supporting e-commerce developers, by focussing on the semantics which an interface transmits. Uses SMML (Shared Meanings Markup Language). SNePS - The Semantic Network Processing System, a knowledge representation and reasoning system from Univ at Buffalo, NY (also see this overview of the SNePS research group). SNeRG - The Semantic Net Research Group at Univ. NY at Buffalo. Snobase - IBM Ontology Management System (also known as SNOBASE, for Semantic Network Ontology Base) is a framework for loading ontologies from files and via the Internet and for locally creating, modifying, querying, and storing ontologies. The IEEE Standard Upper Ontology (SUO) Working Group - working to specify a standardized upper ontology. Also see SUMO (the Suggested Upper Merged Ontology). SRS (Software Retrieval Service) - An ontology-based application which allows users to retrieve and install software in an easy and efficient way. From the Distributed Information Systems Group, Univ Zaragoza, Spain. Stanford KSL - Stanford's Knowledge Systems Lab. Doing extensive, pionering research in knowledge representation, reuse, and sharing. The START natural language question-answering system (Infolab, MIT). Matches questions with hand-written annotations on paragraphs. Also see the START HPKB demo. STEP/PDES - Standard for Exchange of Product Data. A huge, international effort to create an interlingua for exchanging manufacturing product data. See also STEP Tools, Inc. SUMO (also see here) - The Suggested Upper Merged Ontology, developed within the IEEE Standard Upper Ontology (SUO) Working Group. Contains (as of December 2003) about 1000 terms and over 4200 assertions for general ontological concepts such as temporal relations, spatial relations, activities and roles. Also see: o Loom 4.0 translation of a subset of the Suggested Upper Merged Ontology. o SUMO-WordNet2 mappings - All of WordNet's (v2.0) synsets (for nouns, verbs, adjectives, and adverbs) mapped to SUMO. o Public ontologies for computers and networks (QoS), and ecommerce (DAML-S) built on SUMO. SymOntos (Symbolic Ontology Management System) - a software system that stores and manages a domain ontology (LEKS, CNR, Italy). o o o o o o • • • • • • • • • • • • • • • • 181 • Synergy - A language for "executable CGs", allowing representation and simulation of dynamic processes using CGs. 1.1.20 T • TAMBIS - (Transparent Access to Multiple Biological Information Sources). TAMBIS is an • • • • • • • • • integration and retrieval system for bioinformatics resources, using an extensive ontology authored in the description logic GRAIL (but now moving towards another description logic, FaCT). TCM - Toolkit for Conceptual Modelling. A collection of software tools to present conceptual models of software systems in the form of diagrams, tables, trees, and the like. TGM-I - The Library of Congress's Thesaurus for Graphical Materials. Thesauri: o The Web Thesaurus Compendium - Pointers to many thesauri. o Lexical FreeNet - A browsable Thesaurus, including (unusually) graph searching capabilities. o Stauffer Library - Pointers to online dictionaries and a few thesauri. o ISSO 2788 - Some summary notes on the ISO 2788 Standard for Thesaurus Construction. o Moby - includes a Thesaurus of 30,000 words and 2.5 million synonyms and related words. And it's public domain! o Canadian Thesaurus of Construction Science and Technology o Roget's Thesaurus o The EuroVoc Thesaurus - a multilingual thesaurus covering the fields in which the European Community is active. o NASA's Aerospace Thesaurus The ThoughtTreasure Project - An AI program for experimenting with AI and natural language processing. It includes a large ontology of 21,521 concepts and 37,162 assertions. Topic Maps: A graphical representation of the topics an information set is about, their interrelationships, and which part of an information set are relevant to which topics. o What is a Topic Map? - IDEAlliance page. o InfoLoom - various samples, presentations, FAQs, and pointers. o ISO/IEC FCD 13250:1999 - The ISO standard for Topic Maps. The TOVE project and ontologies, from the Enterprise Integration Lab , Univ Toronto. Trellis - An interactive environment allowing users to add their observations, viewpoints, and conclusions as they analyze information (ISI). Also see this paper and demo. TRIPLE - an RDF query, inference, and transformation language for the Semantic Web. Twente Ontology Collection -- (Univ Twente, Netherlands). On Ceramics, substances, and engineering design. This page no longer seems to be available. 1.1.21 U • UMLS - Unified Medical Language System (UMLS) of the National Library of Medicine (NLM). A collection of around 60 different biomedical vocabularies, unified/aligned into a single thesaurus, lexicon, and semantic network. Also see MESH, one of UMLS's principle component vocabularies. • UT Austin - KBS Group - Work on large-scale, multifunctional knowledge-bases. 1.1.22 VWXYZ • VerbNet - A semantically rich, class-based verb lexicon (U. Penn). • Webclopedia - an automated, retrieval-based question-answering system (ISI). • WebGrid-II A Web-based knowledge elicitation tool, implementing repertory grids, from the Knowledge Science Institute, Univ Calgary, Canada. (Papers, and also see WebGrid-I). • WebKB-2 - A large-scale, lexically-oriented (WordNet-like) knowledge-base + Web-based interface. The WebKB-2 knowledge-base includes a "tidied up" version of WordNet 1.7 (see here 182 • • • • • • for details). The WebKB-2 interface allows users to retrieve, re-use, complement, annotate and be guided by other users' knowledge. WebOnto - a Web-based knowledge modeling tool, allowing users to browse and edit knowledge models over the Web (Knowledge Media Institute, UK). Uses OCML as the underlying language. the Wilkins' ontology (for historical interest): A 17th century literary work by Bishop John Wilkins, presenting a large ontology, a written and spoken language derived from the ontology, and a dictionary that maps terms in the ontology to English. WonderTools - for helping select an ontology-building tool (SWI, Univ Amsterdam, Netherlands). WonderWeb - A European Union-funded project developing ontology infrastructure (ontology languages, frameworks, ontologies, and other tool support) for the Semantic Web. WordMap - A commercial taxonomy management system for building and deploying taxonomies quickly and easily. WordNet - a large, on-line lexical reference system. Also see: o Proceedings of WordNet and Other Lexical Resources (a NAACL Workshop on WordNet). o Proceedings of SemaNet'02 - Building and Using Semantic Networks (a COLING 2002 workshop on WordNet). o WebKB-2, a "tidied up" WordNet derivative o (independent project) FrameNet Mailing Lists • Conceptual Graphs o Archive (Recent emails) o Archive (Ancient emails) o Subscription information • Evaluation Methods for Knowledge Engineering - mailing list. • KAW - Knowledge Aquisition Mailing List. • KAW-PSM - Knowledge Aquisition: Problem-Solving Methods mailing list. • Knowledge and Information Systems - Journal. • Mail Archives - for Interlingua, KQML, MADEFAST, Ontolingua, and SRKB. • onto-std and ontology mailing lists - the former for the ANSI Ad Hoc Group on Ontology Standards, the latter for general AI discussions on ontologies. • Subscription Information - for KAW, Conceptual Graphs, KQML, Knowledge Sharing, and Interlingua. On-Line Proceedings • KAW'96 - Proceedings (1996, Banff, Canada). • Workshop on Problem-Solving Methods for Knowledge-Based Systems (Aug 23, 1997, Nagoya, Japan) in Connection with IJCAI-97 (Aug 23-29, 1997, Nagoya, Japan). • ProKSI'97 - workshop report from the 2nd workshop on Product Knowledge Sharing and Integration. • "Comparing Description and Frame Logics" - summary of the workshop (Mar 26-27, 1997, • • • • • Karlsruhe, Germany). IJCAI'97 Workshop on Problem-Solving Methods - proceedings. KAW'98 - Proceedings (1998, Banff, Canada). ECAI'98 Workshop on Applications of Ontologies and Problem-Solving Methods V&V Workshop '98 - The 1998 European Meeting on Validation and Verification of KBSs. KRDB'98 -- Knowledge Representation and Databases, Proceedings of the 5th Workshop (May 31, 1998, Seattle, WA). 183 • CommonSense'98 - Proc. 4th Symposium on Logical Formalizations of Common Sense • • • • • • • • • Reasoning. IJCAI'99 Workshop on Ontologies an Problem-Solving Methods. IJCAI'99 Workshop on Knowledge Management and Organizational Memories. KAW'99 - papers from the 1999 workshop. ECAI'2000 Workshop on Ontology Learning (Aug 22, 2000). IJCAI'2001 Workshop on Ontology Learning (Aug 4, 2001). Also see the home page for this workshop. IJCAI'2001 Workshop on the IEEE Standard Upper Ontology (Aug 6, 2001) ADL 2001 - Proceedings of the 2001 Workshop on Applications of Description Logics. Database and Information Systems Research for Semantic Web and Enterprises - NSFOntoWeb Invitational Workshop (Apr 3-5, 2002). Proceedings of the EKAW'04 Workshop on Core Ontologies in Ontology Engineering (2004) Maintained by Peter Clark (peter.e.clark@boeing 184 ANEXO II – Utilização de metodologia para definição de estratégia competitiva A metodologia a ser apresentada, foi desenvolvida pelo Núcleo de Desenvolvimento Empresarial. Este núcleo reúne um grupo de pesquisadores, professores do Centro Federal de Educação Tecnológica de Santa Catarina, e tem por objetivo realizar pesquisa em nível tecnológico e disponibilizar os resultados para a comunidade na qual o CEFET-SC está inserido (HERMENEGILDO 2002). Esta metodologia tem sido utilizada em várias aplicações que requerem a construção de cenários voltados para ações estratégicas. Ao final da aplicação da metodologia, pode-se identificar com precisão o conjunto de ações, as variáveis envolvidas e com isto compor um plano de ação para a conquista de objetivo previamente definido. A metodologia consiste em aplicar a visão de processos e, com suporte do diagrama de causa e efeito apresentado por Ishikawa, definir um conjunto de atividades a serem executadas para a conquista do objetivo eleito. Na metodologia, o modelo de Ishikawa é adaptado. Consideram-se os 6 M por ele definidos: Meio ambiente, Matéria-prima, Máquinas e equipamentos, Metodologia, Medida, Materiais e insumos, e inclui-se um sétimo M denominado Mercado. Cada M acima citado dá suporte a um conjunto de ações que têm por meta conquistar um objetivo determinado. No caso em questão, o objetivo é estabelecido pelo modelo conceitual eleito para a aplicação do modelo. A figura a seguir representa o diagrama de causa e efeito no modelo de Ishikawa adaptado. Modelo de Ishikawa adaptado Matéria-Prima Máquinas e eqptos Medida Objetivo Metodologia Meio-ambiente Materiais Mercado 185 186 Dinâmica de aplicação do modelo Com base no referencial definido no modelo conceitual, identificam-se os objetivos que devem ser conquistados. Estes objetivos ocupam o lugar de foco no diagrama de causa e efeito adaptado. O diagrama originalmente é utilizado para identificar causas para os problemas apontados. No local do problema, coloca-se o objetivo a ser atingido. Nas extremidades, indicam-se as fontes de origens das ações a serem encaminhadas para a conquista dos objetivos apontados. Estas ações listadas são priorizadas. Para tanto, utiliza-se método oriundo da análise de valor. A grade abaixo apresenta o procedimento. Este método é integrado por três fases. A primeira é dedicada à valorização das atividades da lista pelo participante do evento que definiu a lista de atividades a serem priorizadas. A segunda fase é dedicada a somar os indicadores de prioridades apresentados por cada participante. A terceira fase é caracterizada pelo ordenamento da relação de atividade, com base na somatória dos vários índices de priorização individuais. Abaixo, apresenta-se modelo ilustrativo. Suponha-se que três participantes tenham decidido por um determinado M (método por exemplo) do diagrama de Ishikawa. Na coluna intitulada “minha priorização”, o participante indica a ordem de prioridade que ele atribui à realização da atividade apontada. Quanto maior a prioridade, menor a numeração. 187 Planilha de apontamentos do participante do Participante 1 Objetivo: Objetivo 1 / Origem de ação Método Numero Atividade Minha priorização 1 Atividade A 2 2 Atividade B 1 3 Atividade C 4 4 Atividade E 3 Planilha de apontamentos do participante do Participante 2 Objetivo: Objetivo 1 / Origem de ação Método Numero Atividade Minha priorização 1 Atividade A 1 2 Atividade B 4 3 Atividade C 2 4 Atividade E 3 188 Planilha de apontamentos do participante do Participante 3 Objetivo: Objetivo 1 / Origem de ação Método Numero Atividade Minha priorização 1 Atividade A 2 2 Atividade B 3 3 Atividade C 1 4 Atividade E 4 A matriz de consolidação das “minhas priorizações” estará assim construída: Objetivo: Objetivo 1 / Origem de ação Método Numero Atividade Participante Participante Participante Somatório 1 2 3 dos Nossa priorização participantes 1 Atividade A 2 1 2 5 1 2 Atividade B 1 4 3 8 3 3 Atividade C 4 2 1 7 2 4 Atividade E 3 3 4 10 4 Com base no conteúdo da coluna de “somatório”, constrói-se o conteúdo da coluna “nossa priorização”. Considera-se o menor valor de somatório para atribuir a maior prioridade. 189 Modelo de Pareto Após este etapa, aplica-se o princípio de Pareto ao modelo. Segundo este princípio, em uma lista de atividades ordenadas, implantando-se 20% das atividades da lista, atende-se 80% da totalidade das atividades indicadas. Desta forma, como a lista está integrada por quatro atividades, 20% delas, é 0,8. Aplicando-se arredondamento conclui-se que atendendo a primeira atividade, que é a atividade A, atender-se-á 80% das atividades de toda a lista consolidada.