METODOLOGIA DE ORGANIZAÇÃO DA INFORMAÇÃO
Transcrição
METODOLOGIA DE ORGANIZAÇÃO DA INFORMAÇÃO
... - " .. mm mm Empoderando vidas. Fortalecendo nações. Projeto BRAl12/018 - Desenvolvimento de Metodologias de Articulação e Gestão de Políticas Públicas para Promoção da Democracia Participativa Produto 03 - Proposta de metodologia de organização da informação, formulários e demais ferramentas que fomentem a sistematização de metodologias de participação social de forma clara 'e reutilizável no portal de participação social Organização da informação sobre participação social Paulo Roberto Miranda Meirelles Secretaria Geral da Presidência da República L --- I '- '~ 'L L L Produto 03 - Proposta de metodologia de organização da informação, formulários e demais ferramentas que fomentem a sistematização de metodologias de participação sociaI de forma clara e reutilizável no portal de participação. social Contrato n. 2014/000062 Objeto da contratação: "Catalogação e sistematização de informações e conteúdos, construção de bases de dados, modelagem de ontologias, sistemas de indicadores e organização da arquitetura da informação do portal da participação social." Valor do produto: R$ 10.800,00 (dez mil e oitocentos reais) Data de entrega: 25 agosto de 2014 Nome do consultor: Paulo Roberto Miranda Meirelles Nome do supervisor: Ricardo Augusto Poppi Martins 2 Secretaria Gera) da Presidência da República MEIRELLES, Paulo R. M. Proposta de metodologia de organização da informação, formulários tas que fomentem a sistematização de metodologias de participação ra e reutilizável no portal de participação social. e demais ferramensocial de forma cla- Total de folhas: 47 Supervisor: Ricardo Augusto Poppi Martins SG/PR Secretaria Geral da Presidência da República Palavras-chave: repositório institucional, participação social, relatório técnico, Iinked data. lSlDEsta obra é licenciada sob uma licença Creative CommonsNão Comercial. 4.0 Internacional. Atribuição- 3 1""~O~(A 'olfotT.tTIdort«ón Resumo Este documento refere-se ao terceiro produto relacionado no Termo de Referência BRAJ12/018 sob a coordenação da Secretaria Geral da Presidência da República voltado para o desenvolvimento de metodologias de articulação e gestão de políticas públicas para promoção da democracia participativa. Nesse relatório é proposta uma redefinição da biblio- , teca digital de participação social relacional e aberta, considerando um alicerce de informações sobre os objetos de informação que contempla (i) o registro bibliográfico dos objetos de informação, (ii) o registro de autoridades ou pessoas vinculadas a esses objetos, e (iii) um arranjo de assuntos que sirvam como índices que facilitam o acesso a esses documentos.. Adicionalmente, foi previsto um esquema de anotações como uma alternativa para que a comunidade de usuários da biblioteca possa contribuir com a identificação dos conceitos inerentes à organização dos conteúdos de participação social. Esses elementos são colocados como subsídios para sistematização de metodologias de participação social e oferecem elementos e artefatos necessários para sistematizar e organizar as informações de participação social focada em relacionamentos. Palavras-chave: bibliotecas digitais, participação social, organização da informação, open Iibrary. 4 Em1X#tf'ftdoO'ia~L JOI/OlrCmdOtl(l{OM. Conteúdo Lista de figuras 06 Lista de tabelas................................................................................................................................. 07 1 Introdução................................................................................................................................. ... 1.1 Problema de pesquisa 08 09 1.2 Objetivos :......... 1.3 Justificativas :......................... 2. Revisão de literatura......................... 10 11 12 2.1 Dados ligados e abertos (/inked open data) 13 2.2 Localizando significado para conteúdos do linked data 17 2.3 Tendências e padrões de catalogação.................................................................................. 18 2.3.1 Modelos conceituais para catalogação 19 2.3.2 RDA - Novo padrão para catalogação 22 2.4 Vocabulários controlados 25 2.5 27 Registros de autoridades 2.6 Serviços de anotação 3. Metodologia para organização 4. Ferramentas para sistematização 4.1 28 de informação de metodologias Mapeando conteúdos Dspace para RDF 5. Considerações finais Referências............. de participação social................................. de participação social 30 :..... 35 38 45 47 5 . , a .. . ' ... ' ~ ~ I . . .1 l~O~l ''''I(J1nrrw1~I'C'!órt. Lista de figuras "- Figura 1.1 -Site do Conselho Nacional de Saúde com link para documentos . 09 Figura .1,.2- Exemplo de ,um arqUivo sobre.atêldereunião . 10 Figura 2.1 - Exemplo de um registro bibliográfico Figura 2.2 - Framework da web semântica ..: , : : com informaçõe,s interligadas : : ;, :......•.. ,: Figura 2.3 _ Comparando ,tabelasrel~cionais. com modelo RDF ..;; Figura 2..4 - : 13 : . 14 :.:..: : ' 15 . 16 . 17 . 19 . 20 . 21, . 21 . 22 . 25 i . 28 'i Exemplo de grafo RDF ligando várias fontes.de dados Figura 2.5 - Amostra da nuvem de dados Iig~élos em 2010 : , Figura 2.6 - Entidades do Grupo 1do ModelçFRBR : , : Figura 2.7 - Exemplo do modelo FRBR aplica~o a um registro musical Figura 2.8 - Entidades FRBR dos grupos 1, 2 ~ ~ : Figura 2.9 - Modelo conceitual para dadosd~autoridade Figura 2.10 - Descrição tradicional Figura 2.11 - Complexidade com uso de regras AACR2 dos tipos de vocabulários controlados Figura 2.12 - Representação ....•. ~ gráfica domodelo de dados BIBFRAME , Figura 2.13 ..- Exemplo de atribUição de tags no contexto Open Annotation Figura 3.1 -Componentes de organização de informação Figura 4.1 ~ Sugestão de interligação de docurentose 'Figura 4.2 - Objeto bibliográficorepresentad~ de participação social dados ligados num repositório de triplas RDF : . 29 . 31 . 36 . 38 i i ; ! i Ii I 1 . ) 6 ! I ! L ~---------~---------:----:-----:----,-~ a, I .> " ., • - r ,""''', ~ •••• "~o ), ;, 1 Introdução A participação popular pode ser compreendida como um processo no qual os cidadãos são sujeitos políticos e exercem os direitos políticos. Nesse contexto, percebe-se um interesse do Governo para a criação de novos mecanismos manutenção (ALMEIDA, mecanismos surgimento de concepção, de políticas públicas com um maior envolvimento 2014). Uma das formas formais de participação de diversos de participação canais de participação da sociedade previstas criados na Constituição execução e organizada em lei é através dos de 1988, que alavancou social, como conselhos, o conferências e ouvidorias, dentre outros, os quais são normalmente instituídos por legislações específicas. Recentemente o governo lançou a Política Nacional de Participação Social, instituída pelo Decreto 8243/2014, que motiva a organização de um Sistema Nacional de Participação Social (PNPS), cuja premissa supõe a organização dos conteúdos participação enorme de informações social. Embora exista uma quantidade tema, foi percebido que existem informações disponibilizadas desatualizadas, de informação em especial sobre sobre esse as que estão em catálogos impressos e em sites como é o caso do Conselho Nacional de Assistência Social1 e da Conferência Nacional de Educaçã02• De fato, nos últimos anos percebe-se sobre os arranjos participativos, em especial uma produção sobre significativa os conselhos de informações nacionais que são constituídos para discutir aspectos variados, como saúde, educação e justiça, dentre outros. Em geral, eles são formados por entidades da sociedade civil e do Governo e têm como finalidade a atuação nas políticas públicas de determinado tema, sendo que as atribuições variam de acordo Com os diversos contextos. Nesse sentido, tem havido algumas iniciativas de organização da participação social, sendo que as mais expressivas são o portal Participa.brJ que concentra ferramentas e metodologias de participação social (SOLAGNA, 2014) e a criação de uma biblioteca digital de participação social, divulgada recentemente no seminário sobre Bibliotecas Digitais e Design Participativo realizado pelo governo federal4• 1 URL http://www.mds.gov.br/cnas. 2 URL http://conae.mec.gov.br. 3 URL http://www.participa.br. 4 URL http://ipea.gov.br/participacao. 8 '.- li '. • 1.1 Problema de pesquisa É sabido que uma sociedade organizada precisa ter a comunicação como um de seus pilares essenciais para garantir o exercício da democracia (LIMA, 2014). Nesse sentido, a sistematização e catalogação de informações torna-se requisito importante para que o conhecimento sobre atividades e fatos que envolvem os canais de participação e os movimentos sociais estejam disponíveis à sociedade civil e aos gestores do governo responsáveis pelo tema. Por outro lado, a proposta de organização de conteúdos atualmente em discussão no Governo é a utilização do software Dspace5 funcionando como um repositório de documentos variados, como os atos normativos e documentos de reunião que estão exemplificados na parte esquerda da Figura 1.1. ~"!J'CONSELHO NACIONAL DE SAÚDE Fale Conosco Links üteis aCONSELHO -- 11' Apresentação .• _ [•. His:õnco 1:- Composrçio ,•• CON.FERtNCIA NACIONAL Dl SAÚDI DO TRABALHADOR . Orgat''llzat1on.1 ~ Estrutura - - E DA TRABALHADORA • !t1terno I:' R.egime:lto ,- Fluxo d. trabalhe 1::' 1:- Comíssces •. Notiàas do Conselho Exc-.die"t. ATOS HDRMATIVOS !:. R..soluções t. R..com.ndaçõ.s CiSllmll se reúne em Brllsma ~ Moções 1:- CIRH discute Residência ~lultipcofissional e Sallde Coletiva O.Ht,.r.çõ.s: lS' CNS e Sllude. +lC são relembrados no encerramento dll Jornada Gilson Clll'Vlllho de Oficinas sobre Financiamento dll reoião Sudeste :~ L.-çlsiaçio _. R£UNJÕES DO COHSEUlO 1;.Cale'ldÂno PrincipaIs problemlls e soluções para a saude pública do Sudeste são listlldos duo-ante Jornada Gil:;on Carvlllho de Oficinlls R.egionais . OUTRAS NOTicIAS \ Figura 1.1 - Site do Conselho Nacional de Saúde com Iínk para documentos Fonte: htlp://conselho.saude.gov.br '- No esquema em discussão, os documentos tais como atas de reunião, normas, moções e outros tipos de documentos são originados e catalogados pelos próprios canais de participação social existentes. Por esse motivo, o esquema de metadados para 5 URL http://www.dspace.org. 9 'S catalogação f~rmdOrJc1tn 'D'IC'"ctneol'lnt6oo1.. precisa ser simples para facilitar o registro de documentos e garantir um repositório centralizado desses conteúdos . . Embora a iniciativa adotada permita a preservação dos documentos de participação social, percebe-se que é insuficiente para dar conta de algumas demandas que envolvem a relação entre entidades e informações espalhadas nos artefatos digitais e, mais ainda, em outros tipos de artefatos que podem estar fora do repositório de documentos. Além disso, os documentos '- são extensos e descritos em formatos difícil leitura, o que dificulta a identificação proprietários, de conceitos não estruturados de interesse nesses e de suportes documentais. Um exemplo está ilustrado na Figura 1.2 a seguir. '- e" ~ 3 CONSELHO NACIONAL DE SAÚDE 4 5 6 ATA DA DUCENTESIMA QUINQUAGESIMA OITAVA REUNIÃO ORDINÁRIA DO CONSELHO NACIONAL DE SAÚDE - CNS 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 MINISTERIO DA SAÚDE Aos quatro e cinco dias do mês de junho de dois mil e catorze, no Auditório da Procuradoria-Geral de Justiça, Sede do Ministério Público do Espírito Santo, Rua Procurador Antônio 6en~jçlQ ~ Pereira, nO350, bairro Santa Helena - Ed. Promotor Edson Machado. térreo. Vitória - ES. realizou-se a Ducentésima Quinquagésima Oitava Reunião Ordinária do Conselho Nacional de Saúde - CNS. A 258" RO teve por objetivos: 1) Socializar e debater a Política Nacional para Grandes Eventos - Copa: Gastos, impactos e beneficios. 2) Discussão da proposta de manifesto e agenda da Saúde nas eleições. 3) Socializar, deliberar e encaminhar demandas da CONEP. 4) Socializar. deliberar e encaminhar demandas da COFIN. 5) Socializar. deliberar e encaminhar demandas da CIRH, A Presidente do CNS. Maria do Socorro de Souza, cumprimentou a todos os presentes. verificou o quórum e iniciou a reunião. ITEM 1 - APROVAÇAo DA PAUTA DA 258" REUN/ÁO ORDINÁRIA DO CNS - APROVAÇAo DA ATA DA 253" e 254" REUNIÃO ORDINÁRIA DO CNS. A Presidente do CNS, Maria do Socorro de Souza. convidou para dizer algumas palavras o Secretário Executivo do Conselho Estadual de Saúde do Espírito Santo, Milton César Valente da Costa, que a gradeceu a oportunidade de participar de uma reunião do CNS e afirmou que isso aprofunda seu conhecimento acerca do controle social. Apresentou os conselheiros recentemente empossados do CES que teve 5% de sua representação renovada. Afirmou ter conversado com representantes do Ministério da Saúde sobre a capacitação dos conselheiros estaduais e que o CES/ES não possuía nenhuma comissão funcionando e agora já tem 50% delas em plena atividade. Afirmou ter sido eleito como coordenador de plenária. Maria Lúcia dos Santos Mariano, representante dos usuários pela entidade FAMOPES, Federação das Associações de Moradores e Movimentos Populares do Espírito Santo. alegou ser muito bom participar e aprender com os representantes do CNS e que o cartão SUS é o plano de saúde do cidadão. o melhor que existe. João Carlos dos Santos, também Conselheiros do CES/ES disse estar muito feliz em participar da reunião do CNS. A Presidente do CNS, Maria do Socorro de I Figura 1.2 - Exemplo de um arquivo sobre ata de reunião Fonte: htlp:l/conselho. saude .gov. br 1.2 Objetivos o contexto apresentado anteriormente levou a uma indagação sobre as formas de catalogação praticadas atualmente registro de informações de maneira relacional, segundo as recomendações sobre catalogação. e no que elas podem ser melhoradas De fato, se a catalogação tradicional para permitir o mais recentes é mais prática, a catalogação relacional que envolve informações e entidades pode ser difícil a ponto de tornar o processo 10 ',:-" . -~ r . • , • .J . . .".' .. , ~ impraticável E~r(Jndori:1a~ 'orlO!nmdOtl()(Or1. e desmotivador. Nesse sentido, nesse relatório de consultoria apresentar uma arquitetura informação de repositórios espalhados pela web e pelas redes sociais como ocorre com os chamados Essa iniciativa Participa.br atende para permitir catalogação institucionais, a demanda e, por esse motivo, relacional o objetivo é envolvendo objetos por exemplo, com outros artefatos de informação o objetivo e interação é propor e entidades linked dafa6. preconizada um método de no portal de catalogação de informações aberto e adaptado às demandas dos canais de participação social. 1.3 Justificativa No Primeiro Fórum Interconselhos da PNPS (Política Social) ocorrido no início de julho de 2014, foi identificado garantir efetividade dos conselhos e sua transparência em geral. De fato, percebe-se um desconhecimento Nacional de Participação que há muito por fazer para de funcionamento para a sociedade da sociedade sobre as reais funções dos diversos conselhos, mesmo aqueles mais antigos, como é o caso do Conselho Nacional de Saúde. De modo geral, o cidadão não sabe que conselhos existem e nem a carta de serviços que esses arranjos de participação oferecem para a sociedade. Por outro lado, embora alguns conselhos tenham uma página web para divulgação de atividades na Internet, percebe-se que esses sites não conseguem prover informação de qualidade para os interessados. Como um exemplo, se um cidadão quiser saber quais foram as decisões tomadas no último ano por um determinado conselho, terá que ler, quando disponível, documentos extensos, em formato desestruturado e de difícil compreensão como foi apresentado na Figura 1.2. Pela forma Participação prevista de catalogação de documentos Social, é esperado que algumas informações como, por exemplo, .0 telefone na biblioteca de um Conselho, o nome de um representante essa pesquisa se justifica, catalogação que envolve relacionamentos participação social, seguindo de uma período. Com uma vez que é voltada para uma entre informações (e não entre documentos) o movimento de básicas não serão oferecidas, Conferência ou a agenda de encontros a serem realizados num determinado base nessas suposições, digital dos formatos abertos de e. das interligações previstas na web semântica, como proposto por Miller (2011) e Coyle (2010). 6 Dados ligados. Maiores informações no endereço hltp:/llinkeddata.org. 11 "- '- "- - ri '. • EmPOMt'fJf/do<Ntm. ,1orurhmcl,nDton. 2. Revisão de literatura A catalogação da forma que é feita hoje tem como propósito principal a manutenção das coisas separadas, distintas a ponto de se saber que um livro é diferente do outro (COYLE, 2010). Ao assumir essa perspectiva, percebe-se que há um isolamento dos dados bibliográficos e essa atitude vai na contramão ao movimento das pesquisas sobre web semântica, onde se defende que os dados devem estar ligados entre si. Alguns autores da área de Ciência da Informação (COYLE, 2010; MILLER, 2011; FEITOSA, 2006), defendem que é preciso considerar que "as informações residem num mundo caótico que não pode ser '.- mais ignorado" e que é preciso lançar mão de ferramentas perspectiva. Como referência ao método tradicional que deem conta dessa nova de catalogação, cita-se o MARC (Machine Readable Cataloging), considerado como um padrão de capacidades esgotadas para esse novo recomendação paradigma AACR27. de ligação Discute-se de dados, ainda o em conjunto com (Functional FRBR ~s regras de Requirements for Bibliographic Records) e as regras de catalogação RDA (Resource Description & Access) como um novo modelo mais relacional mais voltado para a abertura descrita nesta pesquisa. Coyle (2010) acredita que é preciso priorizar os relacionamentos de forma mais agressiva do que o que tem sido feito até o momento para garantir que os sistemas de biblioteca possam pesquisadora, atender a perguntas mais elaboradas do usuário. Na visão dessa "ao invés de manter os registros bibliográficos separados é preciso enfatizar como eles se relacionam". A autora questiona a forma como tem ocorrido o cadastro de assuntos e autores de uma obra sem incluir nenhuma outra informação de contexto, o que pode criar problemas para atender as demandas dos usuários. Pela adoção dos princípios da web semântica (ANTONIOU e VAN HAMERLEN, 2004), prevê-se que a biblioteca não pode mais ficar neste modelo catalográfico tradicional, \ mas assumir um paradigma novo onde o usuário pode navegar e descobrir, ao invés de '- fazer apenas pesquisa (search) sobre documentos, o que não é considerado por Coyle (2010) e Miller (2011), uma busca rica o suficiente para atender todas as necessidades dos usuários. Como um exemplo desse novo jeito de relacionar informações, Coyle (2010) cita as informações obtidas na Figura 2.1, cujo conteúdo não foi feito à mão, mas foi montada em tempo real, a partir do banco de dados da biblioteca, que tem cerca de 25 milhões de livros, 7 Anglo-American Cataloguing Rules. Maiores informações em www.aacr2.org. 12 '- - • ...~ I 11 '. • E~t1f'W1Q.;clh. 'OI'IDrttt'ldohO(Ôr:. . e que se relaciona com dados das editoras e da Amazon8. Ou seja, a informação apresentada está sendo derivada de vários lugares, como fotos da wikipedia9, por exemplo. Miller (2011) e Coyle (2010) defendem que a biblioteca aberta (open Iibrary) deve \_~ armazenar tudo em pares de chave-valor usando o formato RDF10 para permitir consultas mais sofisticadas que envolvam assuntos, pessoas, lugares, épocas e outros tipos de informação. Dessa forma, o catálogo fica centrado em informações e não em documentos. A base para esse estudo será a investigação do FRBR/RDA em comparação com a catalogação tradicional e uma investigação sobre as formas, problemas e soluções para . garantir o relacionamento entre registros bibliográficos e não-bibliográficos . "- ~--:_~ -:-:::--_ _=___.-:::-- -.:--:---- ..---'~~.'7--:------ _ ---.-. -'_~--""" - ,- I ',,-, lx.l.d"d Thomas Mann t>; ewtl ~;':'j)1"",0(')<:OI'."2(1l<)!~ 6 June 1875. 12 Augusl 1955 Thomil~ l\.1ann \,'4150 ..•...... i\ German irooic epic novel, I~ure"te. anel novell~~. arri,t and ule intellectual. u~ed nlodemi7.ed short story wríle-r. social critic, phiJanthroplst, novelist, e~~o~,i~t. ond 1~29 Nol'el Prile Hi, Jn.l!y5i, GernlJn knO""' for his ~erie~ of high!y ~ynlbolic noted ior lheir insight into tile I',,"cholog;" ~nd critique .lnd Biblic~l st"ne~.~, oi the European ~nd oi rhe and Germ,ln soul well a, lhe ide~, oi Goethe. Niet7.!o<he, .,nd S:hopeoh~uer. His older brother w.,~ lhe r~dicJI writer Heinrich Mann. ~nd rhree of his si, children, Erik.1 Mano. KIJu$ Mann .,nd Colo Mann. al~o becanle imJ.'ortant German wI1ter~. \'Vhen Hitler (ame tO power in 1t?33, the ,1nt,-f:a~i$t M,lnn tled to Sh'ii7.erland. World .••..... War 11broke Oul in 1939. he emigr.Hed I:etumed to Swi17.erlnnd the ~o called in 1952. ThomJs Exilliteratur. l\1ilnn "'lhen to lhe United St."e~, irom where he i5 One of lhe mOSI kn0wI1 exponent$ ('lt suBJa::lS coneocpondenee.~, ~rm:mAulhors. Aeeeuibte book, Germo" Novelista, Oernocrney. l.smm:e) Q,nnan := Engllch. World W:1', 1939-1945.~,~. Mi)!;:tEdtliclYJ.l Ar" Publi~hed I~ __ ::=J • socltlli •.m.Ttnn~lfttions inb Ge',,,,.n Famllle I ~ govem~n1. NnUonol ___~~:~~I~,~:'~,~:~:~~ner ..... iJ helion, knowtedge:. 713works ~' _____ erevious • ~el(\ !;Highlight.all lon9uoge.~.~ 1"~'pl8l:nlOn. Mu.1c nnd Iherolu",~ Acede". ~tT::'I Uul'1dlolll, '939-'9d5. ~. NbClOnn1lOCltlllsmo. Nove"'I' ..A'M_nt:"n.~lJthou ...t.fUilnty ~tmlln . • ..--::. O Mats;.h case Figura 2.1 - Exemplo de um registro bibliográfico com informações interligadas Fonte: http://www.kcoyle.net ...••... 2.1 Dados ligados e abertos (linked open data) Tradicionalmente, os sistemas informatizados são elaborados com uma tendência ao isolamento das informações em 'SGBO's ou sistemas gerenciadores de bancos de dados, provocando problemas de interoperabilidade, como citado em Cruz (2014). Por outro lado, percebe-se que a disponibilização desses sistemas na Internet por meio de interfaces web 8 9 URL http://www.amazon.com. URL http://pt.wikipedia.org. RDF _ Resource Description Framework é um padrão recomendado pela W3C para descrever sendo um dos pilares da web semântica. Maiores informações em www.w3.org/rdf. 10 recursos encontrados na web. 13 ~'."'- '. li [IJ E~ndo~ ItHtafamt»IIO(Ol'1. criam um problema de indexação e localização de seus conteúdos pelos motores de busca (como o Google, bibliotecas, por exemplo). Tais sistemas, dentre eles os OPACS formam os sites dinâmicos, cujas páginas para controle de web são conteúdos gerados no momento do acesso ao site e acaba gerando no contexto da Internet um aglomerado de silos de dados isolados (sem interoperabilidade). Em contraposição - a esse cenário, foi proposta uma alternativa dados na web de forma a aumentar a estrutura dos conteúdos devida associação de significado e estabelecimento de publicação disponibilizados, dos com a de padrões para a publicação de dados e ligação entre eles, num movimento conhecido como web semântica. Nesse contexto, os dados ficam mais enriquecidos por meio de associações variadas e podem estar associados a vocabulários e serem compartilhados por diversas aplicações. Para viabilização da proposta citada, foi proposto que os dados na web fossem publicados em formato RDF (Resource Description Framework) que seria um primeiro passo para viabilização do compartilhamento de dados e significados, transformando o modo de se utilizar a web, de acordo com o framework ilustrado na Figura 2.2. ~. __II'I••. "M Use r Interface & Applications IIII__ i ~ _ XML "lia., _.'._I:!II. _M URI/IRI Figura 2.2 - Framework da web semântica Fonte: htlp://www.w3.org De acordo com essa figura a viabilização da web semântica torna-se viável por uma série de iniciativas, tais como a adoção do modelo de dados ontologias em linguagens padronizadas, uma linguagem RDF, a construção de como é o caso do RDFS e OWL e a adoção de de consulta menos rígida como a SPARQL, para permitir consultas que explorem as ligações entre os conteúdos. 14 ,. , ,-1"'/", ~, .'. " " ' lmpodmmQOl'tl1m. • 100fClrr:t'IldOIl(lCOt1. De um ponto de vista prático, prevê-se a necessidade registrados de conversão de dados em tabelas de bancos de dados em triplas RDF, com está ilustrado na Figura 2.3. (a) Tabela típica de um banco de dados Sujeito , ' , -"l ! : [•....__ B_i1_'G_ates __ Predicado Objeto ' é O fundador da> .[•.•.__ M_i_cr_O_s_oft J: (b) Linha da tabela descrita em RDF Figura 2.3 - Comparando tabelas relacionais com modelo RDF Nesse caso, cada linha da tabela do banco de dados relacional da Figura 2.3-a refere~e a um tipo de atributo ou predicado associado a um determinado sujeito, que está citado na parte b dessa figura. Da mesma forma, o conteúdo específica da tabela da célula naquela linha se refere ao valor do atributo. Esses dados, numa notação RDF referem-se ao sujeito, predicado e objeto, respectivamente. A título de exemplo, é apresentado na Figura 2.4 um grafo produzido como fruto de conexões na web, permitindo qualificar os elementos e, ao mesmo tempo, promover contexto onde as consultas (em formato SPARQL) produzem Nessa figura percebe-se que,-apesar das informações apresentadas fontes distintas, ocorre uma apresentação mais completos. serem originadas de dos dados de maneira uniforme. Essa situação ocorre porque é previsto que os dados possuam identificadores Resource Identifiers) para evitar ambiguidades. vinculadas a namespaces resultados um únicos ou URls (Uniform Ao mesmo tempo, essas URls podem ser ou espaços de nomes que são abreviações particulares de cada contexto onde os dados foram originados. 15 '---." .. • t' - , .. $ EmpocIf>.OtldCo'lÕCtllL fOltclrcmdornxO!'). C, fmf •• ~ Mhom,_ ~ ~/_OmIfO'l,n fOaf.n31ne •••",~ . / IB~_.Chrlitíõll •• '! p:reference celJC •••• ;to.' ..:~ p:auChor ~JdIlf.6I.IIl_:rn:=:c::::~ .:. -:' ~ :~-' Figura 2.4 - Exemplo de grafo RDF ligando várias fontes de dados Dentro da perspectiva data1\ da web semântica, existe um termo conhecido como linked que faz referência a um conjunto de melhores práticas para a publicação de dados estruturados na web. Os princípios essenciais são os seguintes: Usar URls como nomes para recursos Usar URls HTTP para que as pessoas possam encontrar esses nomes Quando alguém procurar por uma URI. através dessa. providenciar informações úteis, por meio de RDFs Incluir sentenças RDF que ligam para ,outras URls de forma que eles possam descobrir mais recursos Desde que os princípios de abertura de dados foram anunciados, a nuvem de dados ligados muitas comunidades, em especial os responsáveis por bibliotecas digitais, a fim de prover maiores relacionamentos entre seus objetos e o mundo externo. Na Figura 2.5 é ilustrada a situação da nuvem de dados abertos na Internet no ano de 2010 e é provável que ela esteja bem maior nos dias atuais por conta do número cada vez maior de adesões a esse novo paradigma, em função dos benefícios citados. 11 Ver mais em http://linkeddata.org. 16 li lIJ '- "- As Of •••• ""' •••• 2010 Figura 2.5. Amostra da nuvem de dados ligados em 20j O Fonte: http://linkeddata.org Na Figura 2.5 pode-se ressaltar algumas peculiaridades: '- dados publicados em formato linked data, (H) o tamanho (i) os nós são conjuntos de dos círculos corresponde ao número de triplas em cada conjunto de dados, (iH) as setas indicam a existência de pelo menos 50 ligações entre dois conjuntos de dados e (iv) uma ligação (link) é uma tripla RDF. onde sujeito e objeto estão em namespaces de conjuntos de dados diferentes. 2.2 Localizando significado para conteúdos do linked data As ontologias, os vocabulários e os metadados12 padronizados são as alternativas para descrição de dados no contexto Iinked data. Como no contexto da web de dados ligados, a preferência é sempre por reusar elementos que já tenham sido definidos. foram criadas algumas alternativas para encontrar metadados e ontologias úteis no contexto da web semântica e que estão listados a seguir. • Swoogle (hftp://swoog/e.umbc.edu) - criado pela universidade de Maryland (Baltimore) em 2007. com atualização diária. É um' Google para a web semântica, '-- 12 Os metadados são vistos nessa pesquisa como uma espécie de ontologia, já que compõem um acordo conceitual lógico estabelecido pela comunidade de usuários e geralmente referem-se às propriedades no modelo RDF. e termino- 17 €><il@ ""..' • tI'" , EmpodnClfldOOOÕdll1. i(J(lotrcmd(Jtt«Ol'1 que busca por documentos em formatos palavras chaves nesses documentos, abertos e executa indexação podendo fazer pesquisas por por termos da ontologia ou por dados RDF. • Vocab.org ontologias, (http://vocab.org) incluindo - Esse site comporta duas que são baseadas mais de duas dúzias no modelo de dados (discutido mais adiante). Em geral, o conjunto de elementos de FRBR de metadados são projetados para uma aplicação específica (inclusive o Dublin Core que foi definido para recursos web). Os termos do vocab.org não servem para uma aplicação particular. • Open Metadata Registry (http://metadataregistry.org) contém um número de ontologias relacionadas usado pelo comitê de desenvolvimento - refere-se a um site que a bibliotecas e vocabulários do RDA (Joint Steering Committee e é for Oevelopment of ROA), que será discutido mais adiante, para descrição de termos e metadados bibliográficos. Dentre os vocabulários e ontologias encontrados nesses sites, pode-se citar o Dublin Core13 (para descrição de recursos na web), o FOAF14 (para descrição de pessoas) e o BIB015 que é uma ontologia bibliográfica . . ~ . 2.3 Tendências e padrões de catalogação .. A IFLA (1998) - International Federation of Library Associations Federação Internacional de Bibliotecas e Instituições Associadas and Institutions ou - é uma entidade responsável pelas normas internacionais de catalogação para diversos tipos de objetos de informação, como ISBO (International em documentos conhecidos Standard Bibliographic Oescription). As normas de catalogação ISBO, apesar de serem mais centradas no registro catalográfico do que na estrutura da obra catalogada, descrevem algumas peculiaridades de documentos. Mesmo sendo usado como referência de catalogação algumas normas ISBO têm sido questionadas todas as expressões representação de busca possíveis, em muitas bibliotecas, em função de não conseguirem como, as que envolvem do objeto de informação porque a sua capacidade é baseada no item. Portanto, uma característica atender a formas variadas de de descrição bibliográfica comum dos padrões citados é o foco nas funções do catálogo como produto final do processo e uma certa ligação com os suportes 13 http://dublincore.org. 14 http://www.foaf-project.org/ 15 http://bibliontology.com "- 18 ',-- - , -- , '- t~onc1ori.1o~ '(ll'lo1nnH101'Kl(Óf"'_ '- físicos que armazenam as informações, e não no conteúdo propriamente - regras de catalogação definidas no AACR2 (padrão anglo americano de catalogação). I f '. ..... 2.3.1 Modelos conceituais para catalogação Os modelos conceituais são uma alternativa interessante .-- dito, segundo as para descrever conteúdos de informação, porque (i) permitem ordenamento ou agrupamento característica que favorece permitem o mapeamento novas formas de visualização de dados relacionados, e consulta dos dados, de conceitos para outros modelos como o CIDOC-CRM, (ii) e (iii) permitem a descoberta de recursos relacionados. L ',,- .. Nessa linha de raciocínio, a IFLA publicou recentemente conhecido como Functional Requirements for Bibliographic Records (FRBR) no qual o processo de catalogação documentos. L um documento foi revisto, sendo dado um enfoque maior para a natureza No FRBR os documentos composição e os possíveis relacionamentos, são descritos e conteúdo dos considerando a sua própria visando facilitar a interação do usuário com o objeto pesquisado. A versão mais famosa do FRBR é baseada no modelo ER (Entidades de Relacionamento) relacionais. - largamente usado em sistemas gerenciadores de bancos de dados Nesse caso, o conceito de obra como unidade de catalogação passou a ser associado a termos como "expressão", "manifestação" e "item", num únicq grupo (grupo 1), como está apresentado na Figura 2.6. --------o ..,cunivo ...•: --+ um ?!,_~ I __J Item Figura 2.6: Entidades do Grupo 1 do Modelo FRBR Fonte: Tillet (2004, p. 2) Em relação às entidades apresentadas nessa figura, a Obra representa intelectual ou artística em si, sem levar em consideração editoras, dentre outros. A expressão refere-se à forma o suporte, de expressão intelectual (work) e também compreende traduções, interpretações manifestação refere-se à personificação a criação o idioma, edições, de uma produção de obra musical, etc. A da expressão de uma obra e é onde se expressa a produção intelectual ou artística de uma obra, sendo mais voltada para o suporte físico do 19 - •. • , . . ., item que possui o conteúdo que compõe a obra. Por fim, o item é o que hoje se entende como exemplar presente numa biblioteca. É a partir do item que se identifica qual é a obra '" .... inserida nele e qu~1 a sua E?xpressãoe manifestação. Além do grupo 1, o FRBR prevê ainda dois outros grupos que englobam '._. muito apropriados para o registro cataiográfico de documentos caso do grupo 1, uma obra pode ter diversas expressões ligada a uma ou mais manifestações. de participação e cada expressão conceitos social. No pode estar mesma forma uma manifestação pode ser descrita Da por vários itens, num esquema de relaCionamento como está ilustrado na Figura 2.7, com aplicação do FRBR para catalogação de uma obra (w), suas expressões (e), manifestações '.~ (m) e itens (i). w1 Variações Goldberg de J.S. Bach e1 performance de Glenn Gould gravada em 1981 m1 gravação liberada em disco.de 331/3 rpm em 1982 pela gravadora GBS i1 cópia mantida para SC m2 gravação pré-lançada em CD em 1993 pela Sony i1 primeira cópia mantida em HC . i2 segunda cópia mantida em HC e2 performance de Ton Koopman gravada em 1987 m1 gravação lançada em CD em 1988 por Erato i1 cópia mantida em HC e3 partitura para piano editada por Ralph Kirkpatrick m1 edição publicada em 1938 p,?r G. Shirmer i1 cópia mantida em BMC Figura 2.7 - Exemplo do modelo FRBR aplicado a .um registro musical Fonte: Anderies (2004) Os grupos 2e 3 do .FRBR são relacionados ilustrado na Figura 2,8 e'possuem Requirements documentos for Authority Data (FRAD) a entidades específicos, e conceitos, conhecidos como está como Functional e Functional Requirements for Subject Authority Data (FRSAD). ~ , ; 20 ',- ImtxJdmJndO O'ldOi IClttl~'fm"flrur.~ 2.3.2 ROA - Novo padrão de catalogação o AACR2 - Anglo American Cataloguing Rules, como o próprio nome diz, é um código de catalogação orientado a livros, mapas e outros tipos de objetos analógicos, com um viés para catalogação organizada plana (uso de metadados simples) e com documentação com um capítulo para cada tipo de recurso. No documento do AACR2 são definidos os pontos d,e acesso para pessoas, entidades coletivas, nomes geográficos, títulos uniformes e remissivas, como está apresentado na Figura 2.10, com regras para descrição bibliográfica e os pontos de acesso admitidos. Descrição A inteligência coletiva: por uma antropologia do ciberespaço / Pierre Lévy ; tradução: Luiz Paulo Rouanet. .4. ed .. São Paulo: Loyola, 2003. - 212 p. : il. - Título original: L'intelligence collective: pour une anthropologie du cyberspace. - Inclui bibliografia. ISBN 85-15-01613-3 '- Pontos de acesso Lévy, Pierre,1956Rouanet, Luiz Paulo A inteligênáa ex>letiva Figura 2.10 - Descrição tradicional com uso de regras AACR2 Mais recentemente substituto do AACR2 conceituais surgiu o Resource Description and Access com novas regras de catalogação FRBR, FRAO e FRSÀO para prover diretrizes atributos e relacionamentos das entidades obra, expressão, compatíveis (RDA)16, como um com os modelos e instruções de registro manifestação, de item, pessoa, família, entidade coletiva, conceito, objeto, evento e lugar. o ROA é um código de catalogação compatível com qualquer padrão de -metadados (MARC 21, Dublin Core, etc.) e é voltado para o' ambiente digital que permite a descrição de todo tipo de conteúdo e de mídia para ser utilizado além da comunidade organização do ROA possui (entidades), as características (relacionamentos). de bibliotecas. A regras para objetos que são de interesse dos objetos' (atributos) e as relações dos usuários entre os objetos Por exemplo, para manifestação e item, prevê-se a catalogação do título principal, indicação de responsabilidade, edição, local de publicação, publicador/data de publicação, indicação de série, ISBN, tipo de mídia e tipo de suporte, extensão e dimensões e a URL. Em relação à obra e expressão, prevê-se a catalogação de título da obra, data de 16 Ver mais em http://www.rda-jsc.org/rda.html. 22 . ./\.-'-.' 'S.f.f. , '"-,' ) f"'pol'l!"rrtndo"'tl'~ 100ItI"'(rndofl.OCÓl"" criação, forma da obra, idioma da expressão e tipo de conteúdo. •. Em relação à pessoa, família e entidade coletiva, prevê-se a catalogação de informações como o nome preferido, o nome variante, os locais associados e as datas associadas a essas- entidades; Na seção "" .• , de registro dos relacionamentos, há destaque para os relacionamentos primários, pessoas, famílias e entidades coletivos e o recurso, assuntos, obras, expressões, manifestações e itens, pessoas, família e entidades coletivas, conceitos, objetos, eventos e lugares. A ROA contempla seções para atributos e relacionamentos e, desde a sua criação, ''''- várias entidades e bibliotecas têm seguido essas regras, dentre elas a biblioteca do -'.-- congresso americano disponibilizada (LOC)17, a partir de abril de 2013. Para facilitar a sua adoção, foi uma ferramenta denominada rdatookit18 para descrição de recursos nesse novo paradigma relaciona!. Na perspectiva da abertura de dados e de relacionamentos, ROA é a materialização de um desejo da comunidade catalogação, em especial os participantes do OCMI (Dublin pode-se dizer que o de pesquisadores da área de Core Metadata Initiative)19, para viabilizar a 'ligação de dados das bibliotecas com os demais recursos da web, inaugurando uma nova era para a biblioteca de dados. Esse trabalho foi progressivo e todos os elementos e listas definidos são registrados no Open Metadata Registry, com mais de 1300 elementos agrupados de' acordo com sua aderência às entidades FRBR. Por consequência, tal estratégia torna a navegação discutido anteriormente um poLico mais fácil e compatível com o Iinked data, nesse documento. As mudanças da ROA são mais radicais na organização de seus capítulos, que não se faz pelo tipo de material, e sim pelos objetivos das tarefas dos usuários de identificar e relacionar as informações procuradas. No documento do ROA, existem quatro seções sobre o registro de atributos que são mais diretamente --. . - ligadas a um dos modelos conceituais citados. Essa associação está destacada na Tabela 1 a seguir. '.-- 17 Ver mais em http://www.loc.gov/. 18 Ver mais em http://rdatookit.org. 19 Ver mais em http://dublincore.org/specifications/ 23 '\-- "'- '-- liJ •• mm l~o""l1(u. rOfIO"r1'I'l»na;m. Tabela 2.1 - Organização do ROA para registro de atributos No. Secão " Modelo conceitual o 0.0 .~. o .. -- Escopo Instruções gerais para registrar os atributos das manifestações 2 FRBR Instruções gerais para registrar os atributos das obras e expressões, da descrição do conteúdo 3 FRAD Instruções para registrar os atributos de pessoas, famílias e entidades coletivas. 4 FRBR e FRSAD Instruções gerais para registrar atributos e a identificação jetos, eventos e lugares o o documento e itens além de conceitos, ob- do ROA possui seis seções vinculadas aos modelos conceituais para registro das relações, os quais estão listados na Tabela 2. Tabela 2.2 - Organização do ROA para descrição de relacionamentos Seç:io Modelo conceitual 5 FRBR Instruções gerais para o registro de relações primárias entre obras, expressões, nifestações e itens . 6 FRAD Instruções gerais para o registro das relações associadas com pessoas, famílias, e entidades coletivas e as relações entre essas entidades e os objetos do grupo 1 do FRBR (obra, expressão, manifestação e item) 7 FRBR Referem-se ao registro dos assuntos de uma obra, mais especificamente ceitos, objetos, eventos e lugares 8 FRBR Referem-se itens. ao registro das relações entre as obras, expressões, 9 FRAD Referém-se ao registro das relações entre pessoas, familias e entidades coletivas. 10 FRBR Referem-se ao registro das relações entre os conceitos, objetos, eventos e lugares. N°. da '- o FRBR Da mesma forma, - - 1 ,~ - - o ROA Escopo sobre con- manifestações difere do AACR2 em vários aspectos, a começar da terminologia ma- e usada. Por exemplo os termos "cabeçalho", "entrada principal" e outros de uso comum no AACR2 são denominados de "pontos de acesso" no ROA. O ROA divide os recursos em três categorias para detalhar a fonte preferida de informações para folhas soltas, imagens em movimento e outros recursos. Isso é feito com elementos essenciais e opcionais. Além disso, não há expressões em latim e não há abreviação de termos, salvo poucas exceções. 24 r.... ,- 1I " ~,~ ". . \. , ': ~ . e- ..~ > No ROA, a geração de pontos de acesso não segue a regra dos três do AACR2, oU' seja, o catalogador escolhe se quer descrever todas as responsabilidades, gerando ponto de acesso secundário ou descrever a primeira e entre colchetes a informação de que há mais autores. Além disso, não há designação geral de materiais (OGM) como ocorre no AACR2 e, no lugar deles, surgem três novos elementos ou campos que são o content type (tipo de conteúdo), o media fype (tipo de mídia) e o carrier type (tipo de suporte), que define todo a estrutura descritiva do ROA o content type refere-se à forma pela qual o conteúdo é expresso e através do qual é pelo sentido humano. O media fype indica a categorização percebido mídia/dispositivo requerido para visualizar o conteúdo indicativo do meio de armazenamento de um recurso. geral do tipo de O carrier type é e suporte necessário para a leitura e reprodução do conteúdo catalogado. 2.4 Vocabulários controlados Vocabulários linguagem sistemas controlados documentária de bibliotecas. vocabulários refere-se a uma lista de palavras que servem como uma padronizada Dependendo podem ser simples, questões de ambiguidade, para facilitar do nível a recuperação de informações de funcionalidades desejadas, como uma relação de termos simples em esses para resolver podem ser um anel de sinônimos para garantir o uso de palavras com mesmo significado, podem ser uma taxonomia estabelecendo relação hierárquica entre os elementos e, finalmente, podem ser um tesauro, que contempla relações mais complexas entre os termos ou índices que representam a área do conhecimento em questão. O nível de complexidade cresce da esquerda para a direita, em função do tipo de vocabulário, como está ilustrado na Figura 2.11. Complexidade Anel de sinônimos Taxonomia Figura 2.11 - Complexidade dos tipos de vocabulários controlados Fonte: Adaptado de Magela (2014) Do ponto de vista das novas regras de catalogação e da abertura de dados, os assuntos ou termos ganham uma importância maior por permitirem ligações variadas entre objetos de informação. 2S - I "",- E~l'ldo~M IOIlQJrttrrdoflll(r>t1. Em geral, no processo de organização de conteúdos construção de um vocabulário controlado entanto, em função_da ..s.ua_importância, para apoiar de informação, o processo algumas comunidades é prevista a de catalogação. No iniciaram um processo de gestão de vocabulários, como é o caso do Agrovoc20 - agricultura e alimentação, e o LCSH21, que é um cabeçalho de assuntos da Biblioteca do para termos relacionados à Congresso Americano, que podem ser utilizados para indexação de objetos de informação locais. Os termos de um tesauro, por exemplo, podem ser aplicados para cada item de uma coleção de biblioteca e facilita o acesso do usuário a item no catálogo que pertencem a um assunto similar. Independente da utilização de um vocabulário controlado comum, é interessante _Organization tesauros, que esses possam ser descritos com uso do Simple Knowledge (SKOS), que é uma recomendação System esquemas particular ou um de uso de classificação, taxonomias, W3C sistemas para representação de cabeçalho-assunto qualquer tipo de vocabulário controlado. Esse padrão é parte da família de ferramentais web semântica e permite que as relações do vocabulário controlado de ou da sejam descritas na forma de triplas RDF, que é importante por habilitar publicação fácil e uso dos vocabulários como Iinked data. Vale ressaltar que os vocabulários disponibilizados Metadata Registry estão-em -RDFcom o status de publicado pela IFLA no Open e os elementos são denominados por designações numéricas. O SKOS características principais são define comuns as classes e propriedades encontradas conceitos, Jabe/s, em um tesauro notações, suficientes típico relações para (padrão), representar - as cujos semânticas, elementos propriedades mapeamento e coleções. É baseado na visão centrada no conceito do vocabulário, objetos primitivos não são termos, mas noções abstratas representadas de onde os pelos termos. Cada conceito (descrito em RDF) pode ter propriedades RDF anexadas a ele, incluindo (i) um ou mais termos de indexação termos alternativos preferidos ou sinônimos, (pelo menos um em cada linguagem (iii) definições e notas com especificação linguagem. Os conceitos podem ser organizados em hierarquias, estreito, ou ligadas por relações não hierárquicas (associativas). pegos em esquemas natural), (ii) de sua usando as relações largoOs conceitos de conceitos, para prover um conjunto consistente podem ser e estruturado de conceitos como um todo ou parte de um vocabulário controlado. 20 Ver mais em http://aims.fao.org/standards/agrovoclaboul. 21 Ver mais em http://id.loc.gov/authorities/subjects.html. 26 ...... E~otriM"'O'ttllferl>do"O(on. "'.- 2.5 Registros de autoridades (pessoas e organizações) Os registros de autoridades referem-se a pessoas e organizações e são constituídos para controlar as formas autorizadas e variantes de nomes e para iderilifica-é!õres usados ' ..•.•... como pontos de acesso (IFLA, 2009). Com isso, o controle de autoridade beneficia os usuários a pesquisar qualquer forma controlada de nome de um autor ou de um título para a recuperação dos recursos bibliográficos autoridade são um elemento em catálogos. chave na infraestrutura Nesse sentido, da web semântica, os registros de permitindo um acesso mais preciso à informação e, ainda, uma apresentação dessa informação no idioma de preferência do usuário_ Com os modelos FRBR e FRAD, o paradigma dos pontos de acesso também foi alterado visando priorizar a conveniência proporcionando um entendimento do usuário e valorizando de como esse tipo de registro e os dados de autoridade funcionam. Tais mudanças também se refletiram no RDA constituindo uma nova forma de pensar a respeito de dados bibliográficos e de autoridade. Neste sentido, foram elaboradas instruções para a criação dos pontos de acesso dos documentos, reunindo elementos como pontos de acesso para obras, expressões, pessoas, famílias e pessoas jurídicas. Na RDA as informações registradas sobre pessoas físicas vão além da__ ~ifere~_clé!9~0 de duas pessoas homônimas, privilegiando registros de autoridade para pessoas físicas em igual nível de importância em relação aos registros bibliográficos. Dessa forma, pessoas sendo entidades de primeira classe não interagem apenas com os itens bibliográficos também entre si, favorecendo regras para a descrição mas as relações típicas das redes sociais. A proximidade entre as bibliográfica e as regras para o estabelecimento de registros de autoridade permite evidenciar suas ligações e faz com que o registro de autoridade seja uma extensão do registro bibliográfico (SALGADO e SILVA, 2013). Na perspectiva da web semântica e do linked data, duas alternativas surgem para o tratamento de autoridades. Uma delas é o FOAF - Friend of a FriencP2 - uma ontologia para descrição de perfis que se mostra bastante adequada para garantir as ligações planejadas no linked data. Uma segunda alternativa é o VIAF (Virtuallnternational Authority File) 23 que combina múltiplos nomes de arquivos de autoridade em um único serviço mantido pela OCLe (Online Computer Library Center)24. O objetivo desse serviço é diminuir o custo e 22 http://www.foaf-projectorg/ 23 Ver mais em http://viaf.org/ 24 Ver mais em https://oclc.org/home.en.html 27 , " .•.. ' melhorar a utilidade dos arquivos de autoridade por comparar e ligar arquivos de autoridade largamente usados e tornar essas informações disponíveis na web. 2.6 Serviços de anotação Anotação é, em grande medida, a atribuição de metadados pelo próprio usuário da informação que está em uso, seja ela uma página web, uma música, uma imagem ou um vídeo ou mesmo um trecho de .código de um programa. A variabilidade de formas de se fazer uma anotação tem atraído os usuários e atualmente existem diversas alternativas de software para essa funcionalidade, implementando um paradigma novo que admite discussões colaborativas sobre um documento ou obra multimídia. Dentre os softwares para essa funcionalidade para documentos locais estão o Mendeley25, o Zoter026 e o MS One Note27. No contexto do linked data estão (i) o Editorsnote28 - voltado arquivísticos, (ii) o Pundit29 .-: para anotações que admitem associações para materiais entre páginas web, baseado em ontologias, e o (iii) Synote30 - para anotações em recursos multimídia. o processo de anotação também é parte do modelo BIBFRAME31 que é um framework bibliográfico que visa substituir o padrão Marc para o mundo do Iinked data. É, \." portanto, um modelo de dados projetado para acomodar maior flexibilidade catalogação e, ao mesmo temp0,-:considerar no processo de como válidas as tags ou anotações providas pelos próprios usuários. Uma visão gráfica desse modelo pode ser vista na Figura 2.12. No contexto das modelos de entidades ER, incluindo o FRBR, o BIBFRAME adota a prática de identificar unicamente os recursos (URls) para todas as entidades, atributos e relações entre entidades a fim de melhorar o processo de anotação com mapeamentos para outros vocabulários, por exemplo (MARC, 2012). Portanto, além das classes work, instance, . authority citadas na Figura 2.12, existe também a classe annotation que é um recurso que '-' permite ao usuário prover informações adicionais ao registro bibliográfico na forma de tags. _oi Recentemente foi proposta uma solução generalizada para o processo de anotação, conhecido como Open Annotation (OA)32 - uma recomendação do W3C - que é um modelo .... - de dados para anotação aberta e compatível com o Jinked data, visando permitir o 25 http://www.mendeley.com/ 26 https:llwww.zotero,org/ 27 hltp :lloffice. m icrosoft. com/pt -br/one netel 28 hltp:lleditorsnotes.orgl 29 https:llthepund.iU 30 hltp:/llinkeddata.synote.orgl 31 http://bibframe.org/ 32 hltp:/lwww.openannotation.org/ 28 r!.-J'-/'.O" 6(' _ .. -o., '. • Empó(1tnftndO\l'lCJlJl 'OItc1NrndOllO(OM.. compartilhamento de anotações entre usuários, independente das ferramentas de software em uso. Um trecho desse modelo de dados está ilustrado na Figura 2.13. Figura 2.12 - Representação gráfica do modelo de dados BIBFRAME Fonte: MARC (2012) -w- ~1'99;nv- ~_~"ffi,"B, oa:hasBody "jf~pe / ~ ----<> ,dl~ oa:hasTarget \ ,dI "'" G) foaf:page cEcumen~ Figura 2.13 - Exemplo de atribuição de tags no contexto Open Annotation Fonte: http://www.openannotation. org/speclcore/20130205/core.htmJ#T agging 29 .•... ,'- ... >, .' /"'poMrttftdo-...d!ll. 100tC"'crnd""l),m 3. Metodologia para organização de informação de participação social No contexto dess~ produto, a organização da informação refere-se ao tratamento intelectual que deve ser dado aos de participação social de modo que sejam recuperáveis posteriormente. Dentre as técnicas relacionadas tem-se a catalogação, a classificação, a esse tema na Ciência da Informação, a indexação e o resumo (FEITOSA, 2006). A catalogação refere-se mais ao registro dos elementos básicos de um objeto informacional "~ .. - e a classificação procura individualizar os objetos de informação em relação aos demais. A indexação é uma atividade que exige um maior nível de detalhamento informacional a adequadamente fim de encontrar o documento. palavras ou Tal funcionalidade índices que possam pode ser automática, do conteúdo representar como ocorre no Google, ou manual, com apoio de um bibliotecário para realização da análise do documento. Da mesma forma, essa funcionalidade pode ser com ou sem o uso de um vocabulário controlado para apoiar a indexação do documento. síntese do conteúdo do documento, Por fim, o resumo é uma atividade de que também pode ser realizada com ou sem uso de vocabulário controlado. Tradicionalmente, l. foco na recuperação as técnicas de organização da informação têm sido aplicadas com de documentos, -~. metadados muitas descritivos) bibliotecas vocabulários -.--- com uso de catalogação - e com poucas informações digitais controlados plana (com priorização dos -~- e repositórios e sem considerar sobre autoridades. institucionais Da mesma forma, são realizados a participação do usuário sem o uso de no processo de marcação dos dados. Essa abordagem é compatível com a versão brasileira da AACR2, que apresenta uma inclusão de regras específicas de entradas para nomes de língua portuguesa e prevê apenas as entradas autorizadas e as remissivas de nome. Não apresenta, portanto, regras para a construção de um registro de autoridade mais consistente. Embora essa estratégia seja eficiente em muitos contextos, em especial naqueles onde se deseja a organização de documentos em repositórios institucionais, essa abordagem não parece a mais adequada para os conteúdos de participação social e para a vocação estabelecida no Participa.br. De fato, as informações de participação social são dinâmicas e com forte interação com entidades e com usuários que muitas vezes participam de redes sociais e conhecem tecnologias que envolvem redes de relacionamento Informação33. típicas no contexto da Sociedade da O portal Participa.br, por exemplo, é um espaço concebido para que diferentes 33 Ver mais sobre essa definição em http://pt.wikipedia.org/wiki/Sociedade_da_informação. 30 r_''-'',_- ~ ..... !"'; ... .. ...• ; ~, ) ~ ~ : • expressões e formas relacionamentos bibliográfica \-.- de participação abertos e diversos. feita no Capítulo 2, ocorram, promovendo Por. esse motivo, a proposição tomando metodológica um contexto para como base a revisão para organização de participação social contempla os elementos constantes na ilustração apresentada na Figura 3.1, considerando numa teia de ligações ainda que os objetos informaCionais estarão contextualizados envolvendo pessoas, assuntos e outros recursos informacionais, como é preconizado pelo linked data. Na ilustração da Figura 3.1, os objetos de informação representam participação social (e não documentos) que, uma vez identificados, às técnicas entidades de catalogação declaradas relacionais nos moldes conteúdos devem ser submetidos do FRBR que é voltado no novo código de catalogação de ROA (Resource para as and Description Access), e que o torna compatível com a web semântica e com os requisitos de interligação identificados conteúdos para as informações de participação social de participação podem, social34. portanto, Com essa serem inseridos abordagem, num os contexto contemplando a dinamicidade e abertura desejadas. \'--' Registro bibliográfico Vocabulário controlado ~ '.- Registro de pessoas e organizações I-~-n-o-t-a-ço-e-s-' Figura 3.1 - Componentes de organização de informação de participação social "' ..:-- Seguir a recomendação ROA aqui significa realizar demandas dos usuários e não com foco nos documentos, tradicionalmente. catalogação com foco nas em oposição ao que é feito Nesse sentido, o Dublin Core - assumido como premissa de catalogação dos objetos de informação - deve ser visto no método proposto como uma ontologia de conceitos enquanto os registros de atributos devem ser realizados com triplas na forma 34 A principal especificação FRBR está disponível no site http://vocab.org. A versão compatível com o ROA pode ser encontrada no Open Metadata Registry (http://metadataregistrv.org) e é denominada de "Entidades FRBR para o ROA". 31 '- '\ .. 1,"~()""""1 'orlt1ir'tNl(10ftOcón. , \.~ sujeito-predicado-objeto. Nesse caso, a ontologia Dublin Core servirá para descrever o significado dos predicados das diversas triplas que qualificam os objetos de informação de participação social, procurando reaproveitar definições já publicadas em sites como o Open Metadata Registry (seção 2.2). Ao mesmo tempo, novas publicações de metadados devem ter URls e devem ser devidamente registradas nos catálogos apropriados para que possam eventualmente serem aproveitados por outros repositórios digitais. ',:- Uma outra característica dessa proposição metodológica para organização de informações de participação social é a elevação do registro de autoridades (entendidas aqui como pessoas, organizações, etc.) ao mesmo patamar dos registros bibliográficos dos documentos a fim de permitir relacionamentos mais profundos e, ao mesmo tempo, viabilizar a participação dos usuários no processo de atribuição de tags colaborativas "'- disponibilizados. Nesse caso, sugere-se a utilização de identificadores aos conteúdos únicos para as autoridades, assim como a adoção do FOAF (seção 2.5) como ontologia para descrição de perfis de usuários que possa viabilizar os relacionamentos das pessoas entre si e com os objetos de informação. Ao mesmo tempo, sugere-se que as informações sobre autoridades sejam descritas como triplas Adicionalmente, RDF que possam admitir ligações com outros objetos. sugere-se utilizar autoridades registradas no VIAF (seção 2.5) quando for pertinente e, em contraposição, sugere-se o registro de novas autoridades criadas no VIA F para que possam também serem utilizados por outras comunidades. Além da priorização de descrições bibliográficas e de autoridades, seja considerado o uso de vocabulário controlado, elaborado propósito da temática de participação social a fim de representar em uso nessa área. Nesse caso, recomenda-se é importante que especificamente para o as demandas de termos a adoção de um tesauro com relações de equivalência, hierárquicas e associativas para garantir a alimentação controlada dos valores de metadados. "-- relacionamento Para efeito de integração desse vocabulário aberto, sugere-se que o mesmo seja apresentado do SKOS (seção 2.4), preferencialmente in denominado SKOSed36, com outras formas de utilizando os elementos com uso do editor Protégé35 estendido com o plug- que permite criar e editar tesauros ou artefatos similares voltados para a notação sugerida. "'.- Com relação ao objeto de informação, prevê-se que o seu registro deva ocorrer em duas etapas informações '- distintas. sobre Na primeira delas presume-se esse objeto é o usuário externo, que quem geralmente fará o depósito ligado de a conselhos, conferências, ouvidorias e outras formas de participação social. Nesse caso, a catalogação 3S Editor de ontologias open source e framework para construção de sistemas inteligentes. Ver mais em http://protege.stimford.edu/. 36 https://code.google.com/p/skoseditor/. 32 n l/flt'O(1<'1Of1dt.101li1 •• i(lf!lllt1.mdQt'lCOtOt). deve ser simples, com as funções atribuídas ao conceito de catalogação nome do evento/conselho, - - ...-:~- ..~., data e outros elementos de registro simples e que descrevem o documento). Eventualmente, informação acima (registro de se o Dspace (plataforma adotada para depósito de objetes de- sobre participação social) assim o permitir, sugere-se que seja feita alguma alteração na interface de entrada de dados de modo a minimizar o esforço necessário para que o usuário final quanto a entrada de documentos. Em outras palavras, o registro de metadados pode até ser mais complexo, mas essa complexidade não deve ser repassada para o usuário final. ."'.- Num segundo momento, após o usuário ter entrado com seus dados básicos, cabe a um grupo estabelecido n£l _SGPR para cuidar desse repositório de informações realizando o devido trato intelectual aos documentos, com enriquecimento dos conteúdos de participação social com descrições relevantes de modo a priorizar o usuário. Esse trabalho envolve o provimento de ligações e inserção do objeto de informação estabelecendo no contexto do linked data, conexões de forma manual para só então publicá-los. Além disso, cabe a essa equipe a atribuição e registro de URls onde for pertinente, assim como cuidar para garantir que haja conversão automática dos dados do Dspace para o repositório de triplas do Participa.br (esse tema está descrito mais adiante no Capítulo 4). Além de priorizar autoridades e assuntos nas descrições bibliográficas é importante garantir que haja registro de informações de georeferenciamento e outras modalidades que possam garantir ligações com os objetos e recursos sejam eles internos ou externos ao repositório de objetos. Além do tratamento coordenação intelectual que deve ser feito pela equipe dessa biblioteca, prevê-se que sejam adotadas estratégias anotações e observações dos próprios usuários, considerando de mediação que facilitem as as tags e outras formas de anotação. No desenho desse método, sugere-se ainda que as anotações partir da interface do Participa.br e que possam informação quanto aos demais elementos Figura 3.1. Essas anotações devem ser associadas que o caracterizam ainda serem descritas e sejam feitas a tanto ao objeto de e que estão expostos na de acordo com a Open Annotation, que foi o modelo de anotação aberta discutido na seção 2.6, e que deve ser vista aqui como uma ontologia que permite compartilhamento e abertura de anotações sobre assuntos variados de participação social. Além do apoio para enriquecimento dos objetos de informação com os metadados, sugere-se que a equipe de tratamento intelectual faça verificações esporádicas as bases de dados disponibilizadas que estão disponibilizadas para ver se no Dspace são compatíveis de fato com as triplas RDF no repositório do Participa.br. 33 '.•. • ' I,.,. , , As participação l/!'l~,ll1tdoYlGt'l\ 1orl(llNrndollD(ON. representações social, são mas abstrações os formatos de diferentes referem-se tipos a como de essas informação sobre informações serão expressas. Nesse caso, as escolhas.de formatos para construção de documentos textuais, páginas web e de outros tipos de conteúdo devem seguir, onde for possível, a abordagem dos modelos de dados semiestruturados RDF que permite a descrição citados por Cruz (2014), como é o caso do padrão de recursos e é completamente adaptável às descrições ontológicas em formatos OWL ou similares. Formatos interessantes abertos, interoperáveis porque conseguem e voltados representar para o modelo semiestruturado os conteúdos variados e os registros precisam ter todos os mesmos atributos. No entanto, como é grande a variabilidade fontes de documentos sobre participação social, é interessante são não de se pensar em aplicações que consigam processar os diferentes nichos ou fontes de dados Uá que a diferença está nos dados e não aplicação), seguindo os princípios da web semântica e dos linked data (dados ligados entre si). O conceito de linked data envolve um conjunto de práticas, com função de publicar e estruturar dados na web, na perspectiva de que pessoas e máquinas (por processos de inferências) possam explorar os conteúdos de informaçã037• Dessa forma, a interoperabilidade ',~ e a consequente integração informação sobre participação social podem ocorrer mais tranquilamente dos conteúdos de do que no contexto dos sistemas que adotam formatos fechados, onde são necessários filtros apropriados para que ocorra uma integração mínima . . ~- 37 Maiores informações disponíveis no endereço: <http://pt.wikipedia.org/wiki/Linked_data>. 34 Ettr:><>d!,or>do~" 'orralf'tmtlOnocOh. 4. Ferramentas para sistematização de metodologias de participação social o método participação '~. participação proposto social aqui para sistematização assume como premissa de metodologias a exposição e conteúdos-"1:1e _ de dados bibliográficos de social e dados de autoridades como dados abertos. Tal iniciativa tem como objetivos a (i) ampliação e enriquecimento da experiência dos usuários de navegação de dados, usando fontes internas e externas, e (ii) tornar as informações e documentos de participação social como dados abertos e reusáveis. Para alcançar esse objetivo, prevê-se a utilização do software Dspace como ferramenta para comportar-os objetos de informação, uma vez que esse ambiente é de uso comum pela comunidade de Biblioteconomia colaboração de dos estabelecimento sugere-se canais participação de um esquema e, ao mesmo tempo, social para inserção admite uma melhor de documentos, de mediação. Com relação ao padrão de metadados, a adoção do Dublin Core, desde que sejam consideradas definidas no DCAM (Dublin Core Abstract Modelou as recomendações modelo abstrato do Dublin Core)38 que prevê ligações e adoção de formatos abertos, como o padrão RDF. Eventualmente, de haver necessidade com de catalogação em formato MARC, sugere-se no caso a adoção do BIBIFRAME, comentado na seção 2.6. o portal Participa. br é um dos pontos de acesso aos conteúdos de informação sobre participação social e deve, por esse motivo, ser conforme à dinâmica dessa comunidade de usuários e dos diversos canais de participação conteúdos de informação presentes ouvidorias, conferências repositório de informações incluindo nos diversos o contexto da SGPR. social, priorizando documentos onde estão A proposição o acesso gerados inseridos metodológica fácil aos por conselhos, dentro e fora do apresentada aqui considera o portal Participa.br integrado ao repositório de documentos definido (Dspace com Dublin Core), com duas possibilidades de integração. Na primeira delas, a opção é alterar o software Dspace para que comporte. uma interface RDF e um acesso a um endpbint RDF. Uma segunda opção, apontada como preferencial nesse produto, é montar um scripl de conversão dinâmica dos dados bibliográficos em formato aberto RDF, preservando os valores originais. Do ponto de vista de arquitetura, o objetoinformacional ser decomposto de participação em duas partes. A primeira parte refere-se ao documento social pode ou suporte que contém as informações de participação social e que devem ser importadas para a biblioteca 38 Ver mais em http://dublincore.org/documents/2007/04/02labstract_model/_ 35 .. - • , .. "- f~1t1'tt10..aDl !OIr(l"'(f'''''''~III>(~ ou repositório digital, num primeiro momento, com metadados básicos, porém compatíveis com as discussões feitas até o momento. A segunda parte do~!:>j~to .L'::l!orma_cionalrefere-se (i) à identificação de informação processos pertinentes do documento definidos e (ii) a sua submissão de organização (ligações objeto-objeto, ligações citadas deveriam triplestore conectado desses objetos de informação da informação, objeto-autoridade já estar disponibilizadas ao Participa.br dos elementos priorizando as ligações e objeto-assunto). em formato para garantir as conexões aos que forem Em princípio, as RDF e inseridas e harvestings num com outras coleções disponíveis na web, como está ilustrado na Figura 4.1. _ _- •................. - /;~~- ---- .. -- - :..: _-- .........•...• '" :, ,, , ,~ ~ ~ : ~ .. : ;: PARTlCIPA.BR : I. ! c:::> . : : l __ . . ) ~ ~ ~ .._..'_ ....__ i l".__ _ _ __.:__ j Repositório DSPACE Figura 4.1 - Sugestão de interligação de documentos e dados ligados Fonte: Adaptado de SWIB (2012) De acordo com essa Figura 4.1, as informações de participação social devem ser exportadas para um triplestore39 e enriquecido com os dados do repositório' via algum script que permita a inserção de registros autoridade. Dessa forma, o triplestore pessoas, organizações, do catálogo da biblioteca e de seus arquivos de pode conter dados sobre livros, música, filmes, temas e gêneros. Esse conjunto de dados consiste em uma versão RDF do catálogo principal da biblioteca, que, por sua vez está em formato Dublin Core. Esse registro deve ser enriquecido com links para imagens de capa e contracapa do livro que podem ser recuperados a partir de datasets externos na LOD (Linked Open Data). Por fim, é importante que o conjunto de dados seja atualizado inclusões, 39 exclusões e alterações Banco de dados voltado para armazenamento no catálogo diariamente da biblioteca sempre que ocorrerem digital. de triplas RDF, como o Virtuoso (www.virtuoso.org), Com o esquema dentre outros. 36 llTTD06"'cIlDO~O,. tO'fo~mdotltT:~ proposto, o trip/estore pode conter uma coleção de resenhas ou anotações produzidas por bibliotecários e pelo público em geral sobre os objetos de informação de participação social, pela adoção de padrões abertos. .. __ .. __ Além de ser incrementado com um trip/estore RDF e um endpoint SPARQL, o Participa.br deve ser visível e, ao mesmo tempo, interagir com os demais nós da nuvem LOD - Linked Open Data. Da mesma forma, as revisões, anotações, trechos e citações podem ser colhidos de outros espaços e ligações diretas entre os objetos de participação social e outros objetos, tais como e-books e demais conteúdos multimídia. Portanto, objetos de informação de participação social podem ser acessados diretamente os através do repositório Dspace já adotado _na SGPR por meio de consultas típicas desse ambiente ou '- através de consultas mais elaboradas através do portal Participa.br. Nesse caso, as consultas podem ser feitas no formato SPARQL e o endpoint pode retornar dados em vários formatos, incluindo RDF/XML, JSON e n3/Turtle. Uma outra alternativa é viabilizar as consultas por meio de uma interface MVC construída com o propósito de facilitar essas pesquisas e evitar que o usuário tenha que conhecer a sintaxe da linguagem SPARQL, por exemplo. Os dados do repositório Dspace são exportados para o trip/estore com uso de uma ferramenta de conversão, denominada aqui de DC2RDF como uma alusão ao processo de conversão de dados no formato Dublin Core para triplas RDF, nos moldes do que ocorr~._ com o MARC2RDF40. Como parte da metodologia, se houver necessidade, os dados podem ser limpos com o Google Refine4', e a interface com os demais sistemas pode ser feita com alguma linguagem apropriada, como é o caso do Ruby42. Além disso, o Participa.br deve disponibilizar pode ser feita com colheita de informações via protocolo OAI-PMH dos dados do repositório e posterior conversão em formato RDF. "'--- Do ponto de .vista prático, é importante compreender que os conteúdos de participação social serão integrados aos 'outros ambientes por estarem em formato aberto e ao mesmo tempo terem URls dereferenciáveis, que ilustra um objeto de informação como o exemplo apresentado na Figura 4.2, (um documento do tipo livro) com um identificador e factível de ser ligado a outros contextos. É importante ressaltar que, nessa Figura 4.2, os nomes dos grafos listados não são apenas endereços web que localizam recursos, mas servem como identificadores (URls). o MARC2RDF é uma ferramenta Ruby para converter triplestore RDF e mantendo-o via haNesting OAI-PMH. 40 metadados bibliográficos MARC para RDF, importando-os para um 41 https:/Icode,google.com/p/google-refine/ 42 https://www.ruby-Iang.org/ptl 37 \... \.- •• 11 II E~""", I~mcto~~ "', Heinrich BOll •..... ~blctnvl'o...... - \ --- í deieh:book~ bibo : DoC"..ur.~:lto rdt:~ype febio:Me~ite~;.e~~o~ del.C:~:book" deiell:book~ bibo:"dil:ion ""li. ;"\1t1." c:ie:l.e:::bo:::ks !eaf:depl.el:io:l <;'l:l:p://eove:e".o;:>e:llibra:ey.e:eq/b/:..d/10023£l6-H.jp9> del.e~ :book~ <hl:~p://purl.0:e9/NEI/book/isb~/S~2300959ifbook> <h1:~p://lexvo.or9/1d/1so639-3/ger> c1eie!l:book.• de: l~mquaqe deJ..c:"",:book~ de~c~:biblío!11ID "10e5273" de:!o:c:llla1: <hÇÇp;//doco.dC1cbmAn.no/CormAl:/BgQk> c1."ieh:books del.c~~:bcok~ <hl:CP:/(doço~dciebmAn.nQ/Qraan1Z0C1gn/dcuc:chcr_COQChCnbUch deieh:OOok .• d~1.'cll:book:s bi!::o::l=.Paqes n~66" tab:l.o;hasSub~icle "Rorr.ann fabie: :l.s!!anif""t"l:io:lOf 'IM» .. .•. - •••...... ft:Oxl020~. n010. deieh:boolr .• -_ ilí!5 ••••• J 1!!fC •. F ••••••••• paUS? 5 ••••• .salao VCr1> ~ we:_ • Figura 4.2 - Objeto bibliográfico representado num repositório de triplas RDF Fonte: Extraído de http://data.deichman.no/resource/tnr_1025052 4.1 Mapeando conteúdos Dspace para RDF -- o modelo de dados do Dspace provê uma infraestrutura metadados podem ser armazenados em esquemas e vocabulários abordagem apresentada metadados a serem aqui considera convertidos a utilização básica na qual os variados. No entanto, a do Dublin Core como para um conjunto de triplas padrão RDF, de acordo com a proposição feita por Konstantinou, Spanos, Houssos e Mitrou (2014), com uso da R2RML que é uma linguagem para expressar mapeamentos customizados de 43, de bancos de dados relacionais para conjuntos de dados RDF. Os autores, embora argumentem Core como uma boa referência para o mapeamento de dados, consideram que o Dublin outros tipos de ontologias para o processo de conversão desejado. Tais ontologias estão apresentadas na Tabela 4.1 a seguir. 43 http://www.w3.org/TR/r2rrnl/ 38 ••...•.. .•... E~Mrdo...dp," iOlfolr:mdonl7("on Tabela 4.1 - Listagem de ontologias usadas no mapeamento Título URl Name Dublin Core para RDF Namespace URl space '--- The Bibliographic OntoJogy bibliontology.com bibo http://purl.org/ontology/bibo/ Creative Commons Rights Ontofogy creativeeommons.org cc http://creativecommons.org;ns# CiTo, the Citation Typing Ontology purl.org/spar cito http://purl.org/spar/eito/ Legacy Dublin Core element set dublincore.org/docum ents/dces/ de http://purl.org/dc/elements/l.1/ OCMI Metadata dublincore .org/docum entsjdcmi-terms/ purl.org/spar/fabio dcterms http://purl.org/de/terms/ fabio http://purl.org/spar /fabio/ b/trbr / corelt Terms FaBiO: FRBR-aligned bibliographic ontology FRBRcore leito purl.org/vocab/frbr re /co frbr http:// purI.org/voca FRBRextended purl.org/vocab/frbr tendedlt /ex frbre http://purl.org/voeab/frbr IFLA's FRBRer Model iflasta nd a rd s. infoi n s/f r /frhr /frbrer / frbrer http://iflastandards.info/ns/fr brer/ International Standard Bibliographic Oescription (lSBO) lexvo.org Ontology MARC Code list for Relators ifla stand ard s. infoi n s/is bdjelements/ isbd http://iflastandards.info/ns/isbd/ele ments/ lexvo.org/ontology id .Ioc.gov/vocabulary elators Ivont http://lexvo.org/ontology# mrel http://id.loc.gov/vocabulary http://purl.org/net/opmv/ns# /r Open Provenance Model Vocabulary purl.org/net/opmv/ns opmv PRISM: Publishing Requirements for Industry Standard Metadata Provenance Vocabulary Core Ontology prismstandard.org prism http://prismstandard /extendedlt jfrbr /tr /relatorsj .org/namespace s/basic/2.0/ purl.org/net/provenan ee/ns prv http://purl. ROA Relationships for Works, Expressions, Manifestations, Items rdvocab.info/ROARelat ionshipsWEMI rdarel http://rdvocab.info/R WEMI Schema.org schema.org schema http://schema.org/ org/net/provenance/ns# DAReJationships Fonte: Konstantinou, Spanos, Houssos e Mitrou (2014) o mapeamento de elementos do Dublin Core para as propriedades das diversas ontologias citadas Tabela 4.1 está apresentado na Tabela 4.2. Nesse mapeamento, os registros com elementos propriedade não qualificados correspondente (KONSTANTINOU homônima do Dublin Core foram substituídos a partir da ontologia do todos por uma Dublin Core et aI, 2014). 39 \_' , '- \ '- '. I 1~'D"dol'iOtll.. IO'(II!rtl'1ldlJtlOCÓl'1.. I '- Tabela 4.2 - Mapeamento de objetos do Dspace (Dublin Core) para antologias web DSpace De elements Ontology properties contributor advisor mrel:", schema:contributor3, dcterms:c9!ltributor, dcterms:creator mrel:ths author mrel:aut editor illustrator other mrel:edt, schema:editor mrel:iII, schema :illustrator mrel:oth spatial temporal schema:contentLocation, dcterms:coverage, dcterms:spatial dcterms:coverage, dcterms:temporal , ...- ._. , coverage creator mrel:cre, mrel:aut, frbrer:P2009, frbr:creator, schema:author, schema:creator, dcterms:creator date rbrer:P3003, frbrer:P3010, dcterms:date available" L '-.-. copyright schema :copyrightYear, dcterms:dateCopyrighted created opmv:wasGen eratedAt,prism :creation Date, schema :dateCreated, dcterms:created issued abio:hasPublicationYear, frbrer:P3055, prism:publicationDate, isbd:PI018, schema:datePublished, dcterms:issued submitted abio:hasDepositDate, dcterms:dateSubmitted updated abio:datelastUpdated, description -- abio:hasEmbargoDate, prism:embargoDate, dcterms:available schema:dateModified bibo:shortDeseription, isbd:PI037-PI046, isbd:PI064-PI068, isbd:PI073, isbd:PI078-P1079, isbd:PI086-1087, isbd:PI090-PllOl, isbd:P1l231124, isbd:Pl1365, rdarel:descriptionOfWork, sChema:description, schema:eomment, dcterms:description abstraet bibo:abstract, rdarel:abstractWork, rdarel:abstract, rdarel: abstra etExpressi on, dcterm s:abstract provenance opmv:wasDerivedFrom, opmv:wasEneodedBy, opmv:wasGeneratedBy, prv:createdBy, prv:serializedBy, dcterms:provenance statementofresp onsibitity rbrer:P3021, isbd:PlO07, isbd:P1010, isbd:P1029, isbd:P1059,. isbd:P1141, isbd:P1142, isbd:P1153 dcterms:ta bleOfContents prism :version Identifier rbrer:P3023, dcterms:format tableofcontents version format extent6 medium bibo:numPages, fabio:hasPageCount, frbrer:P3024, isbd:P1022, isbd:PI053, prism:byteCount, schema:numberOfPages, dcterms:extent rbrer:P3025, isbd:PI003, dcterms:medium mimetype schema:encodingFormat 40 fm;xxJf'fOlld0llld91 1~lol-1:md/)ll~On- bibo:asin, bibo:coden, bibo:doi, bibo:eanucc13, bibo:gtin14, bibo:handte, identifier bibo:identifier, bibo:lccn, bibo:oclcnum, bibo:pmid, bibo:upc, fabio: hasDígitaIArticlel dentifier. fabio :hasArXivld, fab io: hasCODEN, fabio: hasHandle, fa bio:hasNational Libra ryOfMed jci neJourn alld. fabio:hasPII, fabio:hasPubMedCentralld, fabio:hasPubMedld. 7 fabio:hasURL, frbrer:P3028 , frbrer:P3031, isbd:PI032,isbd:P1l54. prism:dor, prism:url, schema:url, dcterms:bibliographicCitation, dcterms:identifier citationl> '- bibo:cites, cito:citesAsAuthority, cito:citesAsDataSource, cito:ci tesAsEvidence, cito :citesAsRecom m ended Reading, cito: cit esAsRelated, cito :cit esAsSourceDocu ment, cito: citesForl nformation, cito: citesAsMetad ata Document, - IIrbre: isRefer entiallyRe lat edToExp ression, rbre: isReferentiallyRe lat edToW ork ---- isbn bibo:isbn, bibo:isbnl0. bibo:isbn13, prísm:isbn, schema:isbn issn bibo:eissn, bibo:issn, fabio:haslssnl, isbd:PI030, prism:elssn, prism:issn sici bibo:sici, fabio:hasSICI uri bibo:uri frbrer:P3011, Ivont:language, schema:inlanguage, language iso Ivont:iso639PlCode, Ivont:iso639PIBCode, dcterms:language Ivont:is0639P2TCode, Ivont:is0639P3Code, Ivont:is0639PSCode, isolS924Alphacode rfc3066 '-- dcterms:RFC3066 publisher mrel:pbl, frbrer:P3056, isbd:PI017, schema:publisher, dcterms:publisher relation IIrbrer:P2043.P21109, rdarel:relatedWork, dcterms:conformsTo isformatof dctérms:isFormatOf ispartof frbrer:P20S8, frbrer:P2080, frbrer:P2086, frhrer:PI092, frbr:part of ifrbre: isPartOfExpressi on, frb re: isPartOflte m, fr bre: isPartOfMa nifestation, f rbre :isPartOfW ork, rdarel :contained InWork, rdarel :containedl nExpression, rdarel :containedl nManifestation, rdarel:containedln, rdarel :contained InItem, dcterms:ísPartOf ispartofseries rdarel:inSeríesWork, rdarel:inSeries haspart IIrbrer:P2057, frbrer:P2079. frbrer:P2085, frbrer:P2091, frbr:part, ~rbre: hasPart Expression, frbre :hasPartltem, frb re :hasPartMa nifestatio n, IIrbre: hasPartWork, rdarel :containsWork, rdarel:contai nsExpression, rdarel :conta insManifestation, rdarel :containsltem, rdarel :contains, rdarel:wholePartRelationship, rdarel:wholePartRelationsh.ipWork, rd arei :whol ePartRel at ion shipExp ression, rdarel: wholeP artRelationsh ipMan ifestation, rd arei :whole Part Relationshipltem, deter ms:hasPart isversionof rbrer:P2062, frbr:revisionOf, frbre:isARevisionOfExpression, rdarel :expandedVersionOfExpression, rdarel:expandedVersionOf, rdarel: revisionOf, rdarel :revisionOfExpression, dcterms:isVersionOf 41 '- •• hasversion EtI'It'Odtr()ndo"""17l. 'ortaJtuooono(on. frbrer:P2061, frbr:revision, prism:hasPreviousVersion, dc:terms:hasVersion '- isbasedon rdarel:basedOnWork, isreferencedby bibo:citedBy, cjto:isCitedBylO, cito:isCitedAsAuthorityBy, , --- rdarel:basedOnExpression. rdarel:basedOn cito: isCitedAsDataSourceBy, cito: isCitedAsEvideneeBy, cito: isCitedAsMetadata DocumentBy, cito: isCitedAsRecommendedReadi ng, cito:isCitedAsRelated By, cito: isCitedAsSou reeDoeumen t By, cit o: isCited Fori nformatio nBy, frbre: isReferentia IlyReIatedTo Expression, frbre: isReferen ti aIlyRelat edTo Work, dcterms: isReferenced By references dcterms:referenees requires dcterms:requires isrequiredby dcterms:isRequiredBy replaees dc:terms:rep/aces isreplacedby dcterms:isReplacedBy rights '- cc:license, prism:copyright, dcterms:aecessRights, determs:license uri cc:legalCode holder schema:copyrightHolder source dcterms:source uri subject Ifrbrer:P3033 fbrber:P2023, frbrer: P2025, frbrer:P2027, frbrer:P2029, frbrer:P2031, rbrer:P2033, frbrer:P2035, frbrer:P2037, frbrer:P2039, frbrer:P2041, frbr:subject, prism:keywordll, schema:about, schema:keywords c1assification L title abio:hasSubjectTerm rbrer:P3001, frbrer:P3008, isbd:P1004, isbd:P1012, isbd:P1026, schema:headline, dcterms:title alternative bibo:shortTitle, isbd:P100S, isbd:P1027, prism:alternateTitle, schema :alternativeH eadline, dcterms:a Iternative type prism:genre, schema:genre, dcterms:type Fonte: Konstantinou, Spanos, Houssos e Mitrou (2014) Para ilustrar o mapeamento de registros do Dublin Core em triplas RDF, pode-se considerar o registro apresentado na Tabela 4.3. 42 •.•...... "-- '-L '- • •• \.- Tabela 4.3 - Exemplo de registro de metadados Dublin Core \.... De Field Value "-- dC.creator Cairns, Francis dc.title Some reflections on the ranking of the major Games in fifth '-- L century S.e. epinician poetry de.date.avaIlable 1989-05-21 •.•...... de.identifier .uri http://hdl.handle.net/10442/359 '-- dc.type Conference Item '-. dC.format.extent 5 pages dc.coverage.spatial Greece dC.language eng L L \.~ "-... '-'- '-'- Fonte: Konstantinou, Spanos, Houssos e Mitrou (2014) Na Figura 4.3, está uma descrição RDF com a notação N3 para o registro da Tabela 4.3, usando os namespaces definidos na Tabela 4.1. <http://purl.org/dc/terms/BibliographicResource/item_9386> a dcterms:BibliographicResource; dc:creator "Cairns, Francis"; dc:title "Some reflections on the ranking of the major in fifth century B.C. epinician poetry"; dcterms:available "1989-05-2111; de:identifier <http://hdl.handle.net/10442/359>; dc:type IIConferenee Item dcterms:extent "5 pages Games ll; ll; de:eoverage <http://purl.org/dc/terms/Loeation/location_9386>; de: language "eng <http://purl.org/dc/terms/Loeation/loeation_9386> a dcterms:Loeationj rdf :value "Greeee". ll• Figura 4.3 - Trecho RDF do registro descrito notação N3 Fonte: Konstantinou, Para alcançar a conversão seguindo a especificação Spanos. Houssos e Mitrou (2014) desejada, o mapeamento necessita ser declarado R2RML, como está apresentado na Figura 4.4 43 ' '.~ ~ • f";"í, , " -,' ~ " '- , <#dc-creator> rr:logicalTable <#dc-creator-view>; rr:subjectMap [ rr:template "http://purl.org/dc/terms/BibliographicResource/item_{item_id}"; ]; rr:predicateObjectMap [ rr:predicate dc:creatori rr:objectMap [ rr:template "http://purl.org/dc/terms/Agent/agent_{text_value}'' ] . <#dc-creator-view> rr:sqlQuery .~.-- '.- ]; 111111 SELECT i.item id AS item_id, mv.text_value AS text value FROM item AS i INNER JOIN metadatavalue AS mv ON i.item id=mv.item id INNER J01N metadatafieldregistry AS mfr ON mfr.metadata -field -id=mv.metadata - field id INNER J01N metadataschemaregistry AS msr ON msr.metadata schema id=mfr.metadata schema id WHERE i.in archive=TRUE AND mV.text value 1S NOT NULL AND msr.namespace='http://dublincore.org/documents/dcmi-terms/' mfr.element='creator' AND nllu Figura 4.4 - Declaração do mapeamento Dublin Core para RDF Fonte: Konstantinou, Spanos, Houssos e Mitrou (2014) Com esse mapeamento, torna-se possível popular a base de dados do Participa.br a partir das entradas do Dspace e expor esses dados como triplas RDF, permitindo a coexistência dos dois ambientes para comportar conteúdos de participação social. ',- 44 I ••.... \...I '~ f~QfW1olrido). 10000el~"""o_,Óf'l.- L 5. Considerações finais Nesse relatório foram apresentadas \- , '- ,,---. sugestões de métodos para organização de conteúdos de participação social a fim de facilitar a recuperação de informação pelo público interessado. Tais sugestões, por sua vez, desencadeiam outras recomendações que estão citadas nesse tópico conclusivo. -''"- Embora a postagem de documentos permaneça como estava previsto na criação do repositório de documentos da SGPR, o tratamento posterior que será dado a cada conteúdo exigirá um esforço para transformar esse documento em unidades de informação interligáveis, pelo envolvimento de técnicos dedicados a essa atividade no âmbito da SGPR. Portanto, recomenda-se '-- documentos, a composição cujas funções de uma equipe para o tratamento são mais simples, como uma mediação intelectual dos e aceitação de documentos, ou mais complexa, como o encaixe dos objetos de informação no contexto das ligações previstas em seções anteriores deste documento. .~. possível relacionar e, portanto, contextualizar informações Com essa iniciativa, torna-se ou demandas dê participação social de modo mais funcional e claro para os usuários dessas informações. Uma vez que os documentos manipulados são extensos e de difícil leitura, sugere-se a construção de algum ferramental computacional de apoio a essa equipe para minimizar o esforço de trabalho manual dessa atividade. Sugere-se, portanto, que em documentos futuros dessa consultoria, seja verificada a viabilidade de uso de técnicas de mineração e extração de dados identificaçãpe aplicáveis a textos para ver em que medida podem auxiliar a ligação dos objetos de informação espalhados nesses documentos. Um outro produto factível para consultorias futuras é a c'oncepção especificação mais detalhada sobre os tipos de documentos de participação facilitar a sua localização e interpretação. Com essa especificação de uma social a fim de em mãos, torna-se possível a construção e oferta, no portal participa.br, de uma ferrame~t~ que automatize a \ .••.... -. , geração de preenchimento formada. informações minimamente de dados, economizando estruturadas (em em informações por exemplo) o esforço da equipe de tratamento Além disso, tal iniciativa viabiliza a construção especializados XML, pelo intelectual de SEOs (engínes de busca) de participação social para atender o público interessado nessa temática com mais qualidade. Com relação à abertura proposta para os conteúdos de participação social, o processo de triplificação de dados bibliográficos pode ser como foi proposto no Capítulo 4, 45 _'''ê~' , Oi r • ~ 'i'" " .' • f~trmt:orritJ.ol JOIt(lWN>d~nocÓh. ou envolver várias fases e ser realizada pela adaptação de ferramentas como a Trip/ify44, cujo objetivo é recuperar informações em ,bancos de dados re/acionais e transformá-los em um arquivo com triplas RDF. Uma segunda etapa desse processo consiste em identificar um endpoint para armazenar as triplas RDF de forma a permitir consultas similar ao que é feito num banco de dados relaciona!. Um endpoint interessante a ser analisado para integração com o software de biblioteca digital é o Fuseki45, que possui um desempenho interessante e permite consultas no formato SPARQL (linguagem de consulta padrão na web de dados ligados). Vale ressaltar que os testes realizados com consultas em endpoints com triplas RDF permitiu realizar consultas federadas que envolvem mais de um endpoint, e foi possível perceber a grande variabilidade de cruzamentos de dados com informações constantes em bases como, por exemplo, Google Maps e DBpedia. Ainda manipulação como sugestão, sugere-se verificar o Jena, de arquivos RDF utilizando a linguagem uma AP! que permite Java e o Solr para pesquisas a de recuperação mais, elaboradas. Brasília/DF, setembro de 2014 Paulo Roberto Miranda MeireJles Consultor do PNUD ',- 44 Ver mais em www.triplify.org. 45 Para esse produto, foi feito teste no Fuseki, versão 0.2.245, que demonstrou bons resultados desempenho e usabilidade. 46 f"'t106':ItJPfl1o.....:&rt 100,1l'W'::rrn:~"orOt$. Referências ARMS, W. Digital Libraries. [S.1.]: MIT Press, 2000. (Digital libraries and electronic publishing). ISBN 9780262261340. ALMEIDA, D. (2014) Pluralização da representação política e legitimidade democrática: li_ ções das instituições participativas no Brasil. Opinião Pública, Campinas, v. 20, n. 1, p. 96117. ANTONIOU, G.; VAN HARMELEN, chusetts (EUA): The MIT Press. F. (2004) A Semantic Web Primer. Cambridge, Massa- COYLE, K. (2010) Yes, We Can! Libraries and the Semantic Web in Bibliotheken, Germany. Koln, FEITOSA, A. (2006) Organização da informação na web: das tags à web semântica. Brasília, Ed. Thesaurus. KONSTANTINOU, N., SPANOS, O., HOUSSOS, N. E MITROU, N. (2014) Exposing SchoJarly Information as Linked Open Data: RDFizing DSpace contents, In The Electronic Library. Draft disponível em http://www.researchgate.net/profile/Nikolaos_Konstantinou KONSTANTINOU. N., HOUSSOS, N. E MANTA, A. (2013) Exposing Bibliographic Information as Linked Open Data using Standards-based Mappings: Methodology and Results. 3a. International Conference on Integrated. Information (IC-ININFO), Elsevier. http://www.researchgate.net/profile/Nikolaos _Konstantinou. LE COADIC, Y.(1996) ras Gomes. Brasília. A Ciência da Informação. Tradução de Maria Yêda F. S. de Filguei- LIMA, P. (2014) Representação política e sociedade civil: um estudo sobre a representação política em Conselhos Nacionais. Dissertação de mestrado em Ciência Política a Universidade de Brasília. ' 9 MARC (2012) Bibliographic framework as a web of data: linked data model and:supporting services. LoC - Library of Congress, Washington, DC, November, 21. Disponível em http://www.loc.gov/bibfrarne/pdf/marcld-report-11 :"21-2012.pdf MILLER, S. J. (2011) Metadata Schuman. for Digital Collections: a how-to-do-it manual. Ed. Neal- SALGADO, O. e SILVA, J. (2013) AACR2 X ROA: breves reflexões acerca dos registros de . autoridade, XXV Congresso Brasileiro de Biblioteconomia, Documentação e Ciência da Informação - Florianópolis, SC. SARACEVIC T. (1996) Ciência da informação: origem, evolução e relações. em Ciência da Informação, Belo Horizonte, v.1, n.1 p.41-62, jan/jun. Perspectivas SOLAGNA, F. (2014) Relatório técnico do PNUD - Produto 1 do Termo de Referêncía no. 139044: Análise de experiências nacionais e internacionais de participação mediada por Internet. Março, 2014. 47