5.1. Ferramentas para publicação de dados
Transcrição
5.1. Ferramentas para publicação de dados
Publicação de Dados Governamentais no Padrão Linked Data 5.1 – Ferra m enta s pa ra public a ç ã o de da do s Karin Breitman José Viterbo Edgard Marx Percy Salas 1 LA C L a bo ra to ry fo r A dva nc e d C o lla bo ra tio n T riplify 2 R equerim ento s S o ftw a re • L ic enç a – GNU Lesser General Public License. • R equis ito s • W eb S erver – Apache (recomendado) – IIS • P H P (ready) , Ruby/Python (dev) • B a nc o de D a do s – M yS Q L, S Q Lite, O racle, D B2, M S S Q L P ostgreS QL 3 T riplify • O bjetivo “E xpor a semântica disponível em R D B M S de uma forma simples”. • O que é Um “plugin” para aplicações Web P HP , R uby/P ython (dev). • O que fa z D is ponibiliza os dados de B D ’s relacionais em triplas. • O que g era Arquivos R D F, JS O N e Linked D ata 4 T riplify : C o nfig ura ç ã o • Consultas SQL selecionando a informação, que gostariam que seja disponível publicamente (Open Data) S E LE C T id, name AS ‘foaf:name’ FR O M users 5 T riplify : E s trutura S Q L Q uery • Primeira coluna dever conter identificadores para serem utilizados para gerar URI’s das Instâncias Select id, name AS ‘foaf:name’ FROM users • 6 Nome das colunas utilizados para gerar as propriedades renomeando as colunas da tabela Select id, name AS ‘foaf:name’ FROM users T riplify : E s trutura S Q L Q uery • Cons ultas dev em retornar v alores literais ou referencias para outras ins tancias 7 T riplify : E x em plo LOC A DOR A $triplify['objectProperties']=array ('customer'=> "select customer_id as id, concat(concat(first_name,' '),last_name) as 'foaf:name’, first_name as 'foaf:firstName’, last_name as 'foaf:surname’, store_id as 'customerOf’, SHA(email) as 'foaf:mbox_sha1sum’, address_id as 'liveAt’, create_date as 'dcterms:created’ from customer”, … ) 8 $triplify['objectProperties']=array ( 'sioc:address'=>'address’, 'customerOf'=>'store’, 'liveAt'=>'address’ … ); $triplify['classMap']=array( 'customer'=>'foaf:Person’, 'store'=>'gr:LocationOfSales’, 'address'=>'vcard:Address' ); T riplify : I nteg ra ç ã o em A pps . W eb • Acrescentar o diretório do Triplify a raiz da aplicação. • Definir consultas SQL e ajustar o arquivo de configuração. • Possibilitar o acesso direto ao banco de dados relacional através: – – – 9 Objeto PDO. Driver de conexão Mysql. Utilizar um outro framework para abstração de base de dados (ODBC). D 2R Q e D 2R S erver 10 R equerim ento s S o ftw a re • Licença – GNU General Public License • Requerimentos • J a va 1.4 ou pos terio r • B a nc o de D a dos – M yS QL, O racle, M S S Q L P ostgreS Q L e O D BC (não automática). 11 D 2R Q e D 2R S erver : I ntro duç ã o • Objetivo “Permitir que aplicações consigam ter uma RDF-view em um banco de dados non-RDF”. • O que é Plataforma desenvolvida em Java para publicação de dados de BD em grafo RDF (on-the-fly) • O que gera RDF/XML (default), RDF/XML-ABBREV, N3, N-TRIPLE. • Quais BD’s Suporta Oracle, MySQL, PostgresSQL, Microsoft SQL Server, fontes de dados ODBC (sem geração automática). 12 D 2R Q e D 2R S erver : I ntro duç ã o • O que P erm ite – Mapeamento do BD para grafo virtual RDF – Consultas: linguagem SPARQL – RDF dumps – Acessar a informação do BD como Linked Data sobre a Web. 13 D 2R Q • D 2R Q M a pping L a ng ua g e Linguagem declarativa que descreve o mapeamento. • D 2R S erver servidor HTTP que fornece uma visão Linked Data e permite consultas SPARQL. – Tool que usa o D2RQ mapping para mapear o conteúdo do BD • D 2R Q E ng ine plug-in para Jena e Sesame Semantic Web toolkits. 14 A rquitetura da pla ta fo rm a D 2R Q 15 D 2R Q : T ipo s de M a pea m ento [1] • A uto m á tic o Cria um arquiv o de m apeam ento default analis ando o es quem a do B D . • Tabela = Classes; • Colunas = Propriedades; generate-mapping [-u username] [-p password] [-d driverclass] [-o outfile.n3] [-b base uri] jdbcURL generate-mapping -o m a pping .n3 -d driver.class.name -u db-user -p db-password jdbc:url:... 16 E x em plo D 2R Q : T ipo s de M a pea m ento [2] • C us to m iza do M odificar o arquiv o g erado pelo ”g erenate-m apping ” Utilizar v ocabulários conhecidos – foaf, sioc, dc, goodrelations, etc. 17 D 2R Q : M a pea m ento C us to m iza do M odificando o arquiv o m a pping .n3 2. D efinir c o nex ã o a o B D map:M yD atabase a d2rq:D atabase; d2rq:jdbcD S N "jdbc:mysql://localhost/mydb"; d2rq:jdbcD river "com.mysql.jdbc.D river"; d2rq:username "us er"; d2rq:password "pas sword". 3. D efinir a s entida des map:P eople a d2rq:C lassM ap; d2rq:uriP attern “http://.../people/@ @ User.ID @ @ ”. d2rq:condition “User.deleted=0”. 18 D 2R Q : M a pea m ento C us to m iza do 1. Adicionar propriedades para as entidades map:P eople a d2rq:C lassM ap; d2rq:uriP attern “http://.../people/@ @ User.ID @ @ ”; d2rq:condition “User.deleted=0”; d2rq:class foaf:P erson . S (C lassM ap) map:P eople a d2rq:C lassM ap . map:name a d2rq:P ropertyB ridge; d2rq:belongsToC lassM ap map:P eople; d2rq:property foaf:nick; d2rq:column “User.name”. 19 P O (D ata Properties ) D 2R Q : M a pea m ento C us to m iza do 1. Adicionar propriedades para as entidades map:P eople a d2rq:C lassM ap; d2rq:uriP attern “http://.../people/@ @ User.ID @ @ ”; d2rq:condition “User.deleted=0”; d2rq:class foaf:P erson . S (C lassM ap) map:mbox_sha1 a d2rq:P ropertyB ridge; d2rq:belongsToC lassM ap map:P eople; d2rq:property foaf:mbox_sha1sum; d2rq:sqlE xpression “S HA1(C O NC AT(‘mailto:’, User.email))”. 20 P O (D ata Properties ) D 2R Q : M a pea m ento C us to m iza do 1. Link as entidades map:P hotos a d2rq:C lassM ap; d2rq:uriP attern “http://.../photo/@ @ P hoto.ID @ @ ”; d2rq:class foaf:Image . map:photo a d2rq:P ropertyB ridge; d2rq:belongsToC lassM ap map:P eople; d2rq:property foaf:made; d2rq:uriP attern “http://.../photo/@ @ P hoto.UserID @ @ ”. (P hoto.UserID is a foreign key to User.ID ) 21 map:photo a d2rq:P ropertyB ridge; d2rq:belongsToC lassM ap map:P eople; d2rq:property foaf:made; d2rq:join “Us er.ID = P hoto.UserID ”; d2rq:refersToC lassM ap map:P hotos . (Object Properties) D 2R S erver : S ta rt the s erver • Uma vez que temos o arquivo de mapeamento m a pping .n3 executamos o seguinte comando d2r-server mapping.n3 • Agora podemos navegar sobre o grafo RDF, atraves do servidor D2R- Server 22 http://localhost:2020/ 23 O penL ink V irtuo s o R D F V iew s General Public License e Proprietario 24 V irtuo s o R D F V iew s : I ntro duç ã o • O bjetivo “C onverter dinamicamente dados relacionais em R D F e expô-lo no Virtuoso-hosted S P AR Q L endpoint.”. • O que é Virtuoso R D F Views mapea dados relacionais em R D F e permite que a representação do R D F possa ser personalizada. • O que g era R D F/XM L. (Q uad S torage) • Q ua is B D ’s S upo rta O racle, M S S erver, D B2, Informix, P rogress, M yS Q L, Ingres, Firebird, P ostgreS Q L e O D B C ou JD B C accesiveis R D BM S . 25 V irtuo s o R D F V iew s : M a pea m ento [1] • Definição de cada tabela em classes RDFS IRI @prefix peo: <http://localhost:8890/rdfv_demo/schemas/peoplet#> . peo:People a rdfs:Class ; C lassM ap rdfs:label ”People" ; rdfs:comment "An OpenLink People" . P roperties fo a f:na m e 26 a rdf:Property ; fo a f:m a de a rdf:Property ; rdfs:domain peo:People ; rdfs:domain peo:People ; rdfs:range xsd:string; rdfs:range ; photo:Photo rdfs:label ”people name" . rdfs:label ”photo id" . D ata P roperties O bject P roperties V irtuo s o R D F V iew s : M a pea m ento [2] • Construir Subject IRI’s para cada classe utilizando as chaves primarias de cada peo:us er_iri a tabela rdf:Property ; rdfs:domain peo:People ; rdfs:range xsd:string; rdfs:label ”people id" . sparql prefix peo: <http://localhost:8890/rdfv_demo/schemas/people#> create iri class peo :us er_iri "http://localhost:8890/rdfv_demo/testdata/people#%s" (in user_id varchar not null) . 27 V irtuo s o R D F V iew s : M a pea m ento [3] • Construir Predicados IRI’s para cada classe utilizando o resto de colunas sparql de cada tabela prefix qs: <http://localhost:8890/rdfv_demo/quad_storage/> prefix peo: <http://localhost:8890/rdfv_demo/schemas/people#> prefix pho: <http://localhost:8890/rdfv_demo/schemas/photos#> 28 c rea te qua d s tora g e qs:default from OPLWEB.DBA.PEOPLE as people_tbl from OPLWEB.DBA.PHOTOS as photos_tbl { create qs:people as graph <http://localhost:8890/rdfv_demo/testdata/people#> { peo:user_iri(peo ple_tbl.U S E R _I D ) a peo:People as qs:people_People ; foaf:name people_tbl.N A M E as qs:people_peopleName ; }. T riplify D 2R S erver V irtuo s o R D F V iew s PH P Jav a M iddleware S olution - S im S im L ing ua g em de M a pea m ento SQL R D F bas ed R D F bas ed G era ç ã o de m a pea m ento M anual S em iautom ático M anual M edia – Alta (N ão S PAR Q L) M edia Alta T ec no lo g ia S PAR QL E ndpo int E s c a la bilida de Link: http://esw.w3.org/Rdb2RdfXG/StateOfTheArt 29 P rinc ipa is R eferênc ia s • D2RQ, site http://www4.wiwiss.fu-berlin.de/bizer/d2r-server/#develo , Consultado 20/05/10 • W3C Group, site http://esw.w3.org/Rdb2RdfXG/StateOfTheArt, Consultado 21/05/10 • Triplify, site http://triplify.org/Documentation, Consultado 21/05/10 • Mapping Relational Data to RDF with Virtuoso's RDF Views, site http://virtuoso.openlinksw.com/Whitepapers/html/rdf_vie , Consultado 19/05/10 30