Arquivos

SPARQL – Parte I – Como Instalar o Virtuoso (Banco de Dados de Triplas)

Sempre que procuro alguma documentação sobre o Virtuoso, banco de triplas para Web Semântica 99,9% dos artigos que encontro são em inglês, então vou começar uma série de artigos sobre SPARQL e Bando de Dados de Triplas, espero que consiga ajudar alguém.

Vamos a um breve resumo por Daniel Kirstenpfad, sobre banco de triplas:

Ao contrário de outros bancos de dados que armazenam seus dados em linhas, colunas ou pares de chave-valor, um banco de dados de grafos armazena toda informação em uma rede de nós e arestas. As arestas representam o relacionamento entre os nós que representa os objetos. Devido aos nós e arestas serem representados como objetos (os quais os desenvolvedores estão acostumados) é possível definir atributos (também chamado de propriedades) a eles. Adicionando uma direção para uma aresta cria o conhecido grafo de propriedades que representa a explícita estrutura de dados dentro de um banco de dados de grafo. -Daniel Kirstenpfad

Banco de Triplas e a Web Semântica

Um dos grandes pilares da Web Semântica é a organização de dados baseada em ontologias, principalmente RDF, RDFS e OWL. Onde armazenar essas definições, que claramente são baseadas em 3 pilares (sujeito, predicado e objeto)?! E a Linked Open Data é baseada na construção de grafos e sua ligação.

Por que usar o Virtuoso?

É performático. Teste de Performace na DBPedia

Trabalha muito bem com inferências e transitividade, esse acredito que é a grande vantagem do uso de grafos, poder navegar entre eles se aprofundar nas relações e inferir resultados;

OpenSource, com uma grande comunidade de usuários. Mail Lists;

QuadStore, ai vem a pergunta ele é Triple ou Quad Store?  O virtuoso é Quad além de armazenar a tripla básica (sujeito, predicado e objeto) ele ainda grava o grafo relacionado,  com isso o virtuoso consegue trabalhar com múltiplos grafos ao mesmo tempo.

Como instalar o Virtuoso no Ubuntu Linux (Original) :

Faça o download pelo SourceForge: http://sourceforge.net/projects/virtuoso/

Verifique se há os pacotes, caso não haja instalei:

Package Version From
autoconf 2.57 http://www.gnu.org/software/autoconf/
automake 1.7 http://www.gnu.org/software/automake/
libtool 1.5.16 http://www.gnu.org/software/libtool/
flex 2.5.33 (was 2.5.4) http://www.gnu.org/software/non-gnu/flex/
bison 2.3 (was 1.35) http://www.gnu.org/software/bison/
gperf 2.7.2 http://www.gnu.org/software/gperf/
gawk 3.1.1 http://www.gnu.org/software/gawk/
m4 1.4.1 http://www.gnu.org/software/m4/
make 3.79.1 http://www.gnu.org/software/make/
OpenSSL 0.9.7i http://www.openssl.org/

Descompacte o Virtuoso.

Rode os comandos no terminal, na pasta onde descompactou:

./configure
make
make install

Como iniciar o serviço do Virtuoso pelo terminal (start virtuoso):

Entre no diretório: cd var/lib/virtuoso/db
Rode o comando: virtuoso-t -f &

Caso seja concluído com sucesso:
http://localhost:8890/

Qualquer dúvida entrem em contato.

Interligar dados em vez de documentos.Tim Berners-Lee

No próximo artigo, irei falar sobre configurações básicas e consultas.
Obrigado e Feliz Ano Novo.

Abraços, Renan Oliveira

Afinal, o que é Web Semântica ?

Pessoal,

Esse é o meu primeiro post,  acho justo me apresentar sou Renan Oliveira, Analista de Sistemas/Developer no time de Busca & Semântica da globo.com, mais informações sobre mim vocês podem ver no sobre. Vou focar o blog na área de tecnologia e principalmente no que mais estudo, ferramentas de Busca e Web Semântica na sua amplitude (ontologia, sparql…).

Vamos ao que interessa. Para responder a pergunta do Post, vou seguir um caminho das pedras.

Qual a proposta da Web Semântica?

É estender os princípios da web dos documentos para os dados. Os dados podem ser acessados usando a arquitetura Web (URI, por ex.), e estar relacionados uns com os outros da mesma forma que os documentos já são. Isso também significa criar uma plataforma comum que permita o compartilhamento e a reutilização dos dados por meio das fronteiras das aplicações, empresas e comunidades, podendo ser processados automaticamente tanto por ferramentas quanto manualmente, também revelando novos relacionamentos possíveis entre porções de dados. Fonte: http://www.w3.org/2001/sw/SW-FAQ#swgoals

Segundo Berners-Lee et alii (2001), a web semântica será uma extensão porém apresentará estrutura que possibilitará a compreensão e o gerenciamento dos conteúdos armazenados na web independente da forma em que estes se apresentem, seja texto, som, imagem e gráficos à partir da valoração semântica desses conteúdos, e através de agentes que serão programas coletores de conteúdo advindos de fontes diversas capazes de processar as informações e permutar resultados com outros programas da web atual.

Isso é, o dados começa a um significado real e não apenas uma abstração compreendida pelo computador.

Se eu quiser fazer uma busca

“Roberto Carlos no maracanã acerta a trave”

na web ela irá ler os dados da frase de forma separada, sem ter um significado associado a ele,  ele não conseguirá saber se foi o cantor Roberto Carlos, se foi em jogo de futebol ou em show no estádio do maracanã, como podemos resolver isso.

Anotando na hora da criação de um conteúdo que ele se Referencia ao jogador Roberto Carlos, ao Estádio do Maracanã e que acertar a trave foi durante um jogo de futebol.

Quem utiliza?

Isso parece ser muito bom, mas que verdadeiramente usa isso, é tão novo que ninguém usa?

Para citar dois, gigantes, veículos de comunicação que utilizam:

BBC - Talvez seja quem use com maior capacidade na área de conteúdo, no link da bbc você encontra todos os posts sobre o desenvolvimento da WS na bbc, para resumir eles utilizam a Linked Open Data, que  será um tópico no futuro do blog, para construir páginas de entretenimento (musica e programas) aproveitando os dados como descrição, discografia, etc.  imagine o quanto de trabalho foi economizado e quanto esse dado ganhou relevância após o uso já que essa informação foi pega de uma fonte segura.

New York Times – Eles publicaram mais de 10.000 publicações na Linked Open Data, disponibilizando um histórico de matérias anotadas semanticamente para futuras consultas, ainda disponibilizaram uma API e agregaram conhecimento a DBPEDIA, que também será um tópico no futuro.

O tópico é extenso propus apenas começar a conversa, com o passar do tempo irei mostrado novidades da área, tecnologias que utilizamos, ontologias, consultas SPARQL, Virtuoso OpenLink e há muito à descobrir.

Links interessantes:

http://semanticweb.org/wiki/Main_Page

http://www.w3.org/2001/sw/SW-FAQ

http://www.semanticweb.com/

Abraços, Renan Oliveira.

Seguir

Get every new post delivered to your Inbox.

%d bloggers like this: