BLOCO
Blog dos Coordenadores ou Blog Comunitário
da
ComUnidade WirelessBrasil

Julho 2008               Índice Geral do BLOCO

O conteúdo do BLOCO tem forte vinculação com os debates nos Grupos de Discussão  Celld-group e WirelessBR. Participe!



01/07/09

• "Web Semântica" (01) - O que é

----- Original Message -----
From: Helio Rosa
To:
Celld-group@yahoogrupos.com.br ; wirelessbr@yahoogrupos.com.br
Sent: Tuesday, July 01, 2008 9:42 PM
Subject: "Web Semântica" (01) - O que é

Olá, ComUnidade WirelessBRASIL!
 
Este é o Serviço ComUnitário sobre "Web Semântica".

01.
Voltamos ao assunto reciclando uma mensagem de janeiro de 2007 (!) com conceitos atuais.
 
(...)  Para começar, nada melhor do que iniciar definindo o que é semântica. Semântica é uma palavra de origem grega (semantiké) que traduzida seria "a arte da significação".
É o estudo do significado das palavras e de sua relação de significação nos signos lingüísticos.
Signo é todo objeto ou símbolo que tem um significado por si mesmo, como a cruz que representa o cristianismo, a cor vermelha como um sinal de pare, uma palavra qualquer como "cadeira" que nos remete a um objeto no mundo real.
Tudo isto é signo e as "tags" são os signos que serão objetos dos nossos estudos direcionados a web.
Para nós desenvolvedores, o tema semântica é o estudo desses signos chamados de tags, sua relação uns com os outros e sua aplicabilidade. (...)  [Fonte: Revolução, Etc - [20/08/05]  
Introdução a Semântica Web - Por: Henrique Costa Pereira] 
 
02.
O "gatilho" que disparou a lembrança do tema é esta "notícia de 100 milhões de dólares":  :-)
 
Fonte: CIO
[30/06/08]  
A corrida pelas buscas semânticas
Pode ter nascido um concorrente a altura do Google, e a Microsoft já estuda sua aquisição por 100 milhões de dólares Chame, se realmente precisar, de Busca 2.0, mas o desespero em quebrar o código que torna as buscas semânticas uma realidade está próximo do fim.
Um reportagem de sexta no excelente site VentureBeat sugere que a Microsoft está interessada na aquisição da Powerset, uma empresa recém criada do Vale do Silício.
A Powerset disse no ano passado que havia desenvolvido uma tecnologia que permite aos usuários fazerem buscas na língua nativa, um desafio que caso fosse superado, poderia criar o novo Google, de acordo com especialistas.
Mas a coisa mais notável aqui é preço: a Microsoft deve pagar cerca de cem milhões de dólares pela Powerset, de acordo com a reportagem. Esse é um valor respeitável para uma empresa recém criada, sem revendas e uma dúzia de funcionários, mas caso a empresa tenha realmente conseguido a façanha divulgada, a transação será uma das maiores barganhas do século.
Desde que o Google se tornou um gigante, há uma corrida para desbancar sua capacidade de buscas. Seria uma boa notícia se um concorrente emergisse. E obviamente, se a Microsoft fosse comprar essa concorrente, recursos não seria um problema.
E, para todos nós, nossas buscas poderiam se tornar muito mais inteligentes.
 
03.
Aqui temos uma interessante coleção de artigos com conceitos e até "códigos", para alegria dos programadores!.  :-)
As matérias estão transcritas mais abaixo mas a recomendação é conhecida: prefiram ler na fonte!
 
Fonte: Outro Lado
[03/04/08]  
As premissas da Web Semântica
 
Fonte: Google Discovery
[13/03/08]  
Yahoo vai aderir à Web Semântica por Felipe Hummel
 
Fonte: IDG Now!
[12/12/07]  
Web semântica e interface tátil estão entre tecnologias pioneiras para 2008
 
Fonte: Adnews  
[02/01/07]   Especialistas já discutem a próxima geração da Internet  (transcrito do Terra)
 
Fonte: A Rede
[15/05/06]  
O que é a web semântica? por Thiago Vaz
 
Fonte: Web Page de Fernando Silva Parreiras
[15/09/04]   Web semântica: a solução para o caos da internet por Fernando Parreiras

Fonte: ComCiência - Revista Eletrônica de Jornalismo Científico
[10/04/02]  
Qual o sentido da Web? 

Comentários?
Mais informações?
 
Boa leitura!
Um abraço cordial
Helio Rosa
Thienne Johnson
 
------------------------------------------------

Fonte: Outro Lado
[03/04/08]   As premissas da Web Semântica

A anarquia foi ótima, mas é hora de organizarmos o caos por Alexandre Cabreira

O conhecimento deve ser disseminado, sob pena do mundo globalizado entrar em colapso.
Mas como gerenciar isto de forma sustentável, levando a informação às pessoas e promovendo o desenvolvimento?
A resposta, eu insisto: com a adoção da Web Semântica, que possibilita:
- organização lógica dos dados contidos nas home pages;
- qualificar os metadados, tornando-os utilizáveis e úteis;
- identificação das informações relevantes, chegando mais rapidamente a elas, através do cruzamento das ontologias
- diversos níveis de sistemas e tecnologias de informação.

O maior problema da internet é o crescimento anárquico e desordenado. Isto foi muito bom no começo, pois ajudou a expandir a Rede Mãe, mas chegou a hora da ordem no caos.
A Web Semântica é uma solução para a estruturação dos dados da internet, usando meta-tags, viabilizando o processo de informação por parte das máquinas e visando novas possibilidades para a gestão do conhecimento. Ela pode ser considerada como a composição de um grande número de componentes ontológicos inter-relacionados.

É fundamental que os dados dos sites sejam expressivos o suficiente para que os computadores sejam capazes de processar e entender o real significado, sabendo diferenciar Holanda (país) de Holanda (Chico Buarque), por exemplo.

Na linguagem uma palavra pode ter diversos significados, o que pode causar confusão. A solução é usar técnicas que possibilitem o software vasculhar e separar o joio do trigo, cruzando as meta-informações e adentrando da chamada Web invisível, que caso, não saibam, o Google indexa apenas 3% de tudo que existe virtualmente.

Três premissas devem ser cumpridas à risca, para a fundamentação da Web Semântica:
- Um conjunto de padrões de metadados específicos de forma a acomodar os diferentes tipos de recursos: a adoção do padrão Dublin Core, com 15 itens, já universalizados e sugeridos pelo W3C, consórcio mundial que gere o desenvolvimento da Web Semântica, comandado por Tim Berners-Lee, que inventou nada menos que WWW. Ele é um dos “ pais “ da internet.
- A prevalência da língua inglesa como base da internet.
- A adoção da linguagem XML, mais elaborada e compreensível pelas máquinas.

Os chamados agentes são os elementos que vasculham a internet. A tecnologia de agentes permite a interação entre máquina e humanos, favorecendo o alcance dos objetivos, possibilitando a implementação de um sistema que faz com que o computador seja parte ativa no processo.

Os agentes devem ter: autonomia, velocidade de reação e continuidade temporal (estar sendo sempre atualizado).

----------------------------------

Fonte: Google Discovery
[13/03/08]  
Yahoo vai aderir à Web Semântica por Felipe Hummel

O Yahoo anunciou hoje novos detalhes de sua plataforma para desenvolvedores chamada Open Search. Além de mostrar como essa plataforma vai se integrar com o futuro suporte que a empresa terá aos vários padrões da Web Semântica como RDF e microformats.

Um site pode determinar semanticamente seu conteúdo, através dos microformats. Especificando o que é um endereço, dizendo que um telefone é de determinada pessoa, entre outros detalhes. O que o Yahoo pretende, é fazer com que sua máquina de busca entenda esses dados semi-estruturados de forma automática e insira nos resultados da busca. Para demonstrar isto, o blog do Yahoo Search dá o exemplo de uma rede social como o LinkedIn:

LinkedIn
Neste caso, a resposta para a consulta do usuário é um perfil da rede social, só que desta vez com muito mais informação agregada, graças aos microformats.

Em conjunto com o suporte aos padrões semânticos, o Yahoo irá abrir sua plataforma Open Search para os desenvolvedores. Com esta ferramenta é possível desenvolver “mods” para os resultados da busca usando os dados semânticos no índice da máquina de busca ou em qualquer API pública.

O que isso tudo realmente significa para nós?
Se um site de comércio eletrônico, por exemplo, resolver implementar microformats nas páginas de seus produtos, o Yahoo irá poder extrair o preço, nome do produto, características, entre outros detalhes diretamente da página e guardar essas informações. Além disso, com a plataforma Open Search será possível criar algo parecido com o visto acima sobre o perfil no LinkdIn. Ao procurar por “Televisões de LCD”, por exemplo, o Yahoo pode mostrar informações sobre o produto junto com o link para a página do produto.

As utilidades dessas tecnologias são inúmeras, mas há algumas questões a serem observadas. Os formatos da Web Semântica ainda são novos e não estão bem consolidados, além disso quem quiser implementar estes formatos precisa fazer muita coisa “na mão”, ou seja, ainda não há ferramentas que facilitem este processo. Além da iniciativa do Yahoo, existem poucas utilidades para estes formatos semânticos. Logo, colocar microformats em um site pode ser uma tarefa árdua para poucos resultados práticos.

O Yahoo quer mudar esse cenário e de quebra criar um ambiente onde desenvolvedores possam criar resultados de busca mais dinâmicos e informativos para seus sites, melhorando a experiência do usuário.

Séra esse o começo do caminho para uma Web mais Semântica?

---------------

Fonte: IDG Now!
[12/12/07]  
Web semântica e interface tátil estão entre tecnologias pioneiras para 2008

São Paulo - Technology Pioneers 2008, do Fórum Econômico Mundial, destaca ainda acesso à web sem fio e operadoras de publicidade móvel.

Empresas que desenvolvem soluções para publicidade online, interfaces táteis adaptáveis a diferentes ambientes, acesso em banda larga sem fio e até comparações de preços providas pela comunidade estão no Technology Pioneers 2008, seleção de companhias de tecnologias que, segundo o Fórum Econômico Mundial, terão impacto em nossas vidas nos próximos anos.

Os telefones celulares são representados tanto pela AdMob, maior plataforma de anúncios móveis, e pela MedioSystems que, mesmo sem o alcande da AdMob, oferece soluções para gerenciamento de campanhas de publicidade nos celulares.

Aparelhos móveis também foram lembrados pela indicação da Lumio, responsável por sistemas que, acoplados a superfícies aleatórias, as transformam em interfaces táteis para o controle e gerenciamento de gadgets, notebooks e desktops ou outros tipos de aplicação.

O acesso à internet sem fio também foi lembrado pelo Fórum Econômico Mundial com a indicação das empresas Clearwire Corporation, responsável pela infra-estrutura de banda larga de operadoras nos EUA, Irlanda e Dinamarca, a Transclick, mais voltada para acessos por redes telefônicas para smartphones, Roundbox, que oferece acesso à web ao integrar em software diversos sinais de redes disponíveis, e a Meraki, que monta e opera redes do tipo mesh.

Entre as tecnologias online, o ranking destaca a britânica Garlik pelo desenvolvimento de aplicativos semânticos para buscas online usados por empresas para o melhor gerenciamento de dados, a sueca Polar Rose que, por meio de sua tecnologia de reconhecimento facial em 3D aplicada à internet, pode dar maior relevância às imagens online, e a Fundação Wikimedia, criada por Jimmy Walles e responsável por gerenciar a enciclopédia online Wikipedia.

A listagem do órgão ainda traz empresas responsáveis por tecnologias para aceleração do acesso online, como a israelense SpeedBit, de melhor aproveitamento de memória RAM, como a Innovative Silicon, e por pesquisas de integração de chips em redes para processamento espalhado, como a franco-americana Arteris.

Segundo o Fórum Econômico Mundial, "cada inovação (listada no ranking) é outro passo na tentativa da sociedade de adaptar e utilizar tecnologias que mudarão e melhorarão nosso mundo". Como recompensa, cada uma das 17 empresas escolhidas em tecnologia serão convidadas a participar do próximo encontro do Fórum Econômico Mundial, que acontecerá entre os dias 23 e 27 de janeiro em Davos, na Suiça.

----------------------
 
Fonte: Adnews  
[02/01/07]   Especialistas já discutem a próxima geração da Internet  (transcrito do Terra)
 
Enquanto no Vale do Silício ainda se degusta o mel do fenômeno conhecido como Web 2.0 ou "web social", muitos já se preparam para a decolagem, a partir de 2007, da geração seguinte: a Web 3.0 ou "web semântica", como diz o criador da World Wide Web, Tim Berners-Lee. Não há dúvida de que 2006 foi o ano da Web 2.0, ou "web social", o que é atestado pelo sucesso de sites como YouTube, Orkut, LinkedIn e FaceBook. Também foi o ano em que a tecnologia social, como os blogs e os wikis, se estendeu como rastilho de pólvora. Mas a idéia de que a próxima geração da Internet está logo ali dobrando a esquina toma mais e mais força, principalmente depois que o influente jornal New York Times dedicou ao assunto um amplo espaço em sua capa.
 
O objetivo da "Web semântica", o termo favorito do criador da World Wide Web Tim Berners-Lee, é acrescentar significado a rede, de maneira que, em lugar de um mero catálogo, ela se converta em um guia "inteligente", com sites capazes de trocar informação sobre seus conteúdos. Berners-Lee fala de uma rede de aplicações e informação conectadas entre si, algo como uma base de dados global.
Este sistema poderia atuar como conselheiro pessoal em áreas tão diversas como o turismo - oferecendo pacotes na medida certa, em vez de uma torrente de páginas de agências de viagens e destinos - ou planejamento financeiro, com recomendações concretas dependendo da idade ou do estado civil do usuário.
 
Seguindo o exemplo proposto no New York Times, esta nova geração da Internet será capaz de dar respostas, como se fosse um agente de viagens, a uma busca tão complexa como "estou procurando um lugar de clima ameno, disponho de US$ 3 mil e tenho um filho de 11 anos". Um sistema como esse, claro, se tornaria instantaneamente mais valioso, comercialmente, do que os meios de busca de hoje, que apresentam resultados de milhares de documentos e normalmente são incapazes de responder a perguntas tão concretas.
 
Como escreve Nicholas Carr em seu blog, a Web 3.0 "tornará obsoletos os buscadores de hoje". Dito de outra maneira, e seguindo com o exemplo da viagem de férias, enquanto as recomendações de viagem de hoje forçam o internauta a navegar entre longas listas de comentários ou observações, o sistema da Web 3.0 se encarregaria de estabelecer valorações, classificá-las e, por dedução, oferecer o hotel adequado para aquele usuário em particular.
Mas quando chegará esta Web "sabe tudo"? Esta é a pergunta que vale um milhão. O blog OnlineSpin destaca que faltam, entre outras coisas, um software de reconhecimento de imagens para vídeo, junto com reconhecimento de voz aplicado ao vídeo. George Jones, do Information Week, acredita que somente é possível predizer um coisa: a julgar pelo desenvolvimento impressionante da Internet nos últimos 15 anos, é impossível prever que forma terá daqui a outros 15 anos.
Fonte: Terra
 
-------------------------------------

Fonte: A Rede
[15/05/06]   O que é a web semântica? por Thiago Vaz

Semântica é uma palavra que vem do grego semantiké, e pode ser traduzida por “arte da significação”. A web semântica será uma web inteligente? Sergio Amadeu da Silveira

Você conhece Ferdinand de Saussure? Foi um dos grandes mestres da Universidade de Genebra e considerado o fundador da Linguística moderna. No início do século XX, deu o Curso de Linguística Geral que abriu caminho para uma ciência autônoma que tivesse a língua como objeto específico. Você conhece Tim Berners-Lee? É um inglês que trabalhava no Laboratório de Física de partículas, também em Genebra, quando criou a web, no final do século XX. Em maio de 1990, Berners-Lee liberou na rede mundial de computadores os principais elementos para a constituição da world wide web, ou seja, seus principais protocolos e padrões, tais como o HTTP (HyperText Transfer Protocol), mas também da URL (Uniform Resource Locator), e da linguagem HTML (Hypertext Markup Language), que permitiram o modo gráfico na internet. Logo depois, o mesmo laboratório de Genebra (conhecido como CERN) liberou a primeira versão de um software para interpretar os ícones e desenhos que foram escritos em HTML. Assim sugiu o primeiro browser (navegador), o Mosaic.

A web foi a grande responsável pela popularização da internet. A linguagem HTML, aberta e não-proprietária, foi assimilada rapidamente e permitiu a construção de milhares de sites, que logo se tornaram milhões. Sem dúvida, a web nasceu no mundo das tecnologias abertas e pode ser considerada uma revolução dentro da revolução informacional. Tim Berners-Lee continuou seu esforço colaborativo e, atualmente, dirige o consórcio W3C (World Wide Web Consortium) que garante o desenvolvimento aberto e interoperável de tecnologias desenhadas para a web. Berners-Lee concentra-se, agora, em viabilizar a web semântica.

A Linguística criada por Saussure, atualmente, é uma ciência que possibilita analisar as linguagens sob quatro pontos de partida: a fonologia estuda suas unidades sonoras; a sintaxe nos dá a possibilidade de observar a estrutura das frases; a morfologia nos leva a avaliar as formas das palavras, e a semântica nos coloca diante do estudo dos significados. E o que isso tem a ver com a web? Com a internet? Muito.

Para Saussure, a língua é um “sistema de signos” e o signo é uma associação entre o significante (a imagem sonora ou visual do signo) e o significado (o conceito do signo). Essa relação não é estática, ou seja, os significados mudam diante de seus significantes. A semântica, de acordo com o “Dicionário Aurélio”, pode ser entendida como semasiologia, que “estuda as relações entre sinais e símbolos e aquilo que eles representam”. Pode também ser definida como “o estudo do sentido das palavras”. Agora, pare e pense em uma busca pela web. Imagine que seu amigo chama-se Aurélio (nome próprio). Você está procurando o blog dele, e o mecanismo de busca não sabe que você está atrás do Aurélio “nome próprio”, em vez do Aurélio “dicionário”. A linguagem em que os sites foram escritos não permite que as máquinas entendam o significado dos dados que estão na rede.  semântica precisa usar uma outra linguagem que separe o conteúdo da forma em que é exposto. A linguagem básica para isto é o XML (eXtensible Markup Language), que nos permite inserir categorias semânticas nos dados que irão para a web. Poderemos, por exemplo, definir que um determinado conjunto de dados é um preço, e outro é o nome de um livro, e assim por diante. Para explicar isso melhor, segue um trecho de um excelente tutorial sobre XML (www.gta.ufrj.br/grad/00_1/miguel/), escrito por Miguel Furtado Junior ( Centro de Tecnologia em Engenharia Eletrônica da UFRJ).

Forma e conteúdo
“A mais importante característica do XML se resume em separar a interface com o usuário (apresentação) dos dados estruturados. O HTML especifica como o documento deve ser apresentado na tela por um navegador. Já o XML define o conteúdo do documento. Por exemplo, em HTML são utilizadas tags [marcadores] para definir tamanho e cor de fonte, assim como formatação de parágrafo. No XML, você utiliza as tags para descrever os dados, como exemplo, tags de assunto, título, autor, conteúdo, referências, datas, etc. (...) O XML conta, ainda, com recursos tais como folhas de estilo definidas com Extensible Style Language (XSL) e Cascading Style Sheets(CSS) para a apresentação de dados em um navegador. O XML separa os dados da apresentação e processo, o que permite visualizar e processar o dado como se queira, utilizando diferentes folhas de estilo e aplicações. (...) Essa separação dos dados da apresentação permite a integração dos dados de diversas fontes. (...) Dessa forma, os dados em XML podem ser distribuídos através da rede para os clientes que desejarem.”

Para Tim Berners-Lee*, a web semântica irá permitir mais do que a simples melhoria da indexação de informações na rede mundial de computadores. Ele acredita que a completa interoperabilidade dos dados, libertos de formatos e plataformas, permitirá o surgimento de aplicações que melhorem a educação, os serviços de saúde e as atividades das pessoas no ciberespaço. Certamente, haverá uma disputa pelo seu uso. As grandes corporações terão maior facilidade para cruzar dados dos seus alvos ou consumidores. Por outro lado, teremos maiores possibilidades de compartilhamento do conhecimento humano. Nossa história mal começou.

www.w3.org/Designlssues/Semantic  - O Mapa da Web Semântica, em inglês.
www.comciencia.br/reportagens/internet/net08.htm  - Excelente artigo sobre a web semântica, publicado na Revista Eletrônica Conciência, intitulado "Qual o sentido da WEB?"
www.sciam.com/2001/0501issue/0501berners-lee.html 

--------------------

Fonte: Web Page de Fernando Silva Parreiras
[15/09/04] Web semântica: a solução para o caos da internet por Fernando Parreiras

Uma nova web surge com o objetivo de facilitar a comunicação estrutura entre máquinas e aumentar a relevância da informação recuperada pelo usuário: a web semântica.

1. Introdução
Milhares de novas páginas são publicadas diariamente na internet, o que torna cada vez mais difícil para o usuário recuperar a informação relevante para o seu negócio. Diante deste caos, uma enorme quantidade de negócios ou oportunidades pode ser desperdiçada pelo simples motivo da falta de informação na hora certa. A web semântica permite criar um contexto onde a informação possa ter significado para as máquinas, que se encarregarão de levar a informação relevante ao seu usuário.

2. Web semântica

A web semântica é uma extensão da web atual, onde a informação possui um significado dado bem definido, permitindo computadores e pessoas a trabalharem em cooperação. Ela fornece uma arquitetura que permite que dados sejam compartilhados e reusados entre as os programas, empresas e comunidade. É um esforço em conjunto, liderado pelo W3C com a participação de um grande número de pesquisadores e parceiros comerciais.
A web atual é um conjunto de recursos e links. Os recursos são identificados pelos seus URIs (Uniform Resource Identifiers). A URL (Uniform Resource Location) faz parte de um subconjunto da URI. Para o usuário, não existe nenhum problema quanto a esta questão, pois este é capaz de ler a descrição do link, identificando o sentido semântico embutido naquele contexto. Para a máquina, entretanto, muito pouca informação “machine-readable” está disponível, uma vez que não é possível fazer uma análise quando ao juízo transmitido por um link. O significado dos links só é evidente no contexto em torno da âncora. Por exemplo, dois sites de cinema podem fazer referência à um mesmo filme. Entretanto, um site lista o filme entre os dez melhores e o outro site lista-o entre os dez piores. O sentido é totalmente diferente para o homem, mas não para a máquina, que só percebe uma simples ligação.
Na futura web, ou na web semântica, o conjunto de recursos e links também são identificados por URI's, mas podem ser "tipados". Consiste em atribuir um tipo à relação entre dois recursos. Forma-se o conceito chamado de triplas (Um recurso, uma propriedade e um valor). Neste contexto, uma relação entre dois recursos possui uma propriedade que permite atribuir significado à ligação. No exemplo dos sites de filme, pode-se atribuir a propriedade "está entre os dez melhores" ao link no primeiro site e a propriedade "está entre os dez piores" ao link no segundo site. A diferença entre os modelos é que agora o conhecimento está formalizado de uma maneira estruturada. As linguagens que permitem a criação do conhecimento estruturado são RDF e XML.

3. RDF e HTML: Viabilizando a web semântica

RDF é o acrônimo de Resource Description Framework e oferece uma linguagem que permite a descrição de recursos de maneira estrutura. Seu objetivo principal é representar metadados sobre recursos web como título, autor, data de modificação de uma página, etc. Estes metadados que permitem a evolução da busca semântica na web. Já existem iniciativas como o googlism, que tenta responder a perguntas como "o que é", "quem é", "onde" e "quando".
O exemplo abaixo mostra um arquivo RDF que descreve quem é o criador do recurso www.fernando.parreiras.nom.br:

<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.oclc.org/DC#"> <rdf:Description about=" http://www.fernando.parreiras.nom.br"/> <dc:Creator>Fernando Parreiras</dc:Creator> </rdf:Description> </rdf:RDF> Abaixo segue um exemplo de descrição da página inicial deste site, utilizando o padrão de descrição de metadados Dublin Core. Estão descritas informações sobre o autor, direitos autorais e data de criação da página:

<html xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:con="http://www.w3.org/2000/10/swap/pim/contact#">
<head>
<title>Site pessoal de Fernando Parreiras</title>
<meta property="dc:creator">
<meta property="con:fullName">Fernando Parreiras</meta>
</meta>
<meta property="dc:rights">© 2004 </meta>
<meta property="dc:subject">vida do autor,
currículo, publicações</meta>
<meta property="dc:date">2004-11-06T08:49:37+00:00</meta>
</head>
...

Para atribuir semântica ao conteúdo, recorre-se a outros padrões, como o pim do W3C. Somente com o surgimento e a adoção de padrões pelos desenvolvedores é que será possível a criação de um consenso, e através deste a criação real de um sentido semântico. No exemplo abaixo, este endereço só terá um valor semântico para os que utilizam o padrão PIM:
<html
xmlns:con="http://www.w3.org/2000/10/swap/pim/contact#">
<head>
<meta property="con:address">
<meta property="con:street">4 Pear Treet Court</meta>
<meta property="con:city">London</meta>
<meta property="con:country">United Kingdom</meta>
</meta>
</head>
...

4. Conclusão
Antes da internet, o homem viveu o grande desafio de recuperar o conhecimento perdido em livros, documentos ou peças de museu esquecidas ou depositadas em lugares inalcançáveis. Contudo, a internet mudou este cenário tornando a informação e o conhecimento disponíveis a um clique. Entretanto, tal fato gerou a sobrecarga de informações que dificulta distinguir entre a informação relevante e o lixo. Enfrenta-se, novamente, o problema de encontrar a informação certa, na hora certa.
Os usuários, inevitavelmente, recorrerão aos mecanismos de busca, que avançam em iniciativas como a web semântica, buscando tornarem-se verdadeiros oráculos do meio digital. Mas para estabelecer a relação semântica entre as diversas fontes de informação, é necessário um esforço descentralizado, que pode demorar anos para se concretizar. Mas como toda novidade gera oportunidade, beneficiar-se-ão aqueles que alcançarem uma posição onde possam ser facilmente localizados por meio das relações semânticas criadas.
A web semântica depende, enormemente, da criação de padrões de nomenclatura para a descrição de recursos na web. Caso contrário, o problema persistirá com criadores de conteúdo atribuindo descritores diferentes para o mesmo significado.

-----------------------------------------

Fonte: ComCiência - Revista Eletrônica de Jornalismo Científico
[10/04/02]  
Qual o sentido da Web?

Imagine que você esteja buscando informações sobre metrópoles norte-americanas na Internet. Entre com a palavra "metropolis" (em inglês) num programa de busca e virão respostas tão variadas quanto a revista Metropolis, a gravadora de discos Metropolis, o fórum Metropolis sobre pesquisa e políticas de migração e cidades, a página de um fã do Metropolis, de Fritz Lang e outras. Isto porque os programas não distinguem o filme da revista ou do centro de pesquisas. É claro que você pode (aliás, deve) combinar "metropolis" com outras palavras-chave, acrescentando ou excluindo termos que permitam refinar a busca, preferencialmente indicando também outros parâmetros, como data, língua ou domínio, que muitos programas aceitam na função de "busca avançada". Ainda assim, o resultado é muitas vezes desolador. São dezenas (às vezes centenas) de páginas que não interessam, tornando difícil separar o joio do trigo.

Com o crescimento exponencial da Web tornou-se difícil indexar as informações. A linguagem HTML, que popularizou a Web e é utilizada pela maioria dos sites, não possui recursos que permitam atribuir significado à informação. "As tags HTML são muito limitadas nesse sentido. Elas apenas descrevem como a página deve ser exibida e não oferecem nenhuma descrição dos dados", explica Rubens Queiroz, do Centro de Computação da Unicamp.

Para melhorar a indexação, são necessárias categorias mais apuradas que permitam triar com eficiência, no oceano de dados disponíveis, aquilo que interessa ao usuário num contexto preciso. Na verdade, categorias já existem. Para o usuário que visita as páginas da revista Metropolis, da ONG Metropolis e a do fã do filme Metropolis a diferença é evidente. O problema é que ela só é entendida por nós, humanos, mas não fazem sentido para os programas de computador, que ainda estão muito distantes de imitar o funcionamento da mente humana. Os programas de computador (ainda) não conseguem resolver as ambigüidades e outros problemas complexos que o ser humano consegue, embora esta seja a aspiração da Inteligência Artificial: fazer com que a máquina reproduza os mecanismos da inteligência humana. Mas disto ainda estamos longe...

A Web Semântica é uma tentativa inversa de solução. Ao invés de pensar na informação para os humanos, a idéia é pensar na máquina. "Machine-understandable Information", esta é a definição da Web Semântica, segundo o "pai da Web", Tim Berners-Lee, um dos comandantes desse projeto. É curioso, claro, pois o objetivo final é atender às pessoas e não aos computadores, mas para isso é preciso construir categorias e uma linguagem que façam sentido para a máquina.

O projeto da Web Semântica, embora pareça uma novidade, não nasceu há tão pouco tempo. Capitaneado pelo consórcio W3C, ele é um sucessor do projeto Metadados, cujos princípios são os mesmos (incluir "informação sobre a informação" na Web), mas que trabalhava com linguagem (HTML), que não permite criar categorias semânticas.

Um componente central da Web Semântica é a linguagem XML, que permite descrever semanticamente os dados e, a partir de categorias que o próprio usuário pode definir. "Um elemento XML pode ter dados declarados como sendo preço de venda, título de livro, quantidade de chuva ou qualquer outro. Uma vez que o dado é encontrado, ele pode ser distribuído pela rede e apresentado em um browser, de várias formas possíveis, ou então pode ser transferido para outras aplicações para processamento futuro e visualização", explica Miguel Furtado Júnior, estudante do Centro de Tecnologia em Engenharia Eletrônica da UFRJ, autor de um tutorial simples e bem estruturado sobre XML.

"O interesse do XML é que ele é extremamente flexível, embora a criação de muitas categorias diferentes também não seja interessante, pois se as empresas querem trocar dados é preciso que partilhem um código comum", ressalta Queiroz, que é mediador da lista de discussão Dicas-L, sobre esse e outros assuntos relacionados a softwares e Internet. Ele cita o exemplo da Unicamp e CNPq, que estabeleceram um protocolo comum (criado por uma equipe da Universidade Federal de Santa Catarina) para poder trocar dados relativos aos currículos de seus pesquisadores. Em breve, um pesquisador que atualize seus dados na plataforma Sipex da Unicamp terá automaticamente os dados convertidos para a plataforma Lattes do CNPq.

Para criar aplicações XML são necessários quatro passos:

Esse processo ainda é relativamente complexo e se torna mais difícil quando um projeto envolve muitos participantes, que têm de se colocar de acordo sobre que categorias utilizar, como os dados devem ser relacionados, como os usuários irão interagir com eles. Todos precisam estar de acordo, caso contrário não há como montar o "banco de dados". Este é, aliás, um dos maiores desafios do futuro da Web. Para o comércio eletrônico, o mais provável é que as empresas cheguem a um acordo, pois têm muito interesse nessa tecnologia, que potencialmente pode incrementar muito seus negócios. Nos demais casos, é difícil imaginar qual será a saída.

Outros componentes da Web Semântica são:

Aplicações

As metas do projeto da Web Semântica são mais ambiciosas do que simplesmente permitir indexar melhor a informação da Web. Interessam as aplicações que se tornam possíveis com a utilização de categorias semânticas para descrever os dados. Quem leu o texto de Berners-Lee, James Hendler e Ora Lassila, na revista Scientific American de maio/2001, se lembrará que o início descreve o caso de Pete, um filho que busca na Internet, através de seu agente (um software robô), alternativas para a fisioterapia de sua mãe. Dispondo previamente de uma série de dados de Pete (seu endereço, seus horários, o seguro-saúde de sua mãe, etc), o agente busca na Web as informações relevantes (lista de médicos credenciados, suas agendas, etc) e em alguns minutos oferece uma lista de opções para que ele escolha a que mais lhe convém. Não satisfeito com a primeira lista, Pete pede que o agente refaça a busca de acordo com as restrições por ele estabelecidas. Desta vez, a solução oferecida é satisfatória e com algumas ações simples. Pete muda parte de seus compromissos, obtém a aceitação do agente de Lucy (sua irmã, com quem irá dividir as idas à fisioterapia da mãe) e acerta a agenda.

Todo esse cenário, é claro, ainda está relativamente distante. Além disso, as aplicações mais prováveis das ferramentas acima descritas serão o comércio eletrônico e grandes bancos de dados, como os próprios autores ressaltam. Mas, pondera Rubens Queiroz, isto não faz da Web Semântica uma má idéia. "Hoje o interesse maior é de empresas, por exemplo uma grande editora, para permitir a troca de dados. Mas sites não comerciais também se beneficiarão da utilização do XML e do desenvolvimento da Web Semântica, pois seus conteúdos serão indexados mais eficientemente pelos programas de busca e poderão ser mais facilmente convertidos em novos formatos ou ganharem novo visual", conclui.

Para quem quiser ver exemplos de sites que desenvolvem os conceitos da Web Semântica, com utilização de XML, RDF e outros, são interessantes o Projeto Dublin Core Metadata Initiative, o IMS Global Learning Consortium, que estabelece vocabulários para facilitar o aprendizado distribuído on line e, em português o Projeto RSSficado.

Para saber mais:

Semantic Web Road Map
Texto de Tim Berners-Lee que, como diz o título, é um mapa da Web Semântica, aspectos gerais de sua arquitetura e objetivos. Interessante para quem busca um texto de introdução ao projeto. Claro e consistente. Nível intermediário.

The Semantic Web
Artigo de Tim Berners-Lee, James Hendler e Ora Lassila na revista Scientific American de maio de 2001. Nível intermediário.

Tutorial XML
Em português, elaborado por Miguel Furtado Júnior, estudante da UFRJ.

Metadata Based Annotation Infrastructure offers Flexibility and Extensibility for Collaborative Applications and Beyond
Paper científico sobre ABSTRACT, apresentado por dois pesquisadores do W3C (Marja-Riitta Koivunen and Ralph R. Swick) no KCAP workshop on Knowledge markup and semantic annotation. Atual e interessante. Nível avançado.

RDF Model Theory
Última versão da teoria semântica da linguagem RDF (Resource Description Framework). Atualizado em fevereiro de 2002. Nível avançado. Exige conhecimentos de lógica, semântica e informática.

MIT Artificial Intelligence Laboratory
Importante laboratório de pesquisa sobre Inteligência Artificial. Site traz resumos das pesquisas e outros materiais interessantes.

Evolução das linguagens
SGML
(Standard Generalized Markup Language)

Definida em 1986
Possibilidade de criação de qualquer conjunto de tags
Padrão comum: DTD (Document Type Definition)
Difícil adoção na Web
Complexidade
Inexistência de estilos amplamente difundidos

HTML
(Hypertext Markup Language)

Derivada do SGML
Própria para Web
Extremamente simples
Fácil criação de links hypertexto
Conjunto limitado de tags
Difícil reutilização da informação
Busca por documentos gera muitos resultados irrelevantes

XML
(Extensible Markup Language)

SGML para Web
Especificação mais simples
Formato texto
Descrição de dados estruturados
Número ilimitado de tags
Otimiza entrega de informações
Dados são independentes dos aplicativos ou fornecedores de software

Fonte: XML, Rubens Queiroz, Unicamp

[Procure "posts" antigos e novos sobre este tema no Índice Geral do BLOCO]


ComUnidade WirelessBrasil                     Índice Geral do BLOCO