BLOCO - BLOg dos COordenadores ou BLOg COmunitário da ComUnidade WirelessBRASIL

O conteúdo do BLOCO tem forte vinculação com os debates nos Grupos de Discussão Celld-group e WirelessBR. Participe!

(...) Para começar, nada melhor do que iniciar definindo o que é semântica. Semântica é uma palavra de origem grega (semantiké) que traduzida seria "a arte da significação".
É o estudo do significado das palavras e de sua relação de significação nos signos lingüísticos.
Signo é todo objeto ou símbolo que tem um significado por si mesmo, como a cruz que representa o cristianismo, a cor vermelha como um sinal de pare, uma palavra qualquer como "cadeira" que nos remete a um objeto no mundo real.
Tudo isto é signo e as "tags" são os signos que serão objetos dos nossos estudos direcionados a web.
Para nós desenvolvedores, o tema semântica é o estudo desses signos chamados de tags, sua relação uns com os outros e sua aplicabilidade. (...) [Fonte: Revolução, Etc - [20/08/05] Introdução a Semântica Web - Por: Henrique Costa Pereira]

02.

O "gatilho" que disparou a lembrança do tema é esta "notícia de 100 milhões de dólares": :-)

Fonte: CIO
[30/06/08] A corrida pelas buscas semânticas
Pode ter nascido um concorrente a altura do Google, e a Microsoft já estuda sua aquisição por 100 milhões de dólares Chame, se realmente precisar, de Busca 2.0, mas o desespero em quebrar o código que torna as buscas semânticas uma realidade está próximo do fim.
Um reportagem de sexta no excelente site VentureBeat sugere que a Microsoft está interessada na aquisição da Powerset, uma empresa recém criada do Vale do Silício.
A Powerset disse no ano passado que havia desenvolvido uma tecnologia que permite aos usuários fazerem buscas na língua nativa, um desafio que caso fosse superado, poderia criar o novo Google, de acordo com especialistas.
Mas a coisa mais notável aqui é preço: a Microsoft deve pagar cerca de cem milhões de dólares pela Powerset, de acordo com a reportagem. Esse é um valor respeitável para uma empresa recém criada, sem revendas e uma dúzia de funcionários, mas caso a empresa tenha realmente conseguido a façanha divulgada, a transação será uma das maiores barganhas do século.
Desde que o Google se tornou um gigante, há uma corrida para desbancar sua capacidade de buscas. Seria uma boa notícia se um concorrente emergisse. E obviamente, se a Microsoft fosse comprar essa concorrente, recursos não seria um problema.
E, para todos nós, nossas buscas poderiam se tornar muito mais inteligentes.

O conhecimento deve ser disseminado, sob pena do mundo globalizado entrar em colapso.
Mas como gerenciar isto de forma sustentável, levando a informação às pessoas e promovendo o desenvolvimento?
A resposta, eu insisto: com a adoção da Web Semântica, que possibilita:
- organização lógica dos dados contidos nas home pages;
- qualificar os metadados, tornando-os utilizáveis e úteis;
- identificação das informações relevantes, chegando mais rapidamente a elas, através do cruzamento das ontologias
- diversos níveis de sistemas e tecnologias de informação.

O maior problema da internet é o crescimento anárquico e desordenado. Isto foi muito bom no começo, pois ajudou a expandir a Rede Mãe, mas chegou a hora da ordem no caos.
A Web Semântica é uma solução para a estruturação dos dados da internet, usando meta-tags, viabilizando o processo de informação por parte das máquinas e visando novas possibilidades para a gestão do conhecimento. Ela pode ser considerada como a composição de um grande número de componentes ontológicos inter-relacionados.

É fundamental que os dados dos sites sejam expressivos o suficiente para que os computadores sejam capazes de processar e entender o real significado, sabendo diferenciar Holanda (país) de Holanda (Chico Buarque), por exemplo.

Na linguagem uma palavra pode ter diversos significados, o que pode causar confusão. A solução é usar técnicas que possibilitem o software vasculhar e separar o joio do trigo, cruzando as meta-informações e adentrando da chamada Web invisível, que caso, não saibam, o Google indexa apenas 3% de tudo que existe virtualmente.

Três premissas devem ser cumpridas à risca, para a fundamentação da Web Semântica:
- Um conjunto de padrões de metadados específicos de forma a acomodar os diferentes tipos de recursos: a adoção do padrão Dublin Core, com 15 itens, já universalizados e sugeridos pelo W3C, consórcio mundial que gere o desenvolvimento da Web Semântica, comandado por Tim Berners-Lee, que inventou nada menos que WWW. Ele é um dos “ pais “ da internet.
- A prevalência da língua inglesa como base da internet.
- A adoção da linguagem XML, mais elaborada e compreensível pelas máquinas.

Os chamados agentes são os elementos que vasculham a internet. A tecnologia de agentes permite a interação entre máquina e humanos, favorecendo o alcance dos objetivos, possibilitando a implementação de um sistema que faz com que o computador seja parte ativa no processo.

Os agentes devem ter: autonomia, velocidade de reação e continuidade temporal (estar sendo sempre atualizado).

O Yahoo anunciou hoje novos detalhes de sua plataforma para desenvolvedores chamada Open Search. Além de mostrar como essa plataforma vai se integrar com o futuro suporte que a empresa terá aos vários padrões da Web Semântica como RDF e microformats.

Um site pode determinar semanticamente seu conteúdo, através dos microformats. Especificando o que é um endereço, dizendo que um telefone é de determinada pessoa, entre outros detalhes. O que o Yahoo pretende, é fazer com que sua máquina de busca entenda esses dados semi-estruturados de forma automática e insira nos resultados da busca. Para demonstrar isto, o blog do Yahoo Search dá o exemplo de uma rede social como o LinkedIn:

LinkedIn
Neste caso, a resposta para a consulta do usuário é um perfil da rede social, só que desta vez com muito mais informação agregada, graças aos microformats.

Em conjunto com o suporte aos padrões semânticos, o Yahoo irá abrir sua plataforma Open Search para os desenvolvedores. Com esta ferramenta é possível desenvolver “mods” para os resultados da busca usando os dados semânticos no índice da máquina de busca ou em qualquer API pública.

O que isso tudo realmente significa para nós?
Se um site de comércio eletrônico, por exemplo, resolver implementar microformats nas páginas de seus produtos, o Yahoo irá poder extrair o preço, nome do produto, características, entre outros detalhes diretamente da página e guardar essas informações. Além disso, com a plataforma Open Search será possível criar algo parecido com o visto acima sobre o perfil no LinkdIn. Ao procurar por “Televisões de LCD”, por exemplo, o Yahoo pode mostrar informações sobre o produto junto com o link para a página do produto.

As utilidades dessas tecnologias são inúmeras, mas há algumas questões a serem observadas. Os formatos da Web Semântica ainda são novos e não estão bem consolidados, além disso quem quiser implementar estes formatos precisa fazer muita coisa “na mão”, ou seja, ainda não há ferramentas que facilitem este processo. Além da iniciativa do Yahoo, existem poucas utilidades para estes formatos semânticos. Logo, colocar microformats em um site pode ser uma tarefa árdua para poucos resultados práticos.

O Yahoo quer mudar esse cenário e de quebra criar um ambiente onde desenvolvedores possam criar resultados de busca mais dinâmicos e informativos para seus sites, melhorando a experiência do usuário.

São Paulo - Technology Pioneers 2008, do Fórum Econômico Mundial, destaca ainda acesso à web sem fio e operadoras de publicidade móvel.

Empresas que desenvolvem soluções para publicidade online, interfaces táteis adaptáveis a diferentes ambientes, acesso em banda larga sem fio e até comparações de preços providas pela comunidade estão no Technology Pioneers 2008, seleção de companhias de tecnologias que, segundo o Fórum Econômico Mundial, terão impacto em nossas vidas nos próximos anos.

Os telefones celulares são representados tanto pela AdMob, maior plataforma de anúncios móveis, e pela MedioSystems que, mesmo sem o alcande da AdMob, oferece soluções para gerenciamento de campanhas de publicidade nos celulares.

Aparelhos móveis também foram lembrados pela indicação da Lumio, responsável por sistemas que, acoplados a superfícies aleatórias, as transformam em interfaces táteis para o controle e gerenciamento de gadgets, notebooks e desktops ou outros tipos de aplicação.

O acesso à internet sem fio também foi lembrado pelo Fórum Econômico Mundial com a indicação das empresas Clearwire Corporation, responsável pela infra-estrutura de banda larga de operadoras nos EUA, Irlanda e Dinamarca, a Transclick, mais voltada para acessos por redes telefônicas para smartphones, Roundbox, que oferece acesso à web ao integrar em software diversos sinais de redes disponíveis, e a Meraki, que monta e opera redes do tipo mesh.

Entre as tecnologias online, o ranking destaca a britânica Garlik pelo desenvolvimento de aplicativos semânticos para buscas online usados por empresas para o melhor gerenciamento de dados, a sueca Polar Rose que, por meio de sua tecnologia de reconhecimento facial em 3D aplicada à internet, pode dar maior relevância às imagens online, e a Fundação Wikimedia, criada por Jimmy Walles e responsável por gerenciar a enciclopédia online Wikipedia.

A listagem do órgão ainda traz empresas responsáveis por tecnologias para aceleração do acesso online, como a israelense SpeedBit, de melhor aproveitamento de memória RAM, como a Innovative Silicon, e por pesquisas de integração de chips em redes para processamento espalhado, como a franco-americana Arteris.

Segundo o Fórum Econômico Mundial, "cada inovação (listada no ranking) é outro passo na tentativa da sociedade de adaptar e utilizar tecnologias que mudarão e melhorarão nosso mundo". Como recompensa, cada uma das 17 empresas escolhidas em tecnologia serão convidadas a participar do próximo encontro do Fórum Econômico Mundial, que acontecerá entre os dias 23 e 27 de janeiro em Davos, na Suiça.

Semântica é uma palavra que vem do grego semantiké, e pode ser traduzida por “arte da significação”. A web semântica será uma web inteligente? Sergio Amadeu da Silveira

A web foi a grande responsável pela popularização da internet. A linguagem HTML, aberta e não-proprietária, foi assimilada rapidamente e permitiu a construção de milhares de sites, que logo se tornaram milhões. Sem dúvida, a web nasceu no mundo das tecnologias abertas e pode ser considerada uma revolução dentro da revolução informacional. Tim Berners-Lee continuou seu esforço colaborativo e, atualmente, dirige o consórcio W3C (World Wide Web Consortium) que garante o desenvolvimento aberto e interoperável de tecnologias desenhadas para a web. Berners-Lee concentra-se, agora, em viabilizar a web semântica.

A Linguística criada por Saussure, atualmente, é uma ciência que possibilita analisar as linguagens sob quatro pontos de partida: a fonologia estuda suas unidades sonoras; a sintaxe nos dá a possibilidade de observar a estrutura das frases; a morfologia nos leva a avaliar as formas das palavras, e a semântica nos coloca diante do estudo dos significados. E o que isso tem a ver com a web? Com a internet? Muito.

Para Saussure, a língua é um “sistema de signos” e o signo é uma associação entre o significante (a imagem sonora ou visual do signo) e o significado (o conceito do signo). Essa relação não é estática, ou seja, os significados mudam diante de seus significantes. A semântica, de acordo com o “Dicionário Aurélio”, pode ser entendida como semasiologia, que “estuda as relações entre sinais e símbolos e aquilo que eles representam”. Pode também ser definida como “o estudo do sentido das palavras”. Agora, pare e pense em uma busca pela web. Imagine que seu amigo chama-se Aurélio (nome próprio). Você está procurando o blog dele, e o mecanismo de busca não sabe que você está atrás do Aurélio “nome próprio”, em vez do Aurélio “dicionário”. A linguagem em que os sites foram escritos não permite que as máquinas entendam o significado dos dados que estão na rede. semântica precisa usar uma outra linguagem que separe o conteúdo da forma em que é exposto. A linguagem básica para isto é o XML (eXtensible Markup Language), que nos permite inserir categorias semânticas nos dados que irão para a web. Poderemos, por exemplo, definir que um determinado conjunto de dados é um preço, e outro é o nome de um livro, e assim por diante. Para explicar isso melhor, segue um trecho de um excelente tutorial sobre XML (www.gta.ufrj.br/grad/00_1/miguel/), escrito por Miguel Furtado Junior ( Centro de Tecnologia em Engenharia Eletrônica da UFRJ).

Forma e conteúdo
“A mais importante característica do XML se resume em separar a interface com o usuário (apresentação) dos dados estruturados. O HTML especifica como o documento deve ser apresentado na tela por um navegador. Já o XML define o conteúdo do documento. Por exemplo, em HTML são utilizadas tags [marcadores] para definir tamanho e cor de fonte, assim como formatação de parágrafo. No XML, você utiliza as tags para descrever os dados, como exemplo, tags de assunto, título, autor, conteúdo, referências, datas, etc. (...) O XML conta, ainda, com recursos tais como folhas de estilo definidas com Extensible Style Language (XSL) e Cascading Style Sheets(CSS) para a apresentação de dados em um navegador. O XML separa os dados da apresentação e processo, o que permite visualizar e processar o dado como se queira, utilizando diferentes folhas de estilo e aplicações. (...) Essa separação dos dados da apresentação permite a integração dos dados de diversas fontes. (...) Dessa forma, os dados em XML podem ser distribuídos através da rede para os clientes que desejarem.”

Para Tim Berners-Lee*, a web semântica irá permitir mais do que a simples melhoria da indexação de informações na rede mundial de computadores. Ele acredita que a completa interoperabilidade dos dados, libertos de formatos e plataformas, permitirá o surgimento de aplicações que melhorem a educação, os serviços de saúde e as atividades das pessoas no ciberespaço. Certamente, haverá uma disputa pelo seu uso. As grandes corporações terão maior facilidade para cruzar dados dos seus alvos ou consumidores. Por outro lado, teremos maiores possibilidades de compartilhamento do conhecimento humano. Nossa história mal começou.

www.w3.org/Designlssues/Semantic - O Mapa da Web Semântica, em inglês.
www.comciencia.br/reportagens/internet/net08.htm - Excelente artigo sobre a web semântica, publicado na Revista Eletrônica Conciência, intitulado "Qual o sentido da WEB?"
www.sciam.com/2001/0501issue/0501berners-lee.html

--------------------

Fonte: Web Page de Fernando Silva Parreiras
[15/09/04] Web semântica: a solução para o caos da internet por Fernando Parreiras

Uma nova web surge com o objetivo de facilitar a comunicação estrutura entre máquinas e aumentar a relevância da informação recuperada pelo usuário: a web semântica.

1. Introdução
Milhares de novas páginas são publicadas diariamente na internet, o que torna cada vez mais difícil para o usuário recuperar a informação relevante para o seu negócio. Diante deste caos, uma enorme quantidade de negócios ou oportunidades pode ser desperdiçada pelo simples motivo da falta de informação na hora certa. A web semântica permite criar um contexto onde a informação possa ter significado para as máquinas, que se encarregarão de levar a informação relevante ao seu usuário.

2. Web semântica

A web semântica é uma extensão da web atual, onde a informação possui um significado dado bem definido, permitindo computadores e pessoas a trabalharem em cooperação. Ela fornece uma arquitetura que permite que dados sejam compartilhados e reusados entre as os programas, empresas e comunidade. É um esforço em conjunto, liderado pelo W3C com a participação de um grande número de pesquisadores e parceiros comerciais.
A web atual é um conjunto de recursos e links. Os recursos são identificados pelos seus URIs (Uniform Resource Identifiers). A URL (Uniform Resource Location) faz parte de um subconjunto da URI. Para o usuário, não existe nenhum problema quanto a esta questão, pois este é capaz de ler a descrição do link, identificando o sentido semântico embutido naquele contexto. Para a máquina, entretanto, muito pouca informação “machine-readable” está disponível, uma vez que não é possível fazer uma análise quando ao juízo transmitido por um link. O significado dos links só é evidente no contexto em torno da âncora. Por exemplo, dois sites de cinema podem fazer referência à um mesmo filme. Entretanto, um site lista o filme entre os dez melhores e o outro site lista-o entre os dez piores. O sentido é totalmente diferente para o homem, mas não para a máquina, que só percebe uma simples ligação.
Na futura web, ou na web semântica, o conjunto de recursos e links também são identificados por URI's, mas podem ser "tipados". Consiste em atribuir um tipo à relação entre dois recursos. Forma-se o conceito chamado de triplas (Um recurso, uma propriedade e um valor). Neste contexto, uma relação entre dois recursos possui uma propriedade que permite atribuir significado à ligação. No exemplo dos sites de filme, pode-se atribuir a propriedade "está entre os dez melhores" ao link no primeiro site e a propriedade "está entre os dez piores" ao link no segundo site. A diferença entre os modelos é que agora o conhecimento está formalizado de uma maneira estruturada. As linguagens que permitem a criação do conhecimento estruturado são RDF e XML.

3. RDF e HTML: Viabilizando a web semântica

RDF é o acrônimo de Resource Description Framework e oferece uma linguagem que permite a descrição de recursos de maneira estrutura. Seu objetivo principal é representar metadados sobre recursos web como título, autor, data de modificação de uma página, etc. Estes metadados que permitem a evolução da busca semântica na web. Já existem iniciativas como o googlism, que tenta responder a perguntas como "o que é", "quem é", "onde" e "quando".
O exemplo abaixo mostra um arquivo RDF que descreve quem é o criador do recurso www.fernando.parreiras.nom.br:

<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.oclc.org/DC#"> <rdf:Description about=" http://www.fernando.parreiras.nom.br"/> <dc:Creator>Fernando Parreiras</dc:Creator> </rdf:Description> </rdf:RDF> Abaixo segue um exemplo de descrição da página inicial deste site, utilizando o padrão de descrição de metadados Dublin Core. Estão descritas informações sobre o autor, direitos autorais e data de criação da página:

<html xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:con="http://www.w3.org/2000/10/swap/pim/contact#">
<head>
<title>Site pessoal de Fernando Parreiras</title>
<meta property="dc:creator">
<meta property="con:fullName">Fernando Parreiras</meta>
</meta>
<meta property="dc:rights">© 2004 </meta>
<meta property="dc:subject">vida do autor,
currículo, publicações</meta>
<meta property="dc:date">2004-11-06T08:49:37+00:00</meta>
</head>
...

Para atribuir semântica ao conteúdo, recorre-se a outros padrões, como o pim do W3C. Somente com o surgimento e a adoção de padrões pelos desenvolvedores é que será possível a criação de um consenso, e através deste a criação real de um sentido semântico. No exemplo abaixo, este endereço só terá um valor semântico para os que utilizam o padrão PIM:
<html
xmlns:con="http://www.w3.org/2000/10/swap/pim/contact#">
<head>
<meta property="con:address">
<meta property="con:street">4 Pear Treet Court</meta>
<meta property="con:city">London</meta>
<meta property="con:country">United Kingdom</meta>
</meta>
</head>
...

4. Conclusão
Antes da internet, o homem viveu o grande desafio de recuperar o conhecimento perdido em livros, documentos ou peças de museu esquecidas ou depositadas em lugares inalcançáveis. Contudo, a internet mudou este cenário tornando a informação e o conhecimento disponíveis a um clique. Entretanto, tal fato gerou a sobrecarga de informações que dificulta distinguir entre a informação relevante e o lixo. Enfrenta-se, novamente, o problema de encontrar a informação certa, na hora certa.
Os usuários, inevitavelmente, recorrerão aos mecanismos de busca, que avançam em iniciativas como a web semântica, buscando tornarem-se verdadeiros oráculos do meio digital. Mas para estabelecer a relação semântica entre as diversas fontes de informação, é necessário um esforço descentralizado, que pode demorar anos para se concretizar. Mas como toda novidade gera oportunidade, beneficiar-se-ão aqueles que alcançarem uma posição onde possam ser facilmente localizados por meio das relações semânticas criadas.
A web semântica depende, enormemente, da criação de padrões de nomenclatura para a descrição de recursos na web. Caso contrário, o problema persistirá com criadores de conteúdo atribuindo descritores diferentes para o mesmo significado.

Imagine que você esteja buscando informações sobre metrópoles norte-americanas na Internet. Entre com a palavra "metropolis" (em inglês) num programa de busca e virão respostas tão variadas quanto a revista Metropolis, a gravadora de discos Metropolis, o fórum Metropolis sobre pesquisa e políticas de migração e cidades, a página de um fã do Metropolis, de Fritz Lang e outras. Isto porque os programas não distinguem o filme da revista ou do centro de pesquisas. É claro que você pode (aliás, deve) combinar "metropolis" com outras palavras-chave, acrescentando ou excluindo termos que permitam refinar a busca, preferencialmente indicando também outros parâmetros, como data, língua ou domínio, que muitos programas aceitam na função de "busca avançada". Ainda assim, o resultado é muitas vezes desolador. São dezenas (às vezes centenas) de páginas que não interessam, tornando difícil separar o joio do trigo.

Com o crescimento exponencial da Web tornou-se difícil indexar as informações. A linguagem HTML, que popularizou a Web e é utilizada pela maioria dos sites, não possui recursos que permitam atribuir significado à informação. "As tags HTML são muito limitadas nesse sentido. Elas apenas descrevem como a página deve ser exibida e não oferecem nenhuma descrição dos dados", explica Rubens Queiroz, do Centro de Computação da Unicamp.

Para melhorar a indexação, são necessárias categorias mais apuradas que permitam triar com eficiência, no oceano de dados disponíveis, aquilo que interessa ao usuário num contexto preciso. Na verdade, categorias já existem. Para o usuário que visita as páginas da revista Metropolis, da ONG Metropolis e a do fã do filme Metropolis a diferença é evidente. O problema é que ela só é entendida por nós, humanos, mas não fazem sentido para os programas de computador, que ainda estão muito distantes de imitar o funcionamento da mente humana. Os programas de computador (ainda) não conseguem resolver as ambigüidades e outros problemas complexos que o ser humano consegue, embora esta seja a aspiração da Inteligência Artificial: fazer com que a máquina reproduza os mecanismos da inteligência humana. Mas disto ainda estamos longe...

A Web Semântica é uma tentativa inversa de solução. Ao invés de pensar na informação para os humanos, a idéia é pensar na máquina. "Machine-understandable Information", esta é a definição da Web Semântica, segundo o "pai da Web", Tim Berners-Lee, um dos comandantes desse projeto. É curioso, claro, pois o objetivo final é atender às pessoas e não aos computadores, mas para isso é preciso construir categorias e uma linguagem que façam sentido para a máquina.

O projeto da Web Semântica, embora pareça uma novidade, não nasceu há tão pouco tempo. Capitaneado pelo consórcio W3C, ele é um sucessor do projeto Metadados, cujos princípios são os mesmos (incluir "informação sobre a informação" na Web), mas que trabalhava com linguagem (HTML), que não permite criar categorias semânticas.

Um componente central da Web Semântica é a linguagem XML, que permite descrever semanticamente os dados e, a partir de categorias que o próprio usuário pode definir. "Um elemento XML pode ter dados declarados como sendo preço de venda, título de livro, quantidade de chuva ou qualquer outro. Uma vez que o dado é encontrado, ele pode ser distribuído pela rede e apresentado em um browser, de várias formas possíveis, ou então pode ser transferido para outras aplicações para processamento futuro e visualização", explica Miguel Furtado Júnior, estudante do Centro de Tecnologia em Engenharia Eletrônica da UFRJ, autor de um tutorial simples e bem estruturado sobre XML.

"O interesse do XML é que ele é extremamente flexível, embora a criação de muitas categorias diferentes também não seja interessante, pois se as empresas querem trocar dados é preciso que partilhem um código comum", ressalta Queiroz, que é mediador da lista de discussão Dicas-L, sobre esse e outros assuntos relacionados a softwares e Internet. Ele cita o exemplo da Unicamp e CNPq, que estabeleceram um protocolo comum (criado por uma equipe da Universidade Federal de Santa Catarina) para poder trocar dados relativos aos currículos de seus pesquisadores. Em breve, um pesquisador que atualize seus dados na plataforma Sipex da Unicamp terá automaticamente os dados convertidos para a plataforma Lattes do CNPq.

Esse processo ainda é relativamente complexo e se torna mais difícil quando um projeto envolve muitos participantes, que têm de se colocar de acordo sobre que categorias utilizar, como os dados devem ser relacionados, como os usuários irão interagir com eles. Todos precisam estar de acordo, caso contrário não há como montar o "banco de dados". Este é, aliás, um dos maiores desafios do futuro da Web. Para o comércio eletrônico, o mais provável é que as empresas cheguem a um acordo, pois têm muito interesse nessa tecnologia, que potencialmente pode incrementar muito seus negócios. Nos demais casos, é difícil imaginar qual será a saída.

As metas do projeto da Web Semântica são mais ambiciosas do que simplesmente permitir indexar melhor a informação da Web. Interessam as aplicações que se tornam possíveis com a utilização de categorias semânticas para descrever os dados. Quem leu o texto de Berners-Lee, James Hendler e Ora Lassila, na revista Scientific American de maio/2001, se lembrará que o início descreve o caso de Pete, um filho que busca na Internet, através de seu agente (um software robô), alternativas para a fisioterapia de sua mãe. Dispondo previamente de uma série de dados de Pete (seu endereço, seus horários, o seguro-saúde de sua mãe, etc), o agente busca na Web as informações relevantes (lista de médicos credenciados, suas agendas, etc) e em alguns minutos oferece uma lista de opções para que ele escolha a que mais lhe convém. Não satisfeito com a primeira lista, Pete pede que o agente refaça a busca de acordo com as restrições por ele estabelecidas. Desta vez, a solução oferecida é satisfatória e com algumas ações simples. Pete muda parte de seus compromissos, obtém a aceitação do agente de Lucy (sua irmã, com quem irá dividir as idas à fisioterapia da mãe) e acerta a agenda.

Todo esse cenário, é claro, ainda está relativamente distante. Além disso, as aplicações mais prováveis das ferramentas acima descritas serão o comércio eletrônico e grandes bancos de dados, como os próprios autores ressaltam. Mas, pondera Rubens Queiroz, isto não faz da Web Semântica uma má idéia. "Hoje o interesse maior é de empresas, por exemplo uma grande editora, para permitir a troca de dados. Mas sites não comerciais também se beneficiarão da utilização do XML e do desenvolvimento da Web Semântica, pois seus conteúdos serão indexados mais eficientemente pelos programas de busca e poderão ser mais facilmente convertidos em novos formatos ou ganharem novo visual", conclui.

Semantic Web Road Map
Texto de Tim Berners-Lee que, como diz o título, é um mapa da Web Semântica, aspectos gerais de sua arquitetura e objetivos. Interessante para quem busca um texto de introdução ao projeto. Claro e consistente. Nível intermediário.

The Semantic Web
Artigo de Tim Berners-Lee, James Hendler e Ora Lassila na revista Scientific American de maio de 2001. Nível intermediário.

Tutorial XML
Em português, elaborado por Miguel Furtado Júnior, estudante da UFRJ.

RDF Model Theory
Última versão da teoria semântica da linguagem RDF (Resource Description Framework). Atualizado em fevereiro de 2002. Nível avançado. Exige conhecimentos de lógica, semântica e informática.

MIT Artificial Intelligence Laboratory
Importante laboratório de pesquisa sobre Inteligência Artificial. Site traz resumos das pesquisas e outros materiais interessantes.

Evolução das linguagens
SGML
(Standard Generalized Markup Language)

Definida em 1986
Possibilidade de criação de qualquer conjunto de tags
Padrão comum: DTD (Document Type Definition)
Difícil adoção na Web
Complexidade
Inexistência de estilos amplamente difundidos

HTML
(Hypertext Markup Language)

Derivada do SGML
Própria para Web
Extremamente simples
Fácil criação de links hypertexto
Conjunto limitado de tags
Difícil reutilização da informação
Busca por documentos gera muitos resultados irrelevantes

XML
(Extensible Markup Language)

SGML para Web
Especificação mais simples
Formato texto
Descrição de dados estruturados
Número ilimitado de tags
Otimiza entrega de informações
Dados são independentes dos aplicativos ou fornecedores de software

Fonte: XML, Rubens Queiroz, Unicamp