BLOCO
Blog dos Coordenadores ou Blog Comunitário
da
ComUnidade
WirelessBrasil
Julho 2008 Índice Geral do BLOCO
O conteúdo do BLOCO tem forte vinculação com os debates nos Grupos de Discussão Celld-group e WirelessBR. Participe!
• "Web Semântica" (01) - O que é
----- Original Message -----
From: Helio Rosa
To:
Celld-group@yahoogrupos.com.br
;
wirelessbr@yahoogrupos.com.br
Sent: Tuesday, July 01, 2008 9:42 PM
Subject: "Web Semântica" (01) - O que é
Fonte:
ComCiência - Revista Eletrônica de Jornalismo Científico
[10/04/02]
Qual o sentido da Web?
O conhecimento deve ser disseminado, sob pena
do mundo globalizado entrar em colapso.
Mas como gerenciar isto de forma sustentável, levando a informação às pessoas
e promovendo o desenvolvimento?
A resposta, eu insisto: com a adoção da Web Semântica, que possibilita:
- organização lógica dos dados contidos nas home pages;
- qualificar os metadados, tornando-os utilizáveis e úteis;
- identificação das informações relevantes, chegando mais rapidamente a elas,
através do cruzamento das ontologias
- diversos níveis de sistemas e tecnologias de informação.
O maior problema da internet é o crescimento
anárquico e desordenado. Isto foi muito bom no começo, pois ajudou a expandir
a Rede Mãe, mas chegou a hora da ordem no caos.
A Web Semântica é uma solução para a estruturação dos dados da internet,
usando meta-tags, viabilizando o processo de informação por parte das máquinas
e visando novas possibilidades para a gestão do conhecimento. Ela pode ser
considerada como a composição de um grande número de componentes ontológicos
inter-relacionados.
É fundamental que os dados dos sites sejam expressivos o suficiente para que os computadores sejam capazes de processar e entender o real significado, sabendo diferenciar Holanda (país) de Holanda (Chico Buarque), por exemplo.
Na linguagem uma palavra pode ter diversos
significados, o que pode causar confusão. A solução é usar técnicas que
possibilitem o software vasculhar e separar o joio do trigo, cruzando as
meta-informações e adentrando da chamada Web invisível, que caso, não saibam,
o Google indexa apenas 3% de tudo que existe virtualmente.
Três premissas devem ser cumpridas à risca, para a fundamentação da Web
Semântica:
- Um conjunto de padrões de metadados específicos de forma a acomodar os
diferentes tipos de recursos: a adoção do padrão Dublin Core, com 15 itens, já
universalizados e sugeridos pelo W3C, consórcio mundial que gere o
desenvolvimento da Web Semântica, comandado por Tim Berners-Lee, que inventou
nada menos que WWW. Ele é um dos “ pais “ da internet.
- A prevalência da língua inglesa como base da internet.
- A adoção da linguagem XML, mais elaborada e compreensível pelas máquinas.
Os chamados agentes são os elementos que vasculham a internet. A tecnologia de agentes permite a interação entre máquina e humanos, favorecendo o alcance dos objetivos, possibilitando a implementação de um sistema que faz com que o computador seja parte ativa no processo.
Os agentes devem ter: autonomia, velocidade de reação e continuidade temporal (estar sendo sempre atualizado).
----------------------------------
Fonte: Google DiscoveryO Yahoo anunciou hoje novos detalhes de sua plataforma para desenvolvedores chamada Open Search. Além de mostrar como essa plataforma vai se integrar com o futuro suporte que a empresa terá aos vários padrões da Web Semântica como RDF e microformats.
Um site pode determinar semanticamente seu conteúdo, através dos microformats. Especificando o que é um endereço, dizendo que um telefone é de determinada pessoa, entre outros detalhes. O que o Yahoo pretende, é fazer com que sua máquina de busca entenda esses dados semi-estruturados de forma automática e insira nos resultados da busca. Para demonstrar isto, o blog do Yahoo Search dá o exemplo de uma rede social como o LinkedIn:
LinkedIn
Neste caso, a resposta para a consulta do usuário é um perfil da rede social,
só que desta vez com muito mais informação agregada, graças aos microformats.
Em conjunto com o suporte aos padrões semânticos, o Yahoo irá abrir sua plataforma Open Search para os desenvolvedores. Com esta ferramenta é possível desenvolver “mods” para os resultados da busca usando os dados semânticos no índice da máquina de busca ou em qualquer API pública.
O que isso tudo realmente significa para nós?
Se um site de comércio eletrônico, por exemplo, resolver implementar
microformats nas páginas de seus produtos, o Yahoo irá poder extrair o preço,
nome do produto, características, entre outros detalhes diretamente da página
e guardar essas informações. Além disso, com a plataforma Open Search será
possível criar algo parecido com o visto acima sobre o perfil no LinkdIn. Ao
procurar por “Televisões de LCD”, por exemplo, o Yahoo pode mostrar
informações sobre o produto junto com o link para a página do produto.
As utilidades dessas tecnologias são inúmeras, mas há algumas questões a serem observadas. Os formatos da Web Semântica ainda são novos e não estão bem consolidados, além disso quem quiser implementar estes formatos precisa fazer muita coisa “na mão”, ou seja, ainda não há ferramentas que facilitem este processo. Além da iniciativa do Yahoo, existem poucas utilidades para estes formatos semânticos. Logo, colocar microformats em um site pode ser uma tarefa árdua para poucos resultados práticos.
O Yahoo quer mudar esse cenário e de quebra criar um ambiente onde desenvolvedores possam criar resultados de busca mais dinâmicos e informativos para seus sites, melhorando a experiência do usuário.
Séra esse o começo do caminho para uma Web mais Semântica?
Fonte: IDG Now!
[12/12/07]
Web semântica e interface tátil estão entre
tecnologias pioneiras para 2008
São Paulo - Technology Pioneers 2008, do Fórum Econômico Mundial, destaca ainda acesso à web sem fio e operadoras de publicidade móvel.
Empresas que desenvolvem soluções para publicidade online, interfaces táteis adaptáveis a diferentes ambientes, acesso em banda larga sem fio e até comparações de preços providas pela comunidade estão no Technology Pioneers 2008, seleção de companhias de tecnologias que, segundo o Fórum Econômico Mundial, terão impacto em nossas vidas nos próximos anos.
Os telefones celulares são representados tanto pela AdMob, maior plataforma de anúncios móveis, e pela MedioSystems que, mesmo sem o alcande da AdMob, oferece soluções para gerenciamento de campanhas de publicidade nos celulares.
Aparelhos móveis também foram lembrados pela indicação da Lumio, responsável por sistemas que, acoplados a superfícies aleatórias, as transformam em interfaces táteis para o controle e gerenciamento de gadgets, notebooks e desktops ou outros tipos de aplicação.
O acesso à internet sem fio também foi lembrado pelo Fórum Econômico Mundial com a indicação das empresas Clearwire Corporation, responsável pela infra-estrutura de banda larga de operadoras nos EUA, Irlanda e Dinamarca, a Transclick, mais voltada para acessos por redes telefônicas para smartphones, Roundbox, que oferece acesso à web ao integrar em software diversos sinais de redes disponíveis, e a Meraki, que monta e opera redes do tipo mesh.
Entre as tecnologias online, o ranking destaca a britânica Garlik pelo desenvolvimento de aplicativos semânticos para buscas online usados por empresas para o melhor gerenciamento de dados, a sueca Polar Rose que, por meio de sua tecnologia de reconhecimento facial em 3D aplicada à internet, pode dar maior relevância às imagens online, e a Fundação Wikimedia, criada por Jimmy Walles e responsável por gerenciar a enciclopédia online Wikipedia.
A listagem do órgão ainda traz empresas responsáveis por tecnologias para aceleração do acesso online, como a israelense SpeedBit, de melhor aproveitamento de memória RAM, como a Innovative Silicon, e por pesquisas de integração de chips em redes para processamento espalhado, como a franco-americana Arteris.
Segundo o Fórum Econômico Mundial, "cada inovação (listada no ranking) é outro passo na tentativa da sociedade de adaptar e utilizar tecnologias que mudarão e melhorarão nosso mundo". Como recompensa, cada uma das 17 empresas escolhidas em tecnologia serão convidadas a participar do próximo encontro do Fórum Econômico Mundial, que acontecerá entre os dias 23 e 27 de janeiro em Davos, na Suiça.
Semântica é uma palavra que vem do grego semantiké, e pode ser traduzida por “arte da significação”. A web semântica será uma web inteligente? Sergio Amadeu da Silveira
Você conhece Ferdinand de Saussure? Foi um dos grandes mestres da Universidade de Genebra e considerado o fundador da Linguística moderna. No início do século XX, deu o Curso de Linguística Geral que abriu caminho para uma ciência autônoma que tivesse a língua como objeto específico. Você conhece Tim Berners-Lee? É um inglês que trabalhava no Laboratório de Física de partículas, também em Genebra, quando criou a web, no final do século XX. Em maio de 1990, Berners-Lee liberou na rede mundial de computadores os principais elementos para a constituição da world wide web, ou seja, seus principais protocolos e padrões, tais como o HTTP (HyperText Transfer Protocol), mas também da URL (Uniform Resource Locator), e da linguagem HTML (Hypertext Markup Language), que permitiram o modo gráfico na internet. Logo depois, o mesmo laboratório de Genebra (conhecido como CERN) liberou a primeira versão de um software para interpretar os ícones e desenhos que foram escritos em HTML. Assim sugiu o primeiro browser (navegador), o Mosaic.A web foi a grande responsável pela popularização da internet. A linguagem HTML, aberta e não-proprietária, foi assimilada rapidamente e permitiu a construção de milhares de sites, que logo se tornaram milhões. Sem dúvida, a web nasceu no mundo das tecnologias abertas e pode ser considerada uma revolução dentro da revolução informacional. Tim Berners-Lee continuou seu esforço colaborativo e, atualmente, dirige o consórcio W3C (World Wide Web Consortium) que garante o desenvolvimento aberto e interoperável de tecnologias desenhadas para a web. Berners-Lee concentra-se, agora, em viabilizar a web semântica.
A Linguística criada por Saussure, atualmente, é uma ciência que possibilita analisar as linguagens sob quatro pontos de partida: a fonologia estuda suas unidades sonoras; a sintaxe nos dá a possibilidade de observar a estrutura das frases; a morfologia nos leva a avaliar as formas das palavras, e a semântica nos coloca diante do estudo dos significados. E o que isso tem a ver com a web? Com a internet? Muito.
Para Saussure, a língua é um “sistema de signos” e o signo é uma associação entre o significante (a imagem sonora ou visual do signo) e o significado (o conceito do signo). Essa relação não é estática, ou seja, os significados mudam diante de seus significantes. A semântica, de acordo com o “Dicionário Aurélio”, pode ser entendida como semasiologia, que “estuda as relações entre sinais e símbolos e aquilo que eles representam”. Pode também ser definida como “o estudo do sentido das palavras”. Agora, pare e pense em uma busca pela web. Imagine que seu amigo chama-se Aurélio (nome próprio). Você está procurando o blog dele, e o mecanismo de busca não sabe que você está atrás do Aurélio “nome próprio”, em vez do Aurélio “dicionário”. A linguagem em que os sites foram escritos não permite que as máquinas entendam o significado dos dados que estão na rede. semântica precisa usar uma outra linguagem que separe o conteúdo da forma em que é exposto. A linguagem básica para isto é o XML (eXtensible Markup Language), que nos permite inserir categorias semânticas nos dados que irão para a web. Poderemos, por exemplo, definir que um determinado conjunto de dados é um preço, e outro é o nome de um livro, e assim por diante. Para explicar isso melhor, segue um trecho de um excelente tutorial sobre XML (www.gta.ufrj.br/grad/00_1/miguel/), escrito por Miguel Furtado Junior ( Centro de Tecnologia em Engenharia Eletrônica da UFRJ).
-----------------------------------------
Fonte: ComCiência - Revista Eletrônica de Jornalismo CientíficoImagine que você esteja buscando informações sobre metrópoles norte-americanas na Internet. Entre com a palavra "metropolis" (em inglês) num programa de busca e virão respostas tão variadas quanto a revista Metropolis, a gravadora de discos Metropolis, o fórum Metropolis sobre pesquisa e políticas de migração e cidades, a página de um fã do Metropolis, de Fritz Lang e outras. Isto porque os programas não distinguem o filme da revista ou do centro de pesquisas. É claro que você pode (aliás, deve) combinar "metropolis" com outras palavras-chave, acrescentando ou excluindo termos que permitam refinar a busca, preferencialmente indicando também outros parâmetros, como data, língua ou domínio, que muitos programas aceitam na função de "busca avançada". Ainda assim, o resultado é muitas vezes desolador. São dezenas (às vezes centenas) de páginas que não interessam, tornando difícil separar o joio do trigo.
Com o crescimento exponencial da Web tornou-se difícil indexar as informações. A linguagem HTML, que popularizou a Web e é utilizada pela maioria dos sites, não possui recursos que permitam atribuir significado à informação. "As tags HTML são muito limitadas nesse sentido. Elas apenas descrevem como a página deve ser exibida e não oferecem nenhuma descrição dos dados", explica Rubens Queiroz, do Centro de Computação da Unicamp.
Para melhorar a indexação, são necessárias categorias mais apuradas que permitam triar com eficiência, no oceano de dados disponíveis, aquilo que interessa ao usuário num contexto preciso. Na verdade, categorias já existem. Para o usuário que visita as páginas da revista Metropolis, da ONG Metropolis e a do fã do filme Metropolis a diferença é evidente. O problema é que ela só é entendida por nós, humanos, mas não fazem sentido para os programas de computador, que ainda estão muito distantes de imitar o funcionamento da mente humana. Os programas de computador (ainda) não conseguem resolver as ambigüidades e outros problemas complexos que o ser humano consegue, embora esta seja a aspiração da Inteligência Artificial: fazer com que a máquina reproduza os mecanismos da inteligência humana. Mas disto ainda estamos longe...
A Web Semântica é uma tentativa inversa de solução. Ao invés de pensar na informação para os humanos, a idéia é pensar na máquina. "Machine-understandable Information", esta é a definição da Web Semântica, segundo o "pai da Web", Tim Berners-Lee, um dos comandantes desse projeto. É curioso, claro, pois o objetivo final é atender às pessoas e não aos computadores, mas para isso é preciso construir categorias e uma linguagem que façam sentido para a máquina.
O projeto da Web Semântica, embora pareça uma novidade, não nasceu há tão pouco tempo. Capitaneado pelo consórcio W3C, ele é um sucessor do projeto Metadados, cujos princípios são os mesmos (incluir "informação sobre a informação" na Web), mas que trabalhava com linguagem (HTML), que não permite criar categorias semânticas.
Um componente central da Web Semântica é a linguagem XML, que permite descrever semanticamente os dados e, a partir de categorias que o próprio usuário pode definir. "Um elemento XML pode ter dados declarados como sendo preço de venda, título de livro, quantidade de chuva ou qualquer outro. Uma vez que o dado é encontrado, ele pode ser distribuído pela rede e apresentado em um browser, de várias formas possíveis, ou então pode ser transferido para outras aplicações para processamento futuro e visualização", explica Miguel Furtado Júnior, estudante do Centro de Tecnologia em Engenharia Eletrônica da UFRJ, autor de um tutorial simples e bem estruturado sobre XML.
"O interesse do XML é que ele é extremamente flexível, embora a criação de muitas categorias diferentes também não seja interessante, pois se as empresas querem trocar dados é preciso que partilhem um código comum", ressalta Queiroz, que é mediador da lista de discussão Dicas-L, sobre esse e outros assuntos relacionados a softwares e Internet. Ele cita o exemplo da Unicamp e CNPq, que estabeleceram um protocolo comum (criado por uma equipe da Universidade Federal de Santa Catarina) para poder trocar dados relativos aos currículos de seus pesquisadores. Em breve, um pesquisador que atualize seus dados na plataforma Sipex da Unicamp terá automaticamente os dados convertidos para a plataforma Lattes do CNPq.
Para criar aplicações XML são necessários quatro passos:
Esse processo ainda é relativamente complexo e se torna mais difícil quando um projeto envolve muitos participantes, que têm de se colocar de acordo sobre que categorias utilizar, como os dados devem ser relacionados, como os usuários irão interagir com eles. Todos precisam estar de acordo, caso contrário não há como montar o "banco de dados". Este é, aliás, um dos maiores desafios do futuro da Web. Para o comércio eletrônico, o mais provável é que as empresas cheguem a um acordo, pois têm muito interesse nessa tecnologia, que potencialmente pode incrementar muito seus negócios. Nos demais casos, é difícil imaginar qual será a saída.
Outros componentes da Web Semântica são:
Aplicações
As metas do projeto da Web Semântica são mais ambiciosas do que simplesmente permitir indexar melhor a informação da Web. Interessam as aplicações que se tornam possíveis com a utilização de categorias semânticas para descrever os dados. Quem leu o texto de Berners-Lee, James Hendler e Ora Lassila, na revista Scientific American de maio/2001, se lembrará que o início descreve o caso de Pete, um filho que busca na Internet, através de seu agente (um software robô), alternativas para a fisioterapia de sua mãe. Dispondo previamente de uma série de dados de Pete (seu endereço, seus horários, o seguro-saúde de sua mãe, etc), o agente busca na Web as informações relevantes (lista de médicos credenciados, suas agendas, etc) e em alguns minutos oferece uma lista de opções para que ele escolha a que mais lhe convém. Não satisfeito com a primeira lista, Pete pede que o agente refaça a busca de acordo com as restrições por ele estabelecidas. Desta vez, a solução oferecida é satisfatória e com algumas ações simples. Pete muda parte de seus compromissos, obtém a aceitação do agente de Lucy (sua irmã, com quem irá dividir as idas à fisioterapia da mãe) e acerta a agenda.
Todo esse cenário, é claro, ainda está relativamente distante. Além disso, as aplicações mais prováveis das ferramentas acima descritas serão o comércio eletrônico e grandes bancos de dados, como os próprios autores ressaltam. Mas, pondera Rubens Queiroz, isto não faz da Web Semântica uma má idéia. "Hoje o interesse maior é de empresas, por exemplo uma grande editora, para permitir a troca de dados. Mas sites não comerciais também se beneficiarão da utilização do XML e do desenvolvimento da Web Semântica, pois seus conteúdos serão indexados mais eficientemente pelos programas de busca e poderão ser mais facilmente convertidos em novos formatos ou ganharem novo visual", conclui.
Para quem quiser ver exemplos de sites que desenvolvem os conceitos da Web Semântica, com utilização de XML, RDF e outros, são interessantes o Projeto Dublin Core Metadata Initiative, o IMS Global Learning Consortium, que estabelece vocabulários para facilitar o aprendizado distribuído on line e, em português o Projeto RSSficado.
Para saber mais:
Semantic Web Road Map
Texto de Tim Berners-Lee que, como diz o título, é
um mapa da Web Semântica, aspectos gerais de sua arquitetura e objetivos.
Interessante para quem busca um texto de introdução ao projeto. Claro e
consistente. Nível intermediário.
The Semantic Web
Artigo de Tim Berners-Lee, James Hendler e Ora
Lassila na revista Scientific American de maio de 2001. Nível intermediário.
Tutorial XML
Em português, elaborado por Miguel Furtado Júnior,
estudante da UFRJ.
Metadata Based Annotation Infrastructure offers
Flexibility and Extensibility for Collaborative Applications and Beyond
Paper científico sobre ABSTRACT, apresentado por
dois pesquisadores do W3C (Marja-Riitta Koivunen and Ralph R. Swick) no KCAP
workshop on Knowledge markup and semantic annotation. Atual e interessante.
Nível avançado.
RDF Model Theory
Última versão da teoria semântica da linguagem RDF
(Resource Description Framework). Atualizado em fevereiro de 2002. Nível
avançado. Exige conhecimentos de lógica, semântica e informática.
MIT Artificial Intelligence Laboratory
Importante laboratório de pesquisa sobre
Inteligência Artificial. Site traz resumos das pesquisas e outros materiais
interessantes.
Evolução das linguagens
SGML
(Standard Generalized Markup Language)
Definida em 1986
Possibilidade de criação de qualquer conjunto de tags
Padrão comum: DTD (Document Type Definition)
Difícil adoção na Web
Complexidade
Inexistência de estilos amplamente difundidos
HTML
(Hypertext Markup Language)
Derivada do SGML
Própria para Web
Extremamente simples
Fácil criação de links hypertexto
Conjunto limitado de tags
Difícil reutilização da informação
Busca por documentos gera muitos resultados irrelevantes
XML
(Extensible Markup Language)
SGML para Web
Especificação mais simples
Formato texto
Descrição de dados estruturados
Número ilimitado de tags
Otimiza entrega de informações
Dados são independentes dos aplicativos ou fornecedores de software
Fonte: XML, Rubens Queiroz, Unicamp
[Procure "posts" antigos e novos sobre este tema no Índice Geral do BLOCO]