Michael Stanton

WirelessBrasil

Ano 2003       Página Inicial (Índice)    


30/11/2003
Software novo para a Internet

Nas últimas semanas tomei conhecimento de dois softwares para a Internet, que me chamaram à atenção, pelo impacto da maneira que eu faço ou poderei fazer uso da Internet. Espero que eles também poderão interessar a outras pessoas também.

Deles o mais prosaico é um filtro de spam. Nas colunas de 18 de maio e de 26 de maio últimos, foi abordado o assunto do spam, que é definido como mensagens de correio eletrônico não solicitadas e enviadas a granel, analisando esta moléstia e discutindo soluções. Nos últimos seis meses piorou muito, e em meu caso pessoal específico mais da metade das mensagens que recebo podem ser classificados assim. Nos EUA, a situação já mereceu legislação própria e foi aprovado há uma semana pelo congresso nacional desse país projeto de lei que regulamenta o assunto. Este projeto de lei já foi criticado duramente por comentaristas especializados porque, embora torne ilegal a maior parte de spam que estamos acostumado a receber, somente terá impacto sobre o spam enviado a partir de algum ponto dos EUA, ignorando o fato que boa parte destas mensagens se origina em outras partes do mundo, inclusive no Brasil. É mais um caso que requer o tipo de uniformização em escala mundial que já vimos aplicada à proteção de propriedade intelectual (v., por exemplo, a coluna de 7 de novembro. Por outro lado, este projeto de lei permite certos tipos de mensagens não solicitadas a granel, desde que seja identificada adequadamente o remetente e que exista uma forma de optar por não receber mais mensagens. Os mais céticos consideram a nova legislação como o licenciamento de spam para empresas convencionais, e prevêem um aumento em seu volume.

Voltando a meu caso pessoal, até há pouco mais de um mês eu apenas usava a solução mais simples para tratar desta moléstia - apagava as mensagens manualmente, normalmente sem lê-las: a simples olhada ao remetente ou ao assunto bastava para identificar a mensagem como não desejada. O problema com esta abordagem era que eu havia chegado a gastar preciosos minutos diários para esta tarefa inglória e repetitiva - hoje recebo uma média de 140 mensagens ao dia, das quais umas 80 são indesejadas. É um caso típico do uso do espeto de pau na casa do ferreiro. Um belo dia em outubro mudei de postura e procurei uma solução mais adequada, na forma de um filtro que lesse para mim as mensagens que chegavam e classificasse e descartasse as que eu não iria mais ler. Tendo tido contato com várias soluções, procurei uma que fosse flexível e inteligente, sem uso pré-definido de listas de endereços brancos ou negros, que são muito usadas. Procurei especificamente um filtro que pudesse aprender com minha ajuda a identificar corretamente o que eu precisasse.

Há vários destes filtros disponíveis, que utilizem técnicas da estatística bayesiana, e busquei usando Google software deste tipo, de preferência sem custo, para funcionar com minha maneira de trabalhar com correio - usando uma máquina com sistema operacional Windows leio minhas mensagens do servidor de correio usando o serviço POP (Post Office Protocol). Não levei muito tempo para encontrar um artigo comparando várias soluções (email.about.com/cs/winspamreviews/tp/anti-spam.htm) e, depois de selecionar as duas ou três que pareciam mais apropriadas, obtive cópias para examinar de perto. Entre estas somente uma também permitia o uso de autenticação APOP, usada por meu servidor de correio. Felizmente, ela atendia aos meus outros requisitos e logo instalei e comecei a usá-la mais ou menos no dia 15 de outubro. Este software se chama K9, e está disponível no sítio keir.net.

Como todos os filtros bayesianos, ele precisa ser treinado, o usuário indicando quais as mensagens que ele já classificou incorretamente. Com o volume de mensagens que recebo, este treinamento foi bem rápido. A medida mais importante de filtros de spam é o número de erros de identificação. Estas são chamados de "falsos negativos", quando se trata de mensagens spam consideradas como aceitáveis, e "falsos positivos", no caso de rejeitar como spam as mensagens boas. Estou muito preocupado que seja mantido muito pequeno este número, porque não gostaria de perder desta forma uma mensagem válida. K9 proporciona meios de checar sua classificação e é necessário de vez em quando usá-los. Os casos de falsos negativos são automaticamente tratados, porque passam pelos filtros. Os mais problemáticas são os falsos positivos, que requerem maior atenção - uma vez a cada dois dias revejo as suas decisões. Nos últimos 33 dias encontrei apenas 3 falsos positivos entre 2.469 mensagens consideradas spam - um a cada 11 dias. Por outro lado, a taxa de falsos negativos é maior (66 em 2.267) - dois por dia. Considero excepcionais estes números, e reconheço que o bom desempenho de K9 me permitiu retomar controle do uso de correio eletrônico e ganhar precioso tempo cada dia.

O segundo software interessante que conheci recentemente foi o Skype (www.skype.com), quando um aluno meu contou que estava usando para se comunicar com sua família no interior do país. Skype implementa comunicação oral entre usuários de computadores ligados à Internet, técnica às vezes conhecida como VoIP - voz sobre Internet. Não é o primeiro software que faz isto, mas tem algumas características interessantes. Primeiro, ele permite comunicação mesmo na presença de paredes corta-fogo (firewalls) ou NAT (Network Address Translation), que freqüentemente barram comunicação direta entre dois computadores de usuário. Segundo, não utiliza servidores centrais ou fixos para possibilitar a comunicação, e sim uma rede de computadores funcionando em modo P2P - peer to peer. Para garantir a privacidade da comunicação nestes pontos de passagem, utiliza-se proteção criptográfica da voz. Terceiro, os criadores deste software, Niklas Zennstrom e Janus Friis, já têm pedigree. Foram eles os criadores de KaZaA, o mais usado dos softwares para compartilhamento de músicas, que preencheram a lacuna deixado pelo fim de Napster.

Por falta de tempo ou oportunidade, ainda não cheguei a utilizar Skype, mas meu aluno garante que funciona com boa qualidade de áudio. Também parece ter tido uma boa receptividade. Quando obtive cópia gratuita do software no início de novembro, o sítio informou que já haviam sido feitas mais de dois milhões de cópias do software em dois ou três meses. Se repetir o sucesso de KaZaA, que desagrada profundamente as empresas da indústria fonográfica, este software vai mexer com outro setor tradicional de negócios, o de telefonia, pois oferece telefonia de longa distância gratuita. Num mundo em evolução, estas mudanças são inevitáveis, embora dolorosas, para quem imagina ter assegurado seu futuro econômico por investir num negócio antes dominado por monopólio ou oligopólio, e depois descobre que as novas tecnologias subvertem seus planos.

Uma das características mais interessantes de usar uma tecnologia aberta como a Internet é o escopo dado para invenção. Nesta coluna mostrei como esta capacidade de invenção continua viva e promissora.