quinta-feira, março 01, 2007

Dada Spam

E deus criou o email, ao que o diabo respondeu criando o spam, entre um e outro ensaio de algum cover das canções celestiais. As forças do Bem tiveram a idéia de criar filtros para detectar spam, e buscaram a ajuda do reverendo Thomas Bayes. Veio à luz o filtro de spam bayesiano.

A idéia é simples: existem algumas palavras que ocorrem muito em spam; por exemplo, "viagra". Então a ocorrência de uma palavra dessas em uma mensagem de email aumenta a probabilidade que este seja spam, wonderful spam!, lovely spam! Ou só spam normal mesmo.

Depois disso os spammers pensaram em escrever as palavras de formas diferentes, como "v1agra" ou "v14gra" e por aí vai. Mas os filtros bayesianos são treinados para aprender novas palavras que sejam usadas, com alta probabilidade, em mensagens de spam. E aí, o que fazer?

Eis que os spammers tiveram uma ótima idéia, com conseqüências inesperadas: examinar vários emails legítimos (ou seja, não spam) e selecionar aleatoriamente palavras que ocorrem nesses emails para colocar no campo de assunto e no texto de um email spam. Não funcionou muito bem, mas gerou ótimos versos com os quais se pode brincar de "monte seu próprio poema dadaísta". Tristan Tzara não imaginou essa. Olhando hoje na pasta de spam do meu email, fiz esse aqui:

No pyrophosphate the marsupial
deck, dressed in nothing but swimming trunks
do visible or magnetite.
But to septate
by recombinant or fermi
I where or asunder
As escapade to wheel!

7 comentários:

Bruno R disse...

dessa vez as letrinhas foram demais!

festpb

juro!

festpb..

tautologico disse...

E logo nesse post. Impressionante.

Anônimo disse...

tá foda isso aqui. Se o cara não tiver logado, as letrinhas nem aparecem.

feedback realmente não é tua intenção.

Mythus disse...

Pois eu não estou logado e tem "zqhbju" lá embaixo.

Quanto ao post, só do dos emails POP3, tenho cerca de 370 spams acumulados nos últimos 5 dias, mas é bem menos do que o que eu tive na semana retrasada (perto de 800 acumulados de 5 dias)

Cara... eu nunca parei para ler um spam, mas depois desse post eu tive que ler um e vou reproduzir a ultima frase:
"Dants untidy spent examined very the various sniff articles shown to him"

Infelizmente todos os spams em português são golpistas ou propagandas sem requintes dadaístas.

Haroudo Xavier disse...

Hum hum

Anônimo disse...

quite avant-garde, voce.

Anônimo disse...

20% do total, a energia consumida pelo cérebro. Achei pouca. Pensei que fosse mais.