Algorytm do badania DNA pomoże sprzątać internetowy spam
Algorytm, stosowany w badaniach nad sekwencją DNA, może pomóc w obronie przed zalewającymi Internet śmieciami, czyli spamem -informuje "New Scientist".
Łańcuszki szczęścia, reklamy bezużytecznych produktów, oszukańcze
oferty, wirusy, niechciane wiadomości, cudowne diety i metody
powiększenia różnych części ciała - wszystko to zapycha łącza i
zapełnia skrzynki pocztowe. Oczyszczanie skrzynki z niepożądanych
maili jest czasochłonne, jeśli nie chcemy wyrzucić przy okazji
czegoś ważnego.
Oczywiście pojawiają się automatyczne programy antyspamowe, ale
zwykle są drogie, nieskuteczne, albo drogie i nieskuteczne.
Algorytm nazwany Chung-Kwei (od chińskiego talizmanu feng-shui,
który chroni dom przed złymi duchami) jest inny. Ma niemal 97-
procentową skuteczność.
Chung-Kwei został oparty na wcześniejszym algorytmie Teiresias
(Tejrezjasz to mityczny grecki wróżbita). Teiresiasa opracowali
bioinformatycy z IBM Thomas J. Watson Research Center w Nowym
Jorku, pracujący nad sekwencjonowaniem DNA. Program ten wyszukiwał
w zapisach kodu genetycznego powtarzające się sekwencje, które
zwykle oznaczają ważne informacje.
Zamiast genomu, naukowcy przeanalizowali za pomocą algorytmu 65
000 najbardziej powszechnych przykładów spamu. Każdy mail był
traktowany jak łańcuch DNA. Udało się znaleźć 6 milionów
powtarzających się (więcej niż w jednym mailu) sekwencji liter i
cyfr - na przykład "Viagra". Wiele niechcianych maili natrętnie
poleca tanią Viagrę, Viagrę bez recepty i różne alternatywy dla
Viagry).
Następnie przeanalizowano znaczną liczbę zwykłej korespondencji
(nazywanej czasem "ham" - "szynka" w przeciwieństwie do "spamu" -
"mielonki"). Te sekwencje, które powtarzały się w "hamie" i
"spamie" wyeliminowano.
W dalszej kolejności analizowano przychodzącą korespondencję. Im
większa była liczba typowych "spamerskich sekwencji" na kilobajt
maila, tym pewniejsze było, że to spam.
Tylko 1 na 60 000 zwykłych maili został omyłkowo zatrzymany,
natomiast skuteczność rozpoznawania spamu wyniosła aż 96,56 procent. (PAP)