diff options
author | Vsevolod Stakhov <vsevolod@rambler-co.ru> | 2009-04-21 16:39:02 +0400 |
---|---|---|
committer | Vsevolod Stakhov <vsevolod@rambler-co.ru> | 2009-04-21 16:39:02 +0400 |
commit | 16c56baa23eb1de585b978b653907b31aceae153 (patch) | |
tree | d010acabc261d9db6a072f80699090702d5dfa32 /README.utf8.txt | |
parent | f074850e41e357aa7a2c5a86d2eef8121710cc47 (diff) | |
download | rspamd-16c56baa23eb1de585b978b653907b31aceae153.tar.gz rspamd-16c56baa23eb1de585b978b653907b31aceae153.zip |
* Write simple approach of chartable module for raw mode texts
* Add description and usage sample for chartable module
Diffstat (limited to 'README.utf8.txt')
-rw-r--r-- | README.utf8.txt | 20 |
1 files changed, 20 insertions, 0 deletions
diff --git a/README.utf8.txt b/README.utf8.txt index 4d761da76..a52e380f4 100644 --- a/README.utf8.txt +++ b/README.utf8.txt @@ -156,3 +156,23 @@ SOME_SYMBOL = "${to_blah} & !(${from_blah} | ${subject_blah})" * has_only_html_part - функция возвращает TRUE, если в сообщении есть только одна HTML часть * compare_recipients_distance - вычисляет процент схожих получателей письма. Принимает аргумент - порог в процентах похожести. * is_recipients_sorted - возвращает TRUE, если список получателей сортирован (работает только если число получателей >= 5). + +Модуль chartable. +================ + +Модуль предназначен для поиска слов со смешанными символами, например: +kашa - часть в латинице, а часть в кириллице. +Параметры модуля: + +.module 'chartable' { + metric = "default"; + symbold = "R_MIXED_CHARSET"; + threshold = "0.1"; +}; + +threshold - это отношение переходов между кодировками к общему числу символов в словах, например, имеем слово +"kаша" (первая буква латинская), тогда общее число переходов - 3, а число переходов между кодировками - 1, тогда +отношение - 1/3. + +Для включения модуля его необходимо добавить в список mime_filters: +mime_filters = "chartable"; |