summaryrefslogtreecommitdiffstats
path: root/README.utf8.txt
diff options
context:
space:
mode:
authorVsevolod Stakhov <vsevolod@rambler-co.ru>2009-04-21 16:39:02 +0400
committerVsevolod Stakhov <vsevolod@rambler-co.ru>2009-04-21 16:39:02 +0400
commit16c56baa23eb1de585b978b653907b31aceae153 (patch)
treed010acabc261d9db6a072f80699090702d5dfa32 /README.utf8.txt
parentf074850e41e357aa7a2c5a86d2eef8121710cc47 (diff)
downloadrspamd-16c56baa23eb1de585b978b653907b31aceae153.tar.gz
rspamd-16c56baa23eb1de585b978b653907b31aceae153.zip
* Write simple approach of chartable module for raw mode texts
* Add description and usage sample for chartable module
Diffstat (limited to 'README.utf8.txt')
-rw-r--r--README.utf8.txt20
1 files changed, 20 insertions, 0 deletions
diff --git a/README.utf8.txt b/README.utf8.txt
index 4d761da76..a52e380f4 100644
--- a/README.utf8.txt
+++ b/README.utf8.txt
@@ -156,3 +156,23 @@ SOME_SYMBOL = "${to_blah} & !(${from_blah} | ${subject_blah})"
* has_only_html_part - функция возвращает TRUE, если в сообщении есть только одна HTML часть
* compare_recipients_distance - вычисляет процент схожих получателей письма. Принимает аргумент - порог в процентах похожести.
* is_recipients_sorted - возвращает TRUE, если список получателей сортирован (работает только если число получателей >= 5).
+
+Модуль chartable.
+================
+
+Модуль предназначен для поиска слов со смешанными символами, например:
+kашa - часть в латинице, а часть в кириллице.
+Параметры модуля:
+
+.module 'chartable' {
+ metric = "default";
+ symbold = "R_MIXED_CHARSET";
+ threshold = "0.1";
+};
+
+threshold - это отношение переходов между кодировками к общему числу символов в словах, например, имеем слово
+"kаша" (первая буква латинская), тогда общее число переходов - 3, а число переходов между кодировками - 1, тогда
+отношение - 1/3.
+
+Для включения модуля его необходимо добавить в список mime_filters:
+mime_filters = "chartable";