[Rework] URL: Another update for urls extraction logic

author Vsevolod Stakhov <vsevolod@highsecure.ru>

Mon, 23 Mar 2020 14:50:24 +0000 (14:50 +0000)

committer Vsevolod Stakhov <vsevolod@highsecure.ru>

Mon, 23 Mar 2020 14:50:24 +0000 (14:50 +0000)
author Vsevolod Stakhov <vsevolod@highsecure.ru>
Mon, 23 Mar 2020 14:50:24 +0000 (14:50 +0000)
committer Vsevolod Stakhov <vsevolod@highsecure.ru>
Mon, 23 Mar 2020 14:50:24 +0000 (14:50 +0000)
diff --git a/src/libmime/message.c b/src/libmime/message.c

index f167730d428f78f58a944b81ede444742fc1a126..49d87909060fa1ede058ba0c13ea1d10a2cd83ef 100644 (file)
--- a/src/libmime/message.c
+++ b/src/libmime/message.c
@@ -887,21 +887,8 @@ rspamd_message_process_text_part_maybe (struct rspamd_task *task,
                 }
         }
         else {
-               if (mime_part->parent_part) {
-                       struct rspamd_mime_part *parent = mime_part->parent_part;
-
-                       if (IS_PART_MULTIPART (parent) && parent->specific.mp->children->len == 2) {
-                               /* Do not extract urls from HTML at all */
-                       }
-                       else {
-                               rspamd_url_text_extract (task->task_pool, task, text_part,
-                                               RSPAMD_URL_FIND_STRICT);
-                       }
-               }
-               else {
-                       rspamd_url_text_extract (task->task_pool, task, text_part,
-                                       RSPAMD_URL_FIND_STRICT);
-               }
+               rspamd_url_text_extract (task->task_pool, task, text_part,
+                               RSPAMD_URL_FIND_STRICT);
         }
  
         if (text_part->exceptions) {
diff --git a/src/libserver/url.c b/src/libserver/url.c

index 0669d932fd4d06a8602ff6d0c0480bcdbd855960..6aceb8fa6f287e0d4f168cb75a660def3477eeb1 100644 (file)
--- a/src/libserver/url.c
+++ b/src/libserver/url.c
@@ -63,10 +63,10 @@ typedef struct url_match_s {
         gchar st;
  } url_match_t;
  
-#define URL_FLAG_NOHTML (1 << 0)
-#define URL_FLAG_TLD_MATCH (1 << 1)
-#define URL_FLAG_STAR_MATCH (1 << 2)
-#define URL_FLAG_REGEXP (1 << 3)
+#define URL_FLAG_NOHTML (1u << 0u)
+#define URL_FLAG_TLD_MATCH (1u << 1u)
+#define URL_FLAG_STAR_MATCH (1u << 2u)
+#define URL_FLAG_REGEXP (1u << 3u)
  
  struct url_callback_data;
  
@@ -206,12 +206,12 @@ struct url_matcher static_matchers[] = {
                 {"sip:",      "",          url_web_start,   url_web_end,
                                 0},
                 {"www.",      "http://",   url_web_start,   url_web_end,
-                               URL_FLAG_NOHTML},
+                               0},
                 {"ftp.",      "ftp://",    url_web_start,   url_web_end,
-                               URL_FLAG_NOHTML},
+                               0},
                 /* Likely emails */
                 {"@",         "mailto://", url_email_start, url_email_end,
-                               URL_FLAG_NOHTML}
+                               0}
  };
author	Vsevolod Stakhov <vsevolod@highsecure.ru>
	Mon, 23 Mar 2020 14:50:24 +0000 (14:50 +0000)
committer	Vsevolod Stakhov <vsevolod@highsecure.ru>
	Mon, 23 Mar 2020 14:50:24 +0000 (14:50 +0000)
src/libmime/message.c		patch \| blob \| history
src/libserver/url.c		patch \| blob \| history