baaaea5f44051d5f7f6858223855b8462098dfaf
[privoxy.git] / filters.c
1 /*********************************************************************
2  *
3  * File        :  $Source: /cvsroot/ijbswa/current/filters.c,v $
4  *
5  * Purpose     :  Declares functions to parse/crunch headers and pages.
6  *
7  * Copyright   :  Written by and Copyright (C) 2001-2020 the
8  *                Privoxy team. https://www.privoxy.org/
9  *
10  *                Based on the Internet Junkbuster originally written
11  *                by and Copyright (C) 1997 Anonymous Coders and
12  *                Junkbusters Corporation.  http://www.junkbusters.com
13  *
14  *                This program is free software; you can redistribute it
15  *                and/or modify it under the terms of the GNU General
16  *                Public License as published by the Free Software
17  *                Foundation; either version 2 of the License, or (at
18  *                your option) any later version.
19  *
20  *                This program is distributed in the hope that it will
21  *                be useful, but WITHOUT ANY WARRANTY; without even the
22  *                implied warranty of MERCHANTABILITY or FITNESS FOR A
23  *                PARTICULAR PURPOSE.  See the GNU General Public
24  *                License for more details.
25  *
26  *                The GNU General Public License should be included with
27  *                this file.  If not, you can view it at
28  *                http://www.gnu.org/copyleft/gpl.html
29  *                or write to the Free Software Foundation, Inc., 59
30  *                Temple Place - Suite 330, Boston, MA  02111-1307, USA.
31  *
32  *********************************************************************/
33
34
35 #include "config.h"
36
37 #include <stdio.h>
38 #include <sys/types.h>
39 #include <stdlib.h>
40 #include <ctype.h>
41 #include <string.h>
42 #include <assert.h>
43
44 #ifndef _WIN32
45 #include <unistd.h>
46 #include <netinet/in.h>
47 #else
48 #include <winsock2.h>
49 #endif /* ndef _WIN32 */
50
51 #include "project.h"
52 #include "filters.h"
53 #include "encode.h"
54 #include "parsers.h"
55 #include "ssplit.h"
56 #include "errlog.h"
57 #include "jbsockets.h"
58 #include "miscutil.h"
59 #include "actions.h"
60 #include "cgi.h"
61 #include "jcc.h"
62 #include "list.h"
63 #include "deanimate.h"
64 #include "urlmatch.h"
65 #include "loaders.h"
66 #ifdef FEATURE_CLIENT_TAGS
67 #include "client-tags.h"
68 #endif
69 #ifdef FEATURE_HTTPS_INSPECTION
70 #include "ssl.h"
71 #endif
72
73 #ifdef _WIN32
74 #include "win32.h"
75 #endif
76
77 typedef char *(*filter_function_ptr)();
78 static filter_function_ptr get_filter_function(const struct client_state *csp);
79 static jb_err prepare_for_filtering(struct client_state *csp);
80 static void apply_url_actions(struct current_action_spec *action,
81                               struct http_request *http,
82 #ifdef FEATURE_CLIENT_TAGS
83                               const struct list *client_tags,
84 #endif
85                               struct url_actions *b);
86
87 #ifdef FEATURE_EXTENDED_STATISTICS
88 static void increment_block_reason_counter(const char *block_reason);
89 #endif
90
91 #ifdef FEATURE_ACL
92 #ifdef HAVE_RFC2553
93 /*********************************************************************
94  *
95  * Function    :  sockaddr_storage_to_ip
96  *
97  * Description :  Access internal structure of sockaddr_storage
98  *
99  * Parameters  :
100  *          1  :  addr = socket address
101  *          2  :  ip   = IP address as array of octets in network order
102  *                       (it points into addr)
103  *          3  :  len  = length of IP address in octets
104  *          4  :  port = port number in network order;
105  *
106  * Returns     :  void
107  *
108  *********************************************************************/
109 static void sockaddr_storage_to_ip(const struct sockaddr_storage *addr,
110                                    uint8_t **ip, unsigned int *len,
111                                    in_port_t **port)
112 {
113    assert(NULL != addr);
114    assert(addr->ss_family == AF_INET || addr->ss_family == AF_INET6);
115
116    switch (addr->ss_family)
117    {
118       case AF_INET:
119          if (NULL != len)
120          {
121             *len = 4;
122          }
123          if (NULL != ip)
124          {
125             *ip = (uint8_t *)
126                &(((struct sockaddr_in *)addr)->sin_addr.s_addr);
127          }
128          if (NULL != port)
129          {
130             *port = &((struct sockaddr_in *)addr)->sin_port;
131          }
132          break;
133
134       case AF_INET6:
135          if (NULL != len)
136          {
137             *len = 16;
138          }
139          if (NULL != ip)
140          {
141             *ip = ((struct sockaddr_in6 *)addr)->sin6_addr.s6_addr;
142          }
143          if (NULL != port)
144          {
145             *port = &((struct sockaddr_in6 *)addr)->sin6_port;
146          }
147          break;
148
149    }
150 }
151
152
153 /*********************************************************************
154  *
155  * Function    :  match_sockaddr
156  *
157  * Description :  Check whether address matches network (IP address and port)
158  *
159  * Parameters  :
160  *          1  :  network = socket address of subnework
161  *          2  :  netmask = network mask as socket address
162  *          3  :  address = checked socket address against given network
163  *
164  * Returns     :  0 = doesn't match; 1 = does match
165  *
166  *********************************************************************/
167 static int match_sockaddr(const struct sockaddr_storage *network,
168                           const struct sockaddr_storage *netmask,
169                           const struct sockaddr_storage *address)
170 {
171    uint8_t *network_addr, *netmask_addr, *address_addr;
172    unsigned int addr_len;
173    in_port_t *network_port, *netmask_port, *address_port;
174    int i;
175
176    if (network->ss_family != netmask->ss_family)
177    {
178       /* This should never happen */
179       assert(network->ss_family == netmask->ss_family);
180       log_error(LOG_LEVEL_FATAL, "Network and netmask differ in family.");
181    }
182
183    sockaddr_storage_to_ip(network, &network_addr, &addr_len, &network_port);
184    sockaddr_storage_to_ip(netmask, &netmask_addr, NULL, &netmask_port);
185    sockaddr_storage_to_ip(address, &address_addr, NULL, &address_port);
186
187    /* Check for family */
188    if ((network->ss_family == AF_INET) && (address->ss_family == AF_INET6)
189       && IN6_IS_ADDR_V4MAPPED((struct in6_addr *)address_addr))
190    {
191       /* Map AF_INET6 V4MAPPED address into AF_INET */
192       address_addr += 12;
193       addr_len = 4;
194    }
195    else if ((network->ss_family == AF_INET6) && (address->ss_family == AF_INET)
196       && IN6_IS_ADDR_V4MAPPED((struct in6_addr *)network_addr))
197    {
198       /* Map AF_INET6 V4MAPPED network into AF_INET */
199       network_addr += 12;
200       netmask_addr += 12;
201       addr_len = 4;
202    }
203
204    /* XXX: Port check is signaled in netmask */
205    if (*netmask_port && *network_port != *address_port)
206    {
207       return 0;
208    }
209
210    /* TODO: Optimize by checking by words instead of octets */
211    for (i = 0; (i < addr_len) && netmask_addr[i]; i++)
212    {
213       if ((network_addr[i] & netmask_addr[i]) !=
214           (address_addr[i] & netmask_addr[i]))
215       {
216          return 0;
217       }
218    }
219
220    return 1;
221 }
222 #endif /* def HAVE_RFC2553 */
223
224
225 /*********************************************************************
226  *
227  * Function    :  block_acl
228  *
229  * Description :  Block this request?
230  *                Decide yes or no based on ACL file.
231  *
232  * Parameters  :
233  *          1  :  dst = The proxy or gateway address this is going to.
234  *                      Or NULL to check all possible targets.
235  *          2  :  csp = Current client state (buffers, headers, etc...)
236  *                      Also includes the client IP address.
237  *
238  * Returns     : 0 = FALSE (don't block) and 1 = TRUE (do block)
239  *
240  *********************************************************************/
241 int block_acl(const struct access_control_addr *dst, const struct client_state *csp)
242 {
243    struct access_control_list *acl = csp->config->acl;
244
245    /* if not using an access control list, then permit the connection */
246    if (acl == NULL)
247    {
248       return(0);
249    }
250
251    /* search the list */
252    while (acl != NULL)
253    {
254       if (
255 #ifdef HAVE_RFC2553
256             match_sockaddr(&acl->src->addr, &acl->src->mask, &csp->tcp_addr)
257 #else
258             (csp->ip_addr_long & acl->src->mask) == acl->src->addr
259 #endif
260             )
261       {
262          if (dst == NULL)
263          {
264             /* Just want to check if they have any access */
265             if (acl->action == ACL_PERMIT)
266             {
267                return(0);
268             }
269             else
270             {
271                return(1);
272             }
273          }
274          else if (
275 #ifdef HAVE_RFC2553
276                /*
277                 * XXX: An undefined acl->dst is full of zeros and should be
278                 * considered a wildcard address. sockaddr_storage_to_ip()
279                 * fails on such destinations because of unknown sa_familly
280                 * (glibc only?). However this test is not portable.
281                 *
282                 * So, we signal the acl->dst is wildcard in wildcard_dst.
283                 */
284                acl->wildcard_dst ||
285                   match_sockaddr(&acl->dst->addr, &acl->dst->mask, &dst->addr)
286 #else
287                ((dst->addr & acl->dst->mask) == acl->dst->addr)
288            && ((dst->port == acl->dst->port) || (acl->dst->port == 0))
289 #endif
290            )
291          {
292             if (acl->action == ACL_PERMIT)
293             {
294                return(0);
295             }
296             else
297             {
298                return(1);
299             }
300          }
301       }
302       acl = acl->next;
303    }
304
305    return(1);
306
307 }
308
309
310 /*********************************************************************
311  *
312  * Function    :  acl_addr
313  *
314  * Description :  Called from `load_config' to parse an ACL address.
315  *
316  * Parameters  :
317  *          1  :  aspec = String specifying ACL address.
318  *          2  :  aca = struct access_control_addr to fill in.
319  *
320  * Returns     :  0 => Ok, everything else is an error.
321  *
322  *********************************************************************/
323 int acl_addr(const char *aspec, struct access_control_addr *aca)
324 {
325    int i, masklength;
326 #ifdef HAVE_RFC2553
327    struct addrinfo hints, *result;
328    uint8_t *mask_data;
329    in_port_t *mask_port;
330    unsigned int addr_len;
331 #else
332    long port;
333 #endif /* def HAVE_RFC2553 */
334    char *p;
335    char *acl_spec = NULL;
336
337 #ifdef HAVE_RFC2553
338    /* XXX: Depend on ai_family */
339    masklength = 128;
340 #else
341    masklength = 32;
342    port       =  0;
343 #endif
344
345    /*
346     * Use a temporary acl spec copy so we can log
347     * the unmodified original in case of parse errors.
348     */
349    acl_spec = strdup_or_die(aspec);
350
351    if ((p = strchr(acl_spec, '/')) != NULL)
352    {
353       *p++ = '\0';
354       if (privoxy_isdigit(*p) == 0)
355       {
356          freez(acl_spec);
357          return(-1);
358       }
359       masklength = atoi(p);
360    }
361
362    if ((masklength < 0) ||
363 #ifdef HAVE_RFC2553
364          (masklength > 128)
365 #else
366          (masklength > 32)
367 #endif
368          )
369    {
370       freez(acl_spec);
371       return(-1);
372    }
373
374    if ((*acl_spec == '[') && (NULL != (p = strchr(acl_spec, ']'))))
375    {
376       *p = '\0';
377       memmove(acl_spec, acl_spec + 1, (size_t)(p - acl_spec));
378
379       if (*++p != ':')
380       {
381          p = NULL;
382       }
383    }
384    else
385    {
386       p = strchr(acl_spec, ':');
387    }
388    if (p != NULL)
389    {
390       assert(*p == ':');
391       *p = '\0';
392       p++;
393    }
394
395 #ifdef HAVE_RFC2553
396    memset(&hints, 0, sizeof(struct addrinfo));
397    hints.ai_family = AF_UNSPEC;
398    hints.ai_socktype = SOCK_STREAM;
399
400    i = getaddrinfo(acl_spec, p, &hints, &result);
401
402    if (i != 0)
403    {
404       log_error(LOG_LEVEL_ERROR, "Can not resolve [%s]:%s: %s",
405          acl_spec, p, gai_strerror(i));
406       freez(acl_spec);
407       return(-1);
408    }
409    freez(acl_spec);
410
411    /* TODO: Allow multihomed hostnames */
412    memcpy(&(aca->addr), result->ai_addr, result->ai_addrlen);
413    freeaddrinfo(result);
414 #else
415    if (p != NULL)
416    {
417       char *endptr;
418
419       port = strtol(p, &endptr, 10);
420
421       if (port <= 0 || port > 65535 || *endptr != '\0')
422       {
423          freez(acl_spec);
424          return(-1);
425       }
426    }
427
428    aca->port = (unsigned long)port;
429
430    aca->addr = ntohl(resolve_hostname_to_ip(acl_spec));
431    freez(acl_spec);
432
433    if (aca->addr == INADDR_NONE)
434    {
435       /* XXX: This will be logged as parse error. */
436       return(-1);
437    }
438 #endif /* def HAVE_RFC2553 */
439
440    /* build the netmask */
441 #ifdef HAVE_RFC2553
442    /* Clip masklength according to current family. */
443    if ((aca->addr.ss_family == AF_INET) && (masklength > 32))
444    {
445       masklength = 32;
446    }
447
448    aca->mask.ss_family = aca->addr.ss_family;
449    sockaddr_storage_to_ip(&aca->mask, &mask_data, &addr_len, &mask_port);
450
451    if (p)
452    {
453       /* ACL contains a port number, check ports in the future. */
454       *mask_port = 1;
455    }
456
457    /*
458     * XXX: This could be optimized to operate on whole words instead
459     * of octets (128-bit CPU could do it in one iteration).
460     */
461    /*
462     * Octets after prefix can be omitted because of
463     * previous initialization to zeros.
464     */
465    for (i = 0; (i < addr_len) && masklength; i++)
466    {
467       if (masklength >= 8)
468       {
469          mask_data[i] = 0xFF;
470          masklength -= 8;
471       }
472       else
473       {
474          /*
475           * XXX: This assumes MSB of octet is on the left side.
476           * This should be true for all architectures or solved
477           * by the link layer.
478           */
479          mask_data[i] = (uint8_t)~((1 << (8 - masklength)) - 1);
480          masklength = 0;
481       }
482    }
483
484 #else
485    aca->mask = 0;
486    for (i=1; i <= masklength ; i++)
487    {
488       aca->mask |= (1U << (32 - i));
489    }
490
491    /* now mask off the host portion of the ip address
492     * (i.e. save on the network portion of the address).
493     */
494    aca->addr = aca->addr & aca->mask;
495 #endif /* def HAVE_RFC2553 */
496
497    return(0);
498
499 }
500 #endif /* def FEATURE_ACL */
501
502
503 /*********************************************************************
504  *
505  * Function    :  connect_port_is_forbidden
506  *
507  * Description :  Check to see if CONNECT requests to the destination
508  *                port of this request are forbidden. The check is
509  *                independent of the actual request method.
510  *
511  * Parameters  :
512  *          1  :  csp = Current client state (buffers, headers, etc...)
513  *
514  * Returns     :  True if yes, false otherwise.
515  *
516  *********************************************************************/
517 int connect_port_is_forbidden(const struct client_state *csp)
518 {
519    return ((csp->action->flags & ACTION_LIMIT_CONNECT) &&
520      !match_portlist(csp->action->string[ACTION_STRING_LIMIT_CONNECT],
521         csp->http->port));
522 }
523
524
525 /*********************************************************************
526  *
527  * Function    :  block_url
528  *
529  * Description :  Called from `chat'.  Check to see if we need to block this.
530  *
531  * Parameters  :
532  *          1  :  csp = Current client state (buffers, headers, etc...)
533  *
534  * Returns     :  NULL => unblocked, else HTTP block response
535  *
536  *********************************************************************/
537 struct http_response *block_url(struct client_state *csp)
538 {
539    struct http_response *rsp;
540    const char *new_content_type = NULL;
541
542    /*
543     * If it's not blocked, don't block it ;-)
544     */
545    if ((csp->action->flags & ACTION_BLOCK) == 0)
546    {
547       return NULL;
548    }
549    if (csp->action->flags & ACTION_REDIRECT)
550    {
551       log_error(LOG_LEVEL_ERROR, "redirect{} overruled by block.");
552    }
553    /*
554     * Else, prepare a response
555     */
556    if (NULL == (rsp = alloc_http_response()))
557    {
558       return cgi_error_memory();
559    }
560
561 #ifdef FEATURE_EXTENDED_STATISTICS
562    if (csp->action->string[ACTION_STRING_BLOCK] != NULL)
563    {
564       increment_block_reason_counter(csp->action->string[ACTION_STRING_BLOCK]);
565    }
566 #endif
567
568    /*
569     * If it's an image-url, send back an image or redirect
570     * as specified by the relevant +image action
571     */
572 #ifdef FEATURE_IMAGE_BLOCKING
573    if (((csp->action->flags & ACTION_IMAGE_BLOCKER) != 0)
574         && is_imageurl(csp))
575    {
576       char *p;
577       /* determine HOW images should be blocked */
578       p = csp->action->string[ACTION_STRING_IMAGE_BLOCKER];
579
580       if (csp->action->flags & ACTION_HANDLE_AS_EMPTY_DOCUMENT)
581       {
582          log_error(LOG_LEVEL_ERROR, "handle-as-empty-document overruled by handle-as-image.");
583       }
584
585       /* and handle accordingly: */
586       if ((p == NULL) || (0 == strcmpic(p, "pattern")))
587       {
588          rsp->status = strdup_or_die("403 Request blocked by Privoxy");
589          rsp->body = bindup(image_pattern_data, image_pattern_length);
590          if (rsp->body == NULL)
591          {
592             free_http_response(rsp);
593             return cgi_error_memory();
594          }
595          rsp->content_length = image_pattern_length;
596
597          if (enlist_unique_header(rsp->headers, "Content-Type", BUILTIN_IMAGE_MIMETYPE))
598          {
599             free_http_response(rsp);
600             return cgi_error_memory();
601          }
602       }
603       else if (0 == strcmpic(p, "blank"))
604       {
605          rsp->status = strdup_or_die("403 Request blocked by Privoxy");
606          rsp->body = bindup(image_blank_data, image_blank_length);
607          if (rsp->body == NULL)
608          {
609             free_http_response(rsp);
610             return cgi_error_memory();
611          }
612          rsp->content_length = image_blank_length;
613
614          if (enlist_unique_header(rsp->headers, "Content-Type", BUILTIN_IMAGE_MIMETYPE))
615          {
616             free_http_response(rsp);
617             return cgi_error_memory();
618          }
619       }
620       else
621       {
622          rsp->status = strdup_or_die("302 Local Redirect from Privoxy");
623
624          if (enlist_unique_header(rsp->headers, "Location", p))
625          {
626             free_http_response(rsp);
627             return cgi_error_memory();
628          }
629       }
630
631    }
632    else
633 #endif /* def FEATURE_IMAGE_BLOCKING */
634    if (csp->action->flags & ACTION_HANDLE_AS_EMPTY_DOCUMENT)
635    {
636      /*
637       *  Send empty document.
638       */
639       new_content_type = csp->action->string[ACTION_STRING_CONTENT_TYPE];
640
641       freez(rsp->body);
642       rsp->body = strdup_or_die(" ");
643       rsp->content_length = 1;
644
645       if (csp->config->feature_flags & RUNTIME_FEATURE_EMPTY_DOC_RETURNS_OK)
646       {
647          /*
648           * Workaround for firefox bug 492459
649           *   https://bugzilla.mozilla.org/show_bug.cgi?id=492459
650           * Return a 200 OK status for pages blocked with +handle-as-empty-document
651           * if the "handle-as-empty-doc-returns-ok" runtime config option is set.
652           */
653          rsp->status = strdup_or_die("200 Request blocked by Privoxy");
654       }
655       else
656       {
657          rsp->status = strdup_or_die("403 Request blocked by Privoxy");
658       }
659
660       if (new_content_type != 0)
661       {
662          log_error(LOG_LEVEL_HEADER, "Overwriting Content-Type with %s", new_content_type);
663          if (enlist_unique_header(rsp->headers, "Content-Type", new_content_type))
664          {
665             free_http_response(rsp);
666             return cgi_error_memory();
667          }
668       }
669    }
670    else
671
672    /*
673     * Else, generate an HTML "blocked" message:
674     */
675    {
676       jb_err err;
677       struct map * exports;
678
679       rsp->status = strdup_or_die("403 Request blocked by Privoxy");
680
681       exports = default_exports(csp, NULL);
682       if (exports == NULL)
683       {
684          free_http_response(rsp);
685          return cgi_error_memory();
686       }
687
688 #ifdef FEATURE_FORCE_LOAD
689       err = map(exports, "force-prefix", 1, FORCE_PREFIX, 1);
690       /*
691        * Export the force conditional block killer if
692        *
693        * - Privoxy was compiled without FEATURE_FORCE_LOAD, or
694        * - Privoxy is configured to enforce blocks, or
695        * - it's a CONNECT request and enforcing wouldn't work anyway.
696        */
697       if ((csp->config->feature_flags & RUNTIME_FEATURE_ENFORCE_BLOCKS)
698        || (0 == strcmpic(csp->http->gpc, "connect")))
699 #endif /* ndef FEATURE_FORCE_LOAD */
700       {
701          err = map_block_killer(exports, "force-support");
702       }
703
704       if (!err) err = map(exports, "protocol", 1, csp->http->ssl ? "https://" : "http://", 1);
705       if (!err) err = map(exports, "hostport", 1, html_encode(csp->http->hostport), 0);
706       if (!err) err = map(exports, "path", 1, html_encode(csp->http->path), 0);
707       if (!err) err = map(exports, "path-ue", 1, url_encode(csp->http->path), 0);
708       if (!err)
709       {
710          const char *block_reason;
711          if (csp->action->string[ACTION_STRING_BLOCK] != NULL)
712          {
713             block_reason = csp->action->string[ACTION_STRING_BLOCK];
714          }
715          else
716          {
717             assert(connect_port_is_forbidden(csp));
718             block_reason = "Forbidden CONNECT port.";
719          }
720          err = map(exports, "block-reason", 1, html_encode(block_reason), 0);
721       }
722       if (err)
723       {
724          free_map(exports);
725          free_http_response(rsp);
726          return cgi_error_memory();
727       }
728
729       err = template_fill_for_cgi(csp, "blocked", exports, rsp);
730       if (err)
731       {
732          free_http_response(rsp);
733          return cgi_error_memory();
734       }
735    }
736    rsp->crunch_reason = BLOCKED;
737
738    return finish_http_response(csp, rsp);
739
740 }
741
742
743 #ifdef FEATURE_TRUST
744 /*********************************************************************
745  *
746  * Function    :  trust_url FIXME: I should be called distrust_url
747  *
748  * Description :  Calls is_untrusted_url to determine if the URL is trusted
749  *                and if not, returns a HTTP 403 response with a reject message.
750  *
751  * Parameters  :
752  *          1  :  csp = Current client state (buffers, headers, etc...)
753  *
754  * Returns     :  NULL => trusted, else http_response.
755  *
756  *********************************************************************/
757 struct http_response *trust_url(struct client_state *csp)
758 {
759    struct http_response *rsp;
760    struct map * exports;
761    char buf[BUFFER_SIZE];
762    char *p;
763    struct pattern_spec **tl;
764    struct pattern_spec *t;
765    jb_err err;
766
767    /*
768     * Don't bother to work on trusted URLs
769     */
770    if (!is_untrusted_url(csp))
771    {
772       return NULL;
773    }
774
775    /*
776     * Else, prepare a response:
777     */
778    if (NULL == (rsp = alloc_http_response()))
779    {
780       return cgi_error_memory();
781    }
782
783    rsp->status = strdup_or_die("403 Request blocked by Privoxy");
784    exports = default_exports(csp, NULL);
785    if (exports == NULL)
786    {
787       free_http_response(rsp);
788       return cgi_error_memory();
789    }
790
791    /*
792     * Export the protocol, host, port, and referrer information
793     */
794    err = map(exports, "hostport", 1, csp->http->hostport, 1);
795    if (!err) err = map(exports, "protocol", 1, csp->http->ssl ? "https://" : "http://", 1);
796    if (!err) err = map(exports, "path", 1, csp->http->path, 1);
797
798    if (NULL != (p = get_header_value(csp->headers, "Referer:")))
799    {
800       if (!err) err = map(exports, "referrer", 1, html_encode(p), 0);
801    }
802    else
803    {
804       if (!err) err = map(exports, "referrer", 1, "none set", 1);
805    }
806
807    if (err)
808    {
809       free_map(exports);
810       free_http_response(rsp);
811       return cgi_error_memory();
812    }
813
814    /*
815     * Export the trust list
816     */
817    p = strdup_or_die("");
818    for (tl = csp->config->trust_list; (t = *tl) != NULL ; tl++)
819    {
820       snprintf(buf, sizeof(buf), "<li>%s</li>\n", t->spec);
821       string_append(&p, buf);
822    }
823    err = map(exports, "trusted-referrers", 1, p, 0);
824
825    if (err)
826    {
827       free_map(exports);
828       free_http_response(rsp);
829       return cgi_error_memory();
830    }
831
832    /*
833     * Export the trust info, if available
834     */
835    if (csp->config->trust_info->first)
836    {
837       struct list_entry *l;
838
839       p = strdup_or_die("");
840       for (l = csp->config->trust_info->first; l ; l = l->next)
841       {
842          snprintf(buf, sizeof(buf), "<li> <a href=\"%s\">%s</a><br>\n", l->str, l->str);
843          string_append(&p, buf);
844       }
845       err = map(exports, "trust-info", 1, p, 0);
846    }
847    else
848    {
849       err = map_block_killer(exports, "have-trust-info");
850    }
851
852    if (err)
853    {
854       free_map(exports);
855       free_http_response(rsp);
856       return cgi_error_memory();
857    }
858
859    /*
860     * Export the force conditional block killer if
861     *
862     * - Privoxy was compiled without FEATURE_FORCE_LOAD, or
863     * - Privoxy is configured to enforce blocks, or
864     * - it's a CONNECT request and enforcing wouldn't work anyway.
865     */
866 #ifdef FEATURE_FORCE_LOAD
867    if ((csp->config->feature_flags & RUNTIME_FEATURE_ENFORCE_BLOCKS)
868     || (0 == strcmpic(csp->http->gpc, "connect")))
869    {
870       err = map_block_killer(exports, "force-support");
871    }
872    else
873    {
874       err = map(exports, "force-prefix", 1, FORCE_PREFIX, 1);
875    }
876 #else /* ifndef FEATURE_FORCE_LOAD */
877    err = map_block_killer(exports, "force-support");
878 #endif /* ndef FEATURE_FORCE_LOAD */
879
880    if (err)
881    {
882       free_map(exports);
883       free_http_response(rsp);
884       return cgi_error_memory();
885    }
886
887    /*
888     * Build the response
889     */
890    err = template_fill_for_cgi(csp, "untrusted", exports, rsp);
891    if (err)
892    {
893       free_http_response(rsp);
894       return cgi_error_memory();
895    }
896    rsp->crunch_reason = UNTRUSTED;
897
898    return finish_http_response(csp, rsp);
899 }
900 #endif /* def FEATURE_TRUST */
901
902
903 /*********************************************************************
904  *
905  * Function    :  compile_dynamic_pcrs_job_list
906  *
907  * Description :  Compiles a dynamic pcrs job list (one with variables
908  *                resolved at request time)
909  *
910  * Parameters  :
911  *          1  :  csp = Current client state (buffers, headers, etc...)
912  *          2  :  b = The filter list to compile
913  *
914  * Returns     :  NULL in case of errors, otherwise the
915  *                pcrs job list.
916  *
917  *********************************************************************/
918 pcrs_job *compile_dynamic_pcrs_job_list(const struct client_state *csp, const struct re_filterfile_spec *b)
919 {
920    struct list_entry *pattern;
921    pcrs_job *job_list = NULL;
922    pcrs_job *dummy = NULL;
923    pcrs_job *lastjob = NULL;
924    int error = 0;
925
926    const struct pcrs_variable variables[] =
927    {
928       {"url",    csp->http->url,   1},
929       {"path",   csp->http->path,  1},
930       {"host",   csp->http->host,  1},
931       {"origin", csp->ip_addr_str, 1},
932       {"listen-address", csp->listen_addr_str, 1},
933       {NULL,     NULL,             1}
934    };
935
936    for (pattern = b->patterns->first; pattern != NULL; pattern = pattern->next)
937    {
938       assert(pattern->str != NULL);
939
940       dummy = pcrs_compile_dynamic_command(pattern->str, variables, &error);
941       if (NULL == dummy)
942       {
943          log_error(LOG_LEVEL_ERROR,
944             "Compiling dynamic pcrs job '%s' for '%s' failed with error code %d: %s",
945             pattern->str, b->name, error, pcrs_strerror(error));
946          continue;
947       }
948       else
949       {
950          if (error == PCRS_WARN_TRUNCATION)
951          {
952             log_error(LOG_LEVEL_ERROR,
953                "At least one of the variables in \'%s\' had to "
954                "be truncated before compilation", pattern->str);
955          }
956          if (job_list == NULL)
957          {
958             job_list = dummy;
959          }
960          else
961          {
962             lastjob->next = dummy;
963          }
964          lastjob = dummy;
965       }
966    }
967
968    return job_list;
969 }
970
971
972 /*********************************************************************
973  *
974  * Function    :  rewrite_url
975  *
976  * Description :  Rewrites a URL with a single pcrs command
977  *                and returns the result if it differs from the
978  *                original and isn't obviously invalid.
979  *
980  * Parameters  :
981  *          1  :  old_url = URL to rewrite.
982  *          2  :  pcrs_command = pcrs command formatted as string (s@foo@bar@)
983  *
984  *
985  * Returns     :  NULL if the pcrs_command didn't change the url, or
986  *                the result of the modification.
987  *
988  *********************************************************************/
989 char *rewrite_url(char *old_url, const char *pcrs_command)
990 {
991    char *new_url = NULL;
992    int hits;
993
994    assert(old_url);
995    assert(pcrs_command);
996
997    new_url = pcrs_execute_single_command(old_url, pcrs_command, &hits);
998
999    if (hits == 0)
1000    {
1001       log_error(LOG_LEVEL_REDIRECTS,
1002          "pcrs command \"%s\" didn't change \"%s\".",
1003          pcrs_command, old_url);
1004       freez(new_url);
1005    }
1006    else if (hits < 0)
1007    {
1008       log_error(LOG_LEVEL_REDIRECTS,
1009          "executing pcrs command \"%s\" to rewrite %s failed: %s",
1010          pcrs_command, old_url, pcrs_strerror(hits));
1011       freez(new_url);
1012    }
1013    else if (strncmpic(new_url, "http://", 7) && strncmpic(new_url, "https://", 8))
1014    {
1015       log_error(LOG_LEVEL_ERROR,
1016          "pcrs command \"%s\" changed \"%s\" to \"%s\" (%u hi%s), "
1017          "but the result doesn't look like a valid URL and will be ignored.",
1018          pcrs_command, old_url, new_url, hits, (hits == 1) ? "t" : "ts");
1019       freez(new_url);
1020    }
1021    else
1022    {
1023       log_error(LOG_LEVEL_REDIRECTS,
1024          "pcrs command \"%s\" changed \"%s\" to \"%s\" (%u hi%s).",
1025          pcrs_command, old_url, new_url, hits, (hits == 1) ? "t" : "ts");
1026    }
1027
1028    return new_url;
1029
1030 }
1031
1032
1033 #ifdef FEATURE_FAST_REDIRECTS
1034 /*********************************************************************
1035  *
1036  * Function    :  get_last_url
1037  *
1038  * Description :  Search for the last URL inside a string.
1039  *                If the string already is a URL, it will
1040  *                be the first URL found.
1041  *
1042  * Parameters  :
1043  *          1  :  subject = the string to check
1044  *          2  :  redirect_mode = +fast-redirect{} mode
1045  *
1046  * Returns     :  NULL if no URL was found, or
1047  *                the last URL found.
1048  *
1049  *********************************************************************/
1050 static char *get_last_url(char *subject, const char *redirect_mode)
1051 {
1052    char *new_url = NULL;
1053    char *tmp;
1054
1055    assert(subject);
1056    assert(redirect_mode);
1057
1058    subject = strdup(subject);
1059    if (subject == NULL)
1060    {
1061       log_error(LOG_LEVEL_ERROR, "Out of memory while searching for redirects.");
1062       return NULL;
1063    }
1064
1065    if (0 == strcmpic(redirect_mode, "check-decoded-url") && strchr(subject, '%'))
1066    {
1067       char *url_segment = NULL;
1068       char **url_segments;
1069       size_t max_segments;
1070       int segments;
1071
1072       log_error(LOG_LEVEL_REDIRECTS,
1073          "Checking \"%s\" for encoded redirects.", subject);
1074
1075       /*
1076        * Check each parameter in the URL separately.
1077        * Sectionize the URL at "?" and "&",
1078        * go backwards through the segments, URL-decode them
1079        * and look for a URL in the decoded result.
1080        * Stop the search after the first match.
1081        *
1082        * XXX: This estimate is guaranteed to be high enough as we
1083        *      let ssplit() ignore empty fields, but also a bit wasteful.
1084        */
1085       max_segments = strlen(subject) / 2;
1086       url_segments = malloc(max_segments * sizeof(char *));
1087
1088       if (NULL == url_segments)
1089       {
1090          log_error(LOG_LEVEL_ERROR,
1091             "Out of memory while decoding URL: %s", subject);
1092          freez(subject);
1093          return NULL;
1094       }
1095
1096       segments = ssplit(subject, "?&", url_segments, max_segments);
1097
1098       while (segments-- > 0)
1099       {
1100          char *dtoken = url_decode(url_segments[segments]);
1101          if (NULL == dtoken)
1102          {
1103             log_error(LOG_LEVEL_ERROR, "Unable to decode \"%s\".", url_segments[segments]);
1104             continue;
1105          }
1106          url_segment = strstr(dtoken, "http://");
1107          if (NULL == url_segment)
1108          {
1109             url_segment = strstr(dtoken, "https://");
1110          }
1111          if (NULL != url_segment)
1112          {
1113             url_segment = strdup_or_die(url_segment);
1114             freez(dtoken);
1115             break;
1116          }
1117          freez(dtoken);
1118       }
1119       freez(subject);
1120       freez(url_segments);
1121
1122       if (url_segment == NULL)
1123       {
1124          return NULL;
1125       }
1126       subject = url_segment;
1127    }
1128    else
1129    {
1130       /* Look for a URL inside this one, without decoding anything. */
1131       log_error(LOG_LEVEL_REDIRECTS,
1132          "Checking \"%s\" for unencoded redirects.", subject);
1133    }
1134
1135    /*
1136     * Find the last URL encoded in the request
1137     */
1138    tmp = subject;
1139    while ((tmp = strstr(tmp, "http://")) != NULL)
1140    {
1141       new_url = tmp++;
1142    }
1143    tmp = (new_url != NULL) ? new_url : subject;
1144    while ((tmp = strstr(tmp, "https://")) != NULL)
1145    {
1146       new_url = tmp++;
1147    }
1148
1149    if ((new_url != NULL)
1150       && (  (new_url != subject)
1151          || (0 == strncmpic(subject, "http://", 7))
1152          || (0 == strncmpic(subject, "https://", 8))
1153          ))
1154    {
1155       /*
1156        * Return new URL if we found a redirect
1157        * or if the subject already was a URL.
1158        *
1159        * The second case makes sure that we can
1160        * chain get_last_url after another redirection check
1161        * (like rewrite_url) without losing earlier redirects.
1162        */
1163       new_url = strdup(new_url);
1164       freez(subject);
1165       return new_url;
1166    }
1167
1168    freez(subject);
1169    return NULL;
1170
1171 }
1172 #endif /* def FEATURE_FAST_REDIRECTS */
1173
1174
1175 /*********************************************************************
1176  *
1177  * Function    :  redirect_url
1178  *
1179  * Description :  Checks if Privoxy should answer the request with
1180  *                a HTTP redirect and generates the redirect if
1181  *                necessary.
1182  *
1183  * Parameters  :
1184  *          1  :  csp = Current client state (buffers, headers, etc...)
1185  *
1186  * Returns     :  NULL if the request can pass, HTTP redirect otherwise.
1187  *
1188  *********************************************************************/
1189 struct http_response *redirect_url(struct client_state *csp)
1190 {
1191    struct http_response *rsp;
1192 #ifdef FEATURE_FAST_REDIRECTS
1193    /*
1194     * XXX: Do we still need FEATURE_FAST_REDIRECTS
1195     * as compile-time option? The user can easily disable
1196     * it in his action file.
1197     */
1198    char * redirect_mode;
1199 #endif /* def FEATURE_FAST_REDIRECTS */
1200    char *new_url = NULL;
1201    char *redirection_string;
1202
1203    if ((csp->action->flags & ACTION_REDIRECT))
1204    {
1205       redirection_string = csp->action->string[ACTION_STRING_REDIRECT];
1206
1207       /*
1208        * If the redirection string begins with 's',
1209        * assume it's a pcrs command, otherwise treat it as
1210        * properly formatted URL and use it for the redirection
1211        * directly.
1212        *
1213        * According to (the now obsolete) RFC 2616 section 14.30
1214        * the URL has to be absolute and if the user tries:
1215        * +redirect{sadly/this/will/be/parsed/as/pcrs_command.html}
1216        * she would get undefined results anyway.
1217        *
1218        * RFC 7231 7.1.2 actually allows relative references,
1219        * but those start with a leading slash (RFC 3986 4.2) and
1220        * thus can't be mistaken for pcrs commands either.
1221        */
1222
1223       if (*redirection_string == 's')
1224       {
1225          char *requested_url;
1226
1227 #ifdef FEATURE_HTTPS_INSPECTION
1228          if (client_use_ssl(csp))
1229          {
1230             jb_err err;
1231
1232             requested_url = strdup_or_die("https://");
1233             err = string_append(&requested_url, csp->http->hostport);
1234             if (!err) err = string_append(&requested_url, csp->http->path);
1235             if (err)
1236             {
1237                log_error(LOG_LEVEL_FATAL,
1238                   "Failed to rebuild URL 'https://%s%s'",
1239                   csp->http->hostport, csp->http->path);
1240             }
1241          }
1242          else
1243 #endif
1244          {
1245             requested_url = csp->http->url;
1246          }
1247          new_url = rewrite_url(requested_url, redirection_string);
1248 #ifdef FEATURE_HTTPS_INSPECTION
1249          if (requested_url != csp->http->url)
1250          {
1251             assert(client_use_ssl(csp));
1252             freez(requested_url);
1253          }
1254 #endif
1255       }
1256       else
1257       {
1258          log_error(LOG_LEVEL_REDIRECTS,
1259             "No pcrs command recognized, assuming that \"%s\" is already properly formatted.",
1260             redirection_string);
1261          new_url = strdup(redirection_string);
1262       }
1263    }
1264
1265 #ifdef FEATURE_FAST_REDIRECTS
1266    if ((csp->action->flags & ACTION_FAST_REDIRECTS))
1267    {
1268       char *old_url;
1269
1270       redirect_mode = csp->action->string[ACTION_STRING_FAST_REDIRECTS];
1271
1272       /*
1273        * If it exists, use the previously rewritten URL as input
1274        * otherwise just use the old path.
1275        */
1276       old_url = (new_url != NULL) ? new_url : strdup(csp->http->path);
1277       new_url = get_last_url(old_url, redirect_mode);
1278       freez(old_url);
1279    }
1280 #endif /* def FEATURE_FAST_REDIRECTS */
1281
1282    /* Did any redirect action trigger? */
1283    if (new_url)
1284    {
1285       if (url_requires_percent_encoding(new_url))
1286       {
1287          char *encoded_url;
1288          log_error(LOG_LEVEL_REDIRECTS, "Percent-encoding redirect URL: %N",
1289             strlen(new_url), new_url);
1290          encoded_url = percent_encode_url(new_url);
1291          freez(new_url);
1292          if (encoded_url == NULL)
1293          {
1294             return cgi_error_memory();
1295          }
1296          new_url = encoded_url;
1297          assert(FALSE == url_requires_percent_encoding(new_url));
1298       }
1299
1300       if (0 == strcmpic(new_url, csp->http->url))
1301       {
1302          log_error(LOG_LEVEL_ERROR,
1303             "New URL \"%s\" and old URL \"%s\" are the same. Redirection loop prevented.",
1304             csp->http->url, new_url);
1305             freez(new_url);
1306       }
1307       else
1308       {
1309          log_error(LOG_LEVEL_REDIRECTS, "New URL is: %s", new_url);
1310
1311          if (NULL == (rsp = alloc_http_response()))
1312          {
1313             freez(new_url);
1314             return cgi_error_memory();
1315          }
1316
1317          rsp->status = strdup_or_die("302 Local Redirect from Privoxy");
1318          if (enlist_unique_header(rsp->headers, "Location", new_url))
1319          {
1320             freez(new_url);
1321             free_http_response(rsp);
1322             return cgi_error_memory();
1323          }
1324          rsp->crunch_reason = REDIRECTED;
1325          freez(new_url);
1326
1327          return finish_http_response(csp, rsp);
1328       }
1329    }
1330
1331    /* Only reached if no redirect is required */
1332    return NULL;
1333
1334 }
1335
1336
1337 #ifdef FEATURE_IMAGE_BLOCKING
1338 /*********************************************************************
1339  *
1340  * Function    :  is_imageurl
1341  *
1342  * Description :  Given a URL, decide whether it should be treated
1343  *                as image URL or not.
1344  *
1345  * Parameters  :
1346  *          1  :  csp = Current client state (buffers, headers, etc...)
1347  *
1348  * Returns     :  True (nonzero) if URL is an image URL, false (0)
1349  *                otherwise
1350  *
1351  *********************************************************************/
1352 int is_imageurl(const struct client_state *csp)
1353 {
1354    return ((csp->action->flags & ACTION_IMAGE) != 0);
1355
1356 }
1357 #endif /* def FEATURE_IMAGE_BLOCKING */
1358
1359
1360 #ifdef FEATURE_TRUST
1361 /*********************************************************************
1362  *
1363  * Function    :  is_untrusted_url
1364  *
1365  * Description :  Should we "distrust" this URL (and block it)?
1366  *
1367  *                Yes if it matches a line in the trustfile, or if the
1368  *                    referrer matches a line starting with "+" in the
1369  *                    trustfile.
1370  *                No  otherwise.
1371  *
1372  * Parameters  :
1373  *          1  :  csp = Current client state (buffers, headers, etc...)
1374  *
1375  * Returns     :  0 => trusted, 1 => untrusted
1376  *
1377  *********************************************************************/
1378 int is_untrusted_url(const struct client_state *csp)
1379 {
1380    struct file_list *fl;
1381    struct block_spec *b;
1382    struct pattern_spec **trusted_url;
1383    struct http_request rhttp[1];
1384    const char * referer;
1385    jb_err err;
1386
1387    /*
1388     * If we don't have a trustlist, we trust everybody
1389     */
1390    if (((fl = csp->tlist) == NULL) || ((b  = fl->f) == NULL))
1391    {
1392       return 0;
1393    }
1394
1395    memset(rhttp, '\0', sizeof(*rhttp));
1396
1397    /*
1398     * Do we trust the request URL itself?
1399     */
1400    for (b = b->next; b ; b = b->next)
1401    {
1402       if (url_match(b->url, csp->http))
1403       {
1404          return b->reject;
1405       }
1406    }
1407
1408    if (NULL == (referer = get_header_value(csp->headers, "Referer:")))
1409    {
1410       /* no referrer was supplied */
1411       return 1;
1412    }
1413
1414
1415    /*
1416     * If not, do we maybe trust its referrer?
1417     */
1418    err = parse_http_url(referer, rhttp, REQUIRE_PROTOCOL);
1419    if (err)
1420    {
1421       return 1;
1422    }
1423
1424    for (trusted_url = csp->config->trust_list; *trusted_url != NULL; trusted_url++)
1425    {
1426       if (url_match(*trusted_url, rhttp))
1427       {
1428          /* if the URL's referrer is from a trusted referrer, then
1429           * add the target spec to the trustfile as an unblocked
1430           * domain and return 0 (which means it's OK).
1431           */
1432
1433          FILE *fp;
1434
1435          if (NULL != (fp = fopen(csp->config->trustfile, "a")))
1436          {
1437             char * path;
1438             char * path_end;
1439             char * new_entry = strdup_or_die("~");
1440
1441             string_append(&new_entry, csp->http->hostport);
1442
1443             path = csp->http->path;
1444             if ( (path[0] == '/')
1445               && (path[1] == '~')
1446               && ((path_end = strchr(path + 2, '/')) != NULL))
1447             {
1448                /* since this path points into a user's home space
1449                 * be sure to include this spec in the trustfile.
1450                 */
1451                long path_len = path_end - path; /* save offset */
1452                path = strdup(path); /* Copy string */
1453                if (path != NULL)
1454                {
1455                   path_end = path + path_len; /* regenerate ptr to new buffer */
1456                   *(path_end + 1) = '\0'; /* Truncate path after '/' */
1457                }
1458                string_join(&new_entry, path);
1459             }
1460
1461             /*
1462              * Give a reason for generating this entry.
1463              */
1464             string_append(&new_entry, " # Trusted referrer was: ");
1465             string_append(&new_entry, referer);
1466
1467             if (new_entry != NULL)
1468             {
1469                if (-1 == fprintf(fp, "%s\n", new_entry))
1470                {
1471                   log_error(LOG_LEVEL_ERROR, "Failed to append \'%s\' to trustfile \'%s\': %E",
1472                      new_entry, csp->config->trustfile);
1473                }
1474                freez(new_entry);
1475             }
1476             else
1477             {
1478                /* FIXME: No way to handle out-of memory, so mostly ignoring it */
1479                log_error(LOG_LEVEL_ERROR, "Out of memory adding pattern to trust file");
1480             }
1481
1482             fclose(fp);
1483          }
1484          else
1485          {
1486             log_error(LOG_LEVEL_ERROR, "Failed to append new entry for \'%s\' to trustfile \'%s\': %E",
1487                csp->http->hostport, csp->config->trustfile);
1488          }
1489          return 0;
1490       }
1491    }
1492
1493    return 1;
1494 }
1495 #endif /* def FEATURE_TRUST */
1496
1497
1498 /*********************************************************************
1499  *
1500  * Function    :  get_filter
1501  *
1502  * Description :  Get a filter with a given name and type.
1503  *                Note that taggers are filters, too.
1504  *
1505  * Parameters  :
1506  *          1  :  csp = Current client state (buffers, headers, etc...)
1507  *          2  :  requested_name = Name of the content filter to get
1508  *          3  :  requested_type = Type of the filter to tagger to lookup
1509  *
1510  * Returns     :  A pointer to the requested filter
1511  *                or NULL if the filter wasn't found
1512  *
1513  *********************************************************************/
1514 struct re_filterfile_spec *get_filter(const struct client_state *csp,
1515                                       const char *requested_name,
1516                                       enum filter_type requested_type)
1517 {
1518    int i;
1519    struct re_filterfile_spec *b;
1520    struct file_list *fl;
1521
1522    for (i = 0; i < MAX_AF_FILES; i++)
1523    {
1524      fl = csp->rlist[i];
1525      if ((NULL == fl) || (NULL == fl->f))
1526      {
1527         /*
1528          * Either there are no filter files left or this
1529          * filter file just contains no valid filters.
1530          *
1531          * Continue to be sure we don't miss valid filter
1532          * files that are chained after empty or invalid ones.
1533          */
1534         continue;
1535      }
1536
1537      for (b = fl->f; b != NULL; b = b->next)
1538      {
1539         if (b->type != requested_type)
1540         {
1541            /* The callers isn't interested in this filter type. */
1542            continue;
1543         }
1544         if (strcmp(b->name, requested_name) == 0)
1545         {
1546            /* The requested filter has been found. Abort search. */
1547            return b;
1548         }
1549      }
1550    }
1551
1552    /* No filter with the given name and type exists. */
1553    return NULL;
1554
1555 }
1556
1557
1558 /*********************************************************************
1559  *
1560  * Function    :  pcrs_filter_impl
1561  *
1562  * Description :  Execute all text substitutions from all applying
1563  *                (based on filter_response_body value) +filter
1564  *                or +client_body_filter actions on the given buffer.
1565  *
1566  * Parameters  :
1567  *          1  :  csp = Current client state (buffers, headers, etc...)
1568  *          2  :  filter_response_body = when TRUE execute +filter
1569  *                actions; execute +client_body_filter actions otherwise
1570  *          3  :  data = Target data
1571  *          4  :  data_len = Target data len
1572  *
1573  * Returns     :  a pointer to the (newly allocated) modified buffer.
1574  *                or NULL if there were no hits or something went wrong
1575  *
1576  *********************************************************************/
1577 static char *pcrs_filter_impl(const struct client_state *csp, int filter_response_body,
1578                               const char *data, size_t *data_len)
1579 {
1580    int hits = 0;
1581    size_t size, prev_size;
1582    const int filters_idx =
1583       filter_response_body ? ACTION_MULTI_FILTER : ACTION_MULTI_CLIENT_BODY_FILTER;
1584    const enum filter_type filter_type =
1585       filter_response_body ? FT_CONTENT_FILTER : FT_CLIENT_BODY_FILTER;
1586
1587    const char *old = NULL;
1588    char *new = NULL;
1589    pcrs_job *job;
1590
1591    struct re_filterfile_spec *b;
1592    struct list_entry *filtername;
1593
1594    /*
1595     * Sanity first
1596     */
1597    if (*data_len == 0)
1598    {
1599       return(NULL);
1600    }
1601
1602    if (filters_available(csp) == FALSE)
1603    {
1604       log_error(LOG_LEVEL_ERROR, "Inconsistent configuration: "
1605          "content filtering enabled, but no content filters available.");
1606       return(NULL);
1607    }
1608
1609    size = *data_len;
1610    old = data;
1611
1612    /*
1613     * For all applying actions, look if a filter by that
1614     * name exists and if yes, execute it's pcrs_joblist on the
1615     * buffer.
1616     */
1617    for (filtername = csp->action->multi[filters_idx]->first;
1618         filtername != NULL; filtername = filtername->next)
1619    {
1620       int current_hits = 0; /* Number of hits caused by this filter */
1621       int job_number   = 0; /* Which job we're currently executing  */
1622       int job_hits     = 0; /* How many hits the current job caused */
1623       pcrs_job *joblist;
1624
1625       b = get_filter(csp, filtername->str, filter_type);
1626       if (b == NULL)
1627       {
1628          continue;
1629       }
1630
1631       joblist = b->joblist;
1632
1633       if (b->dynamic) joblist = compile_dynamic_pcrs_job_list(csp, b);
1634
1635       if (NULL == joblist)
1636       {
1637          log_error(LOG_LEVEL_RE_FILTER, "Filter %s has empty joblist. Nothing to do.", b->name);
1638          continue;
1639       }
1640
1641       prev_size = size;
1642       /* Apply all jobs from the joblist */
1643       for (job = joblist; NULL != job; job = job->next)
1644       {
1645          job_number++;
1646          job_hits = pcrs_execute(job, old, size, &new, &size);
1647
1648          if (job_hits >= 0)
1649          {
1650             /*
1651              * That went well. Continue filtering
1652              * and use the result of this job as
1653              * input for the next one.
1654              */
1655             current_hits += job_hits;
1656             if (old != data)
1657             {
1658                freez(old);
1659             }
1660             old = new;
1661          }
1662          else
1663          {
1664             /*
1665              * This job caused an unexpected error. Inform the user
1666              * and skip the rest of the jobs in this filter. We could
1667              * continue with the next job, but usually the jobs
1668              * depend on each other or are similar enough to
1669              * fail for the same reason.
1670              *
1671              * At the moment our pcrs expects the error codes of pcre 3.4,
1672              * but newer pcre versions can return additional error codes.
1673              * As a result pcrs_strerror()'s error message might be
1674              * "Unknown error ...", therefore we print the numerical value
1675              * as well.
1676              *
1677              * XXX: Is this important enough for LOG_LEVEL_ERROR or
1678              * should we use LOG_LEVEL_RE_FILTER instead?
1679              */
1680             log_error(LOG_LEVEL_ERROR, "Skipped filter \'%s\' after job number %u: %s (%d)",
1681                b->name, job_number, pcrs_strerror(job_hits), job_hits);
1682             break;
1683          }
1684       }
1685
1686       if (b->dynamic) pcrs_free_joblist(joblist);
1687
1688       if (filter_response_body)
1689       {
1690          log_error(LOG_LEVEL_RE_FILTER,
1691             "filtering %s%s (size %lu) with \'%s\' produced %d hits (new size %lu).",
1692             csp->http->hostport, csp->http->path, prev_size, b->name, current_hits, size);
1693       }
1694       else
1695       {
1696          log_error(LOG_LEVEL_RE_FILTER, "filtering request body from client %s "
1697             "(size %lu) with \'%s\' produced %d hits (new size %lu).",
1698             csp->ip_addr_str, prev_size, b->name, current_hits, size);
1699       }
1700 #ifdef FEATURE_EXTENDED_STATISTICS
1701       update_filter_statistics(b->name, current_hits);
1702 #endif
1703       hits += current_hits;
1704    }
1705
1706    /*
1707     * If there were no hits, destroy our copy and let
1708     * chat() use the original content
1709     */
1710    if (!hits)
1711    {
1712       if (old != data && old != new)
1713       {
1714          freez(old);
1715       }
1716       freez(new);
1717       return(NULL);
1718    }
1719
1720    *data_len = size;
1721    return(new);
1722 }
1723
1724
1725 /*********************************************************************
1726  *
1727  * Function    :  pcrs_filter_response_body
1728  *
1729  * Description :  Execute all text substitutions from all applying
1730  *                +filter actions on the text buffer that's been
1731  *                accumulated in csp->iob->buf.
1732  *
1733  * Parameters  :
1734  *          1  :  csp = Current client state (buffers, headers, etc...)
1735  *
1736  * Returns     :  a pointer to the (newly allocated) modified buffer.
1737  *                or NULL if there were no hits or something went wrong
1738  *
1739  *********************************************************************/
1740 static char *pcrs_filter_response_body(struct client_state *csp)
1741 {
1742    size_t size = (size_t)(csp->iob->eod - csp->iob->cur);
1743
1744    char *new = NULL;
1745
1746    /*
1747     * Sanity first
1748     */
1749    if (csp->iob->cur >= csp->iob->eod)
1750    {
1751       return NULL;
1752    }
1753
1754    new = pcrs_filter_impl(csp, TRUE, csp->iob->cur, &size);
1755
1756    if (new != NULL)
1757    {
1758       csp->flags |= CSP_FLAG_MODIFIED;
1759       csp->content_length = size;
1760       clear_iob(csp->iob);
1761    }
1762
1763    return new;
1764 }
1765
1766
1767 #ifdef FEATURE_EXTERNAL_FILTERS
1768 /*********************************************************************
1769  *
1770  * Function    :  get_external_filter
1771  *
1772  * Description :  Lookup the code to execute for an external filter.
1773  *                Masks the misuse of the re_filterfile_spec.
1774  *
1775  * Parameters  :
1776  *          1  :  csp = Current client state (buffers, headers, etc...)
1777  *          2  :  name = Name of the content filter to get
1778  *
1779  * Returns     :  A pointer to the requested code
1780  *                or NULL if the filter wasn't found
1781  *
1782  *********************************************************************/
1783 static const char *get_external_filter(const struct client_state *csp,
1784                                 const char *name)
1785 {
1786    struct re_filterfile_spec *external_filter;
1787
1788    external_filter = get_filter(csp, name, FT_EXTERNAL_CONTENT_FILTER);
1789    if (external_filter == NULL)
1790    {
1791       log_error(LOG_LEVEL_FATAL,
1792          "Didn't find stuff to execute for external filter: %s",
1793          name);
1794    }
1795
1796    return external_filter->patterns->first->str;
1797
1798 }
1799
1800
1801 /*********************************************************************
1802  *
1803  * Function    :  set_privoxy_variables
1804  *
1805  * Description :  Sets a couple of privoxy-specific environment variables
1806  *
1807  * Parameters  :
1808  *          1  :  csp = Current client state (buffers, headers, etc...)
1809  *
1810  * Returns     :  N/A
1811  *
1812  *********************************************************************/
1813 static void set_privoxy_variables(const struct client_state *csp)
1814 {
1815    int i;
1816    struct {
1817       const char *name;
1818       const char *value;
1819    } env[] = {
1820       { "PRIVOXY_URL",    csp->http->url   },
1821       { "PRIVOXY_PATH",   csp->http->path  },
1822       { "PRIVOXY_HOST",   csp->http->host  },
1823       { "PRIVOXY_ORIGIN", csp->ip_addr_str },
1824       { "PRIVOXY_LISTEN_ADDRESS", csp->listen_addr_str },
1825    };
1826
1827    for (i = 0; i < SZ(env); i++)
1828    {
1829       if (setenv(env[i].name, env[i].value, 1))
1830       {
1831          log_error(LOG_LEVEL_ERROR, "Failed to set %s=%s: %E",
1832             env[i].name, env[i].value);
1833       }
1834    }
1835 }
1836
1837
1838 /*********************************************************************
1839  *
1840  * Function    :  execute_external_filter
1841  *
1842  * Description :  Pipe content into external filter and return the output
1843  *
1844  * Parameters  :
1845  *          1  :  csp = Current client state (buffers, headers, etc...)
1846  *          2  :  name = Name of the external filter to execute
1847  *          3  :  content = The original content to filter
1848  *          4  :  size = The size of the content buffer
1849  *
1850  * Returns     :  a pointer to the (newly allocated) modified buffer.
1851  *                or NULL if there were no hits or something went wrong
1852  *
1853  *********************************************************************/
1854 static char *execute_external_filter(const struct client_state *csp,
1855    const char *name, char *content, size_t *size)
1856 {
1857    char cmd[200];
1858    char file_name[FILENAME_MAX];
1859    FILE *fp;
1860    char *filter_output;
1861    int fd;
1862    int ret;
1863    size_t new_size;
1864    const char *external_filter;
1865
1866    if (csp->config->temporary_directory == NULL)
1867    {
1868       log_error(LOG_LEVEL_ERROR,
1869          "No temporary-directory configured. Can't execute filter: %s",
1870          name);
1871       return NULL;
1872    }
1873
1874    external_filter = get_external_filter(csp, name);
1875
1876    if (sizeof(file_name) < snprintf(file_name, sizeof(file_name),
1877          "%s/privoxy-XXXXXXXX", csp->config->temporary_directory))
1878    {
1879       log_error(LOG_LEVEL_ERROR, "temporary-directory path too long");
1880       return NULL;
1881    }
1882
1883    fd = mkstemp(file_name);
1884    if (fd == -1)
1885    {
1886       log_error(LOG_LEVEL_ERROR, "mkstemp() failed to create %s: %E", file_name);
1887       return NULL;
1888    }
1889
1890    fp = fdopen(fd, "w");
1891    if (fp == NULL)
1892    {
1893       log_error(LOG_LEVEL_ERROR, "fdopen() failed: %E");
1894       unlink(file_name);
1895       return NULL;
1896    }
1897
1898    /*
1899     * The size may be zero if a previous filter discarded everything.
1900     *
1901     * This isn't necessary unintentional, so we just don't try
1902     * to fwrite() nothing and let the user deal with the rest.
1903     */
1904    if ((*size != 0) && fwrite(content, *size, 1, fp) != 1)
1905    {
1906       log_error(LOG_LEVEL_ERROR, "fwrite(..., %lu, 1, ..) failed: %E", *size);
1907       unlink(file_name);
1908       fclose(fp);
1909       return NULL;
1910    }
1911    fclose(fp);
1912
1913    if (sizeof(cmd) < snprintf(cmd, sizeof(cmd), "%s < %s", external_filter, file_name))
1914    {
1915       log_error(LOG_LEVEL_ERROR,
1916          "temporary-directory or external filter path too long");
1917       unlink(file_name);
1918       return NULL;
1919    }
1920
1921    log_error(LOG_LEVEL_RE_FILTER, "Executing '%s': %s", name, cmd);
1922
1923    /*
1924     * The locking is necessary to prevent other threads
1925     * from overwriting the environment variables before
1926     * the popen fork. Afterwards this no longer matters.
1927     */
1928    privoxy_mutex_lock(&external_filter_mutex);
1929    set_privoxy_variables(csp);
1930    fp = popen(cmd, "r");
1931    privoxy_mutex_unlock(&external_filter_mutex);
1932    if (fp == NULL)
1933    {
1934       log_error(LOG_LEVEL_ERROR, "popen(\"%s\", \"r\") failed: %E", cmd);
1935       unlink(file_name);
1936       return NULL;
1937    }
1938
1939    /* Allocate at least one byte */
1940    filter_output = malloc_or_die(*size + 1);
1941
1942    new_size = 0;
1943    while (!feof(fp) && !ferror(fp))
1944    {
1945       size_t len;
1946       /* Could be bigger ... */
1947       enum { READ_LENGTH = 2048 };
1948
1949       if (new_size + READ_LENGTH >= *size)
1950       {
1951          char *p;
1952
1953          /* Could be considered wasteful if the content is 'large'. */
1954          *size += (*size >= READ_LENGTH) ? *size : READ_LENGTH;
1955
1956          p = realloc(filter_output, *size);
1957          if (p == NULL)
1958          {
1959             log_error(LOG_LEVEL_ERROR, "Out of memory while reading "
1960                "external filter output. Using what we got so far.");
1961             break;
1962          }
1963          filter_output = p;
1964       }
1965       assert(new_size + READ_LENGTH < *size);
1966       len = fread(&filter_output[new_size], 1, READ_LENGTH, fp);
1967       if (len > 0)
1968       {
1969          new_size += len;
1970       }
1971    }
1972
1973    ret = pclose(fp);
1974    if (ret == -1)
1975    {
1976       log_error(LOG_LEVEL_ERROR, "Executing %s failed: %E", cmd);
1977    }
1978    else
1979    {
1980       log_error(LOG_LEVEL_RE_FILTER,
1981          "Executing '%s' resulted in return value %d. "
1982          "Read %lu of up to %lu bytes.", name, (ret >> 8), new_size, *size);
1983    }
1984
1985    unlink(file_name);
1986    *size = new_size;
1987
1988    return filter_output;
1989
1990 }
1991 #endif /* def FEATURE_EXTERNAL_FILTERS */
1992
1993
1994 /*********************************************************************
1995  *
1996  * Function    :  pcrs_filter_request_body
1997  *
1998  * Description :  Execute all text substitutions from all applying
1999  *                +client_body_filter actions on the given text buffer.
2000  *
2001  * Parameters  :
2002  *          1  :  csp = Current client state (buffers, headers, etc...)
2003  *          2  :  data = Target data
2004  *          3  :  data_len = Target data len
2005  *
2006  * Returns     :  a pointer to the (newly allocated) modified buffer.
2007  *                or NULL if there were no hits or something went wrong
2008  *
2009  *********************************************************************/
2010 static char *pcrs_filter_request_body(const struct client_state *csp, const char *data, size_t *data_len)
2011 {
2012    return pcrs_filter_impl(csp, FALSE, data, data_len);
2013 }
2014
2015
2016 /*********************************************************************
2017  *
2018  * Function    :  gif_deanimate_response
2019  *
2020  * Description :  Deanimate the GIF image that has been accumulated in
2021  *                csp->iob->buf, set csp->content_length to the modified
2022  *                size and raise the CSP_FLAG_MODIFIED flag.
2023  *
2024  * Parameters  :
2025  *          1  :  csp = Current client state (buffers, headers, etc...)
2026  *
2027  * Returns     :  a pointer to the (newly allocated) modified buffer.
2028  *                or NULL in case something went wrong.
2029  *
2030  *********************************************************************/
2031 #ifdef FUZZ
2032 char *gif_deanimate_response(struct client_state *csp)
2033 #else
2034 static char *gif_deanimate_response(struct client_state *csp)
2035 #endif
2036 {
2037    struct binbuffer *in, *out;
2038    char *p;
2039    size_t size;
2040
2041    size = (size_t)(csp->iob->eod - csp->iob->cur);
2042
2043    in =  zalloc_or_die(sizeof(*in));
2044    out = zalloc_or_die(sizeof(*out));
2045
2046    in->buffer = csp->iob->cur;
2047    in->size = size;
2048
2049    if (gif_deanimate(in, out, strncmp("last", csp->action->string[ACTION_STRING_DEANIMATE], 4)))
2050    {
2051       log_error(LOG_LEVEL_DEANIMATE, "failed! (gif parsing)");
2052       freez(in);
2053       buf_free(out);
2054       return(NULL);
2055    }
2056    else
2057    {
2058       if ((int)size == out->offset)
2059       {
2060          log_error(LOG_LEVEL_DEANIMATE, "GIF not changed.");
2061       }
2062       else
2063       {
2064          log_error(LOG_LEVEL_DEANIMATE,
2065             "Success! GIF shrunk from %lu bytes to %lu.", size, out->offset);
2066       }
2067       csp->content_length = out->offset;
2068       csp->flags |= CSP_FLAG_MODIFIED;
2069       p = out->buffer;
2070       freez(in);
2071       freez(out);
2072       return(p);
2073    }
2074
2075 }
2076
2077
2078 /*********************************************************************
2079  *
2080  * Function    :  get_filter_function
2081  *
2082  * Description :  Decides which content filter function has
2083  *                to be applied (if any). Only considers functions
2084  *                for internal filters which are mutually-exclusive.
2085  *
2086  * Parameters  :
2087  *          1  :  csp = Current client state (buffers, headers, etc...)
2088  *
2089  * Returns     :  The content filter function to run, or
2090  *                NULL if no content filter is active
2091  *
2092  *********************************************************************/
2093 static filter_function_ptr get_filter_function(const struct client_state *csp)
2094 {
2095    filter_function_ptr filter_function = NULL;
2096
2097    /*
2098     * Choose the applying filter function based on
2099     * the content type and action settings.
2100     */
2101    if ((csp->content_type & CT_TEXT) &&
2102        (!list_is_empty(csp->action->multi[ACTION_MULTI_FILTER])))
2103    {
2104       filter_function = pcrs_filter_response_body;
2105    }
2106    else if ((csp->content_type & CT_GIF) &&
2107             (csp->action->flags & ACTION_DEANIMATE))
2108    {
2109       filter_function = gif_deanimate_response;
2110    }
2111
2112    return filter_function;
2113 }
2114
2115
2116 /*********************************************************************
2117  *
2118  * Function    :  get_bytes_to_next_chunk_start
2119  *
2120  * Description :  Returns the number of bytes to the start of the
2121  *                next chunk in the buffer.
2122  *
2123  * Parameters  :
2124  *          1  :  buffer = Pointer to the text buffer
2125  *          2  :  size = Number of bytes in the buffer.
2126  *          3  :  offset = Where to expect the beginning of the next chunk.
2127  *
2128  * Returns     :  -1 if the size can't be determined or data is missing,
2129  *                otherwise the number of bytes to the start of the next chunk
2130  *                or 0 if the last chunk has been fully buffered.
2131  *
2132  *********************************************************************/
2133 static int get_bytes_to_next_chunk_start(char *buffer, size_t size, size_t offset)
2134 {
2135    char *chunk_start;
2136    char *p;
2137    unsigned int chunk_size = 0;
2138    int bytes_to_skip;
2139
2140    if (size <= offset || size < 5)
2141    {
2142       /*
2143        * Not enough bytes bufferd to figure
2144        * out the size of the next chunk.
2145        */
2146       return -1;
2147    }
2148
2149    chunk_start = buffer + offset;
2150
2151    p = strstr(chunk_start, "\r\n");
2152    if (NULL == p)
2153    {
2154       /*
2155        * The line with the chunk-size hasn't been completely received
2156        * yet (or is invalid).
2157        */
2158       log_error(LOG_LEVEL_RE_FILTER,
2159          "Not enough or invalid data in buffer in chunk size line.");
2160       return -1;
2161    }
2162
2163    if (sscanf(chunk_start, "%x", &chunk_size) != 1)
2164    {
2165       /* XXX: Write test case to trigger this. */
2166       log_error(LOG_LEVEL_ERROR, "Failed to parse chunk size. "
2167          "Size: %lu, offset: %lu. Chunk size start: %N", size, offset,
2168          (size - offset), chunk_start);
2169       return -1;
2170    }
2171
2172    /*
2173     * To get to the start of the next chunk size we have to skip
2174     * the line with the current chunk size followed by "\r\n" followd
2175     * by the actual data and another "\r\n" following the data.
2176     */
2177    bytes_to_skip = (int)(p - chunk_start) + 2 + (int)chunk_size + 2;
2178
2179    if (bytes_to_skip <= 0)
2180    {
2181       log_error(LOG_LEVEL_ERROR,
2182          "Failed to figure out chunk offset. %u and %d seem dubious.",
2183          chunk_size, bytes_to_skip);
2184       return -1;
2185    }
2186    if (chunk_size == 0)
2187    {
2188       if (bytes_to_skip <= (size - offset))
2189       {
2190          return 0;
2191       }
2192       else
2193       {
2194          log_error(LOG_LEVEL_INFO,
2195             "Last chunk detected but we're still missing data.");
2196          return -1;
2197       }
2198    }
2199
2200    return bytes_to_skip;
2201 }
2202
2203
2204 /*********************************************************************
2205  *
2206  * Function    :  get_bytes_missing_from_chunked_data
2207  *
2208  * Description :  Figures out how many bytes of data we need to get
2209  *                to the start of the next chunk of data (XXX: terminology).
2210  *                Due to the nature of chunk-encoded data we can only see
2211  *                how many data is missing according to the last chunk size
2212  *                buffered.
2213  *
2214  * Parameters  :
2215  *          1  :  buffer = Pointer to the text buffer
2216  *          2  :  size = Number of bytes in the buffer.
2217  *          3  :  offset = Where to expect the beginning of the next chunk.
2218  *
2219  * Returns     :  -1 if the data can't be parsed (yet),
2220  *                 0 if the buffer is complete or a
2221  *                 number of bytes that is missing.
2222  *
2223  *********************************************************************/
2224 int get_bytes_missing_from_chunked_data(char *buffer, size_t size, size_t offset)
2225 {
2226    int ret = -1;
2227    int last_valid_offset = -1;
2228
2229    if (size < offset || size < 5)
2230    {
2231       /* Not enough data buffered yet */
2232       return -1;
2233    }
2234
2235    do
2236    {
2237       ret = get_bytes_to_next_chunk_start(buffer, size, offset);
2238       if (ret == -1)
2239       {
2240          return last_valid_offset;
2241       }
2242       if (ret == 0)
2243       {
2244          return 0;
2245       }
2246       if (offset != 0)
2247       {
2248          last_valid_offset = (int)offset;
2249       }
2250       offset += (size_t)ret;
2251    } while (offset < size);
2252
2253    return (int)offset;
2254
2255 }
2256
2257
2258 /*********************************************************************
2259  *
2260  * Function    :  chunked_data_is_complete
2261  *
2262  * Description :  Detects if a buffer with chunk-encoded data looks
2263  *                complete.
2264  *
2265  * Parameters  :
2266  *          1  :  buffer = Pointer to the text buffer
2267  *          2  :  size = Number of bytes in the buffer.
2268  *          3  :  offset = Where to expect the beginning of the
2269  *                         first complete chunk.
2270  *
2271  * Returns     :  TRUE if it looks like the data is complete,
2272  *                FALSE otherwise.
2273  *
2274  *********************************************************************/
2275 int chunked_data_is_complete(char *buffer, size_t size, size_t offset)
2276 {
2277    return (0 == get_bytes_missing_from_chunked_data(buffer, size, offset));
2278
2279 }
2280
2281
2282 /*********************************************************************
2283  *
2284  * Function    :  remove_chunked_transfer_coding
2285  *
2286  * Description :  In-situ remove the "chunked" transfer coding as defined
2287  *                in RFC 7230 4.1 from a buffer. XXX: The implementation
2288  *                is neither complete nor compliant (TODO #129).
2289  *
2290  * Parameters  :
2291  *          1  :  buffer = Pointer to the text buffer
2292  *          2  :  size =  In: Number of bytes to be processed,
2293  *                       Out: Number of bytes after de-chunking.
2294  *                       (undefined in case of errors)
2295  *
2296  * Returns     :  JB_ERR_OK for success,
2297  *                JB_ERR_PARSE otherwise
2298  *
2299  *********************************************************************/
2300 #ifdef FUZZ
2301 extern jb_err remove_chunked_transfer_coding(char *buffer, size_t *size)
2302 #else
2303 static jb_err remove_chunked_transfer_coding(char *buffer, size_t *size)
2304 #endif
2305 {
2306    size_t newsize = 0;
2307    unsigned int chunksize = 0;
2308    char *from_p, *to_p;
2309    const char *end_of_buffer = buffer + *size;
2310
2311    if (*size == 0)
2312    {
2313       log_error(LOG_LEVEL_FATAL, "Invalid chunked input. Buffer is empty.");
2314       return JB_ERR_PARSE;
2315    }
2316
2317    assert(buffer);
2318    from_p = to_p = buffer;
2319
2320    if (sscanf(buffer, "%x", &chunksize) != 1)
2321    {
2322       log_error(LOG_LEVEL_ERROR, "Invalid first chunksize while stripping \"chunked\" transfer coding");
2323       return JB_ERR_PARSE;
2324    }
2325
2326    while (chunksize > 0U)
2327    {
2328       /*
2329        * If the chunk-size is valid, we should have at least
2330        * chunk-size bytes of chunk-data and five bytes of
2331        * meta data (chunk-size, CRLF, CRLF) left in the buffer.
2332        */
2333       if (chunksize + 5 >= *size - newsize)
2334       {
2335          log_error(LOG_LEVEL_ERROR,
2336             "Chunk size %u exceeds buffered data left. "
2337             "Already digested %lu of %lu buffered bytes.",
2338             chunksize, newsize, *size);
2339          return JB_ERR_PARSE;
2340       }
2341
2342       /*
2343        * Skip the chunk-size, the optional chunk-ext and the CRLF
2344        * that is supposed to be located directly before the start
2345        * of chunk-data.
2346        */
2347       if (NULL == (from_p = strstr(from_p, "\r\n")))
2348       {
2349          log_error(LOG_LEVEL_ERROR,
2350             "Failed to strip \"chunked\" transfer coding. "
2351             "Line with chunk size doesn't seem to end properly.");
2352          return JB_ERR_PARSE;
2353       }
2354       from_p += 2;
2355
2356       /*
2357        * The previous strstr() does not enforce chunk-validity
2358        * and is sattisfied as long a CRLF is left in the buffer.
2359        *
2360        * Make sure the bytes we consider chunk-data are within
2361        * the valid range.
2362        */
2363       if (from_p + chunksize >= end_of_buffer)
2364       {
2365          log_error(LOG_LEVEL_ERROR,
2366             "Failed to decode content for filtering. "
2367             "One chunk end is beyond the end of the buffer.");
2368          return JB_ERR_PARSE;
2369       }
2370
2371       memmove(to_p, from_p, (size_t) chunksize);
2372       newsize += chunksize;
2373       to_p = buffer + newsize;
2374       from_p += chunksize;
2375
2376       /*
2377        * Not merging this check with the previous one allows us
2378        * to keep chunks without trailing CRLF. It's not clear
2379        * if we actually have to care about those, though.
2380        */
2381       if (from_p + 2 >= end_of_buffer)
2382       {
2383          log_error(LOG_LEVEL_ERROR, "Not enough room for trailing CRLF.");
2384          return JB_ERR_PARSE;
2385       }
2386       from_p += 2;
2387       if (sscanf(from_p, "%x", &chunksize) != 1)
2388       {
2389          log_error(LOG_LEVEL_INFO, "Invalid \"chunked\" transfer encoding detected and ignored.");
2390          break;
2391       }
2392    }
2393
2394    /* XXX: Should get its own loglevel. */
2395    log_error(LOG_LEVEL_RE_FILTER,
2396       "De-chunking successful. Shrunk from %lu to %lu", *size, newsize);
2397
2398    *size = newsize;
2399
2400    return JB_ERR_OK;
2401
2402 }
2403
2404
2405 /*********************************************************************
2406  *
2407  * Function    :  prepare_for_filtering
2408  *
2409  * Description :  If necessary, de-chunks and decompresses
2410  *                the content so it can get filterd.
2411  *
2412  * Parameters  :
2413  *          1  :  csp = Current client state (buffers, headers, etc...)
2414  *
2415  * Returns     :  JB_ERR_OK for success,
2416  *                JB_ERR_PARSE otherwise
2417  *
2418  *********************************************************************/
2419 static jb_err prepare_for_filtering(struct client_state *csp)
2420 {
2421    jb_err err = JB_ERR_OK;
2422
2423    /*
2424     * If the body has a "chunked" transfer-encoding,
2425     * get rid of it, adjusting size and iob->eod
2426     */
2427    if (csp->flags & CSP_FLAG_CHUNKED)
2428    {
2429       size_t size = (size_t)(csp->iob->eod - csp->iob->cur);
2430
2431       log_error(LOG_LEVEL_RE_FILTER, "Need to de-chunk first");
2432       err = remove_chunked_transfer_coding(csp->iob->cur, &size);
2433       if (JB_ERR_OK == err)
2434       {
2435          csp->iob->eod = csp->iob->cur + size;
2436          csp->flags |= CSP_FLAG_MODIFIED;
2437       }
2438       else
2439       {
2440          return JB_ERR_PARSE;
2441       }
2442    }
2443
2444 #ifdef FEATURE_ZLIB
2445    /*
2446     * If the body has a supported transfer-encoding,
2447     * decompress it, adjusting size and iob->eod.
2448     */
2449    if ((csp->content_type & (CT_GZIP|CT_DEFLATE))
2450 #ifdef FEATURE_BROTLI
2451       || (csp->content_type & CT_BROTLI)
2452 #endif
2453        )
2454    {
2455       if (0 == csp->iob->eod - csp->iob->cur)
2456       {
2457          /* Nothing left after de-chunking. */
2458          return JB_ERR_OK;
2459       }
2460
2461       err = decompress_iob(csp);
2462
2463       if (JB_ERR_OK == err)
2464       {
2465          csp->flags |= CSP_FLAG_MODIFIED;
2466          csp->content_type &= ~CT_TABOO;
2467       }
2468       else
2469       {
2470          /*
2471           * Unset content types to remember not to
2472           * modify the Content-Encoding header later.
2473           */
2474          csp->content_type &= ~CT_GZIP;
2475          csp->content_type &= ~CT_DEFLATE;
2476 #ifdef FEATURE_BROTLI
2477          csp->content_type &= ~CT_BROTLI;
2478 #endif
2479       }
2480    }
2481 #endif
2482
2483    return err;
2484 }
2485
2486
2487 /*********************************************************************
2488  *
2489  * Function    :  execute_content_filters
2490  *
2491  * Description :  Executes a given content filter.
2492  *
2493  * Parameters  :
2494  *          1  :  csp = Current client state (buffers, headers, etc...)
2495  *
2496  * Returns     :  Pointer to the modified buffer, or
2497  *                NULL if filtering failed or wasn't necessary.
2498  *
2499  *********************************************************************/
2500 char *execute_content_filters(struct client_state *csp)
2501 {
2502    char *content;
2503    filter_function_ptr content_filter;
2504
2505    assert(content_filters_enabled(csp->action));
2506
2507    if (0 == csp->iob->eod - csp->iob->cur)
2508    {
2509       /*
2510        * No content (probably status code 301, 302 ...),
2511        * no filtering necessary.
2512        */
2513       return NULL;
2514    }
2515
2516    if (JB_ERR_OK != prepare_for_filtering(csp))
2517    {
2518       /*
2519        * We failed to de-chunk or decompress, don't accept
2520        * another request on the client connection.
2521        */
2522       csp->flags &= ~CSP_FLAG_CLIENT_CONNECTION_KEEP_ALIVE;
2523       return NULL;
2524    }
2525
2526    if (0 == csp->iob->eod - csp->iob->cur)
2527    {
2528       /*
2529        * Clown alarm: chunked and/or compressed nothing delivered.
2530        */
2531       return NULL;
2532    }
2533
2534    content_filter = get_filter_function(csp);
2535    content = (content_filter != NULL) ? (*content_filter)(csp) : NULL;
2536
2537 #ifdef FEATURE_EXTERNAL_FILTERS
2538    if ((csp->content_type & CT_TEXT) &&
2539        !list_is_empty(csp->action->multi[ACTION_MULTI_EXTERNAL_FILTER]))
2540    {
2541       struct list_entry *filtername;
2542       size_t size = (size_t)csp->content_length;
2543
2544       if (content == NULL)
2545       {
2546          content = csp->iob->cur;
2547          size = (size_t)(csp->iob->eod - csp->iob->cur);
2548       }
2549
2550       for (filtername = csp->action->multi[ACTION_MULTI_EXTERNAL_FILTER]->first;
2551            filtername ; filtername = filtername->next)
2552       {
2553          char *result = execute_external_filter(csp, filtername->str, content, &size);
2554          if (result != NULL)
2555          {
2556             if (content != csp->iob->cur)
2557             {
2558                free(content);
2559             }
2560             content = result;
2561          }
2562       }
2563       csp->flags |= CSP_FLAG_MODIFIED;
2564       csp->content_length = size;
2565    }
2566 #endif /* def FEATURE_EXTERNAL_FILTERS */
2567
2568    return content;
2569
2570 }
2571
2572
2573 /*********************************************************************
2574  *
2575  * Function    :  execute_client_body_filters
2576  *
2577  * Description :  Executes client body filters for the request that is buffered
2578  *                in the client_iob. The client_iob is updated with the filtered
2579  *                content.
2580  *
2581  * Parameters  :
2582  *          1  :  csp = Current client state (buffers, headers, etc...)
2583  *          2  :  content_length = content length. Upon successful filtering
2584  *                the passed value is updated with the new content length.
2585  *
2586  * Returns     :  1 if the content has been filterd. 0 if it hasn't.
2587  *
2588  *********************************************************************/
2589 int execute_client_body_filters(struct client_state *csp, size_t *content_length)
2590 {
2591    char *filtered_content;
2592
2593    assert(client_body_filters_enabled(csp->action));
2594
2595    if (content_length == 0)
2596    {
2597       /*
2598        * No content, no filtering necessary.
2599        */
2600       return 0;
2601    }
2602
2603    filtered_content = pcrs_filter_request_body(csp, csp->client_iob->cur, content_length);
2604    if (filtered_content != NULL)
2605    {
2606       freez(csp->client_iob->buf);
2607       csp->client_iob->buf  = filtered_content;
2608       csp->client_iob->cur  = csp->client_iob->buf;
2609       csp->client_iob->eod  = csp->client_iob->cur + *content_length;
2610       csp->client_iob->size = *content_length;
2611
2612       return 1;
2613    }
2614    
2615    return 0;
2616 }
2617
2618
2619 /*********************************************************************
2620  *
2621  * Function    :  execute_client_body_taggers
2622  *
2623  * Description :  Executes client body taggers for the request that is
2624  *                buffered in the client_iob.
2625  *                XXX: Lots of code shared with header_tagger
2626  *
2627  * Parameters  :
2628  *          1  :  csp = Current client state (buffers, headers, etc...)
2629  *          2  :  content_length = content length.
2630  *
2631  * Returns     :  XXX
2632  *
2633  *********************************************************************/
2634 jb_err execute_client_body_taggers(struct client_state *csp, size_t content_length)
2635 {
2636    enum filter_type wanted_filter_type = FT_CLIENT_BODY_TAGGER;
2637    int multi_action_index = ACTION_MULTI_CLIENT_BODY_TAGGER;
2638    pcrs_job *job;
2639
2640    struct re_filterfile_spec *b;
2641    struct list_entry *tag_name;
2642
2643    assert(client_body_taggers_enabled(csp->action));
2644
2645    if (content_length == 0)
2646    {
2647       /*
2648        * No content, no tagging necessary.
2649        */
2650       return JB_ERR_OK;
2651    }
2652
2653    log_error(LOG_LEVEL_INFO, "Got to execute tagger on %N",
2654       content_length, csp->client_iob->cur);
2655
2656    if (list_is_empty(csp->action->multi[multi_action_index])
2657       || filters_available(csp) == FALSE)
2658    {
2659       /* Return early if no taggers apply or if none are available. */
2660       return JB_ERR_OK;
2661    }
2662
2663    /* Execute all applying taggers */
2664    for (tag_name = csp->action->multi[multi_action_index]->first;
2665         NULL != tag_name; tag_name = tag_name->next)
2666    {
2667       char *modified_tag = NULL;
2668       char *tag = csp->client_iob->cur;
2669       size_t size = content_length;
2670       pcrs_job *joblist;
2671
2672       b = get_filter(csp, tag_name->str, wanted_filter_type);
2673       if (b == NULL)
2674       {
2675          continue;
2676       }
2677
2678       joblist = b->joblist;
2679
2680       if (b->dynamic) joblist = compile_dynamic_pcrs_job_list(csp, b);
2681
2682       if (NULL == joblist)
2683       {
2684          log_error(LOG_LEVEL_TAGGING,
2685             "Tagger %s has empty joblist. Nothing to do.", b->name);
2686          continue;
2687       }
2688
2689       /* execute their pcrs_joblist on the body. */
2690       for (job = joblist; NULL != job; job = job->next)
2691       {
2692          const int hits = pcrs_execute(job, tag, size, &modified_tag, &size);
2693
2694          if (0 < hits)
2695          {
2696             /* Success, continue with the modified version. */
2697             if (tag != csp->client_iob->cur)
2698             {
2699                freez(tag);
2700             }
2701             tag = modified_tag;
2702          }
2703          else
2704          {
2705             /* Tagger doesn't match */
2706             if (0 > hits)
2707             {
2708                /* Regex failure, log it but continue anyway. */
2709                log_error(LOG_LEVEL_ERROR,
2710                   "Problems with tagger \'%s\': %s",
2711                   b->name, pcrs_strerror(hits));
2712             }
2713             freez(modified_tag);
2714          }
2715       }
2716
2717       if (b->dynamic) pcrs_free_joblist(joblist);
2718
2719       /* If this tagger matched */
2720       if (tag != csp->client_iob->cur)
2721       {
2722          if (0 == size)
2723          {
2724             /*
2725              * There is no technical limitation which makes
2726              * it impossible to use empty tags, but I assume
2727              * no one would do it intentionally.
2728              */
2729             freez(tag);
2730             log_error(LOG_LEVEL_TAGGING,
2731                "Tagger \'%s\' created an empty tag. Ignored.", b->name);
2732             continue;
2733          }
2734
2735          if (list_contains_item(csp->action->multi[ACTION_MULTI_SUPPRESS_TAG], tag))
2736          {
2737             log_error(LOG_LEVEL_TAGGING,
2738                "Tagger \'%s\' didn't add tag \'%s\': suppressed",
2739                b->name, tag);
2740             freez(tag);
2741             continue;
2742          }
2743
2744          if (!list_contains_item(csp->tags, tag))
2745          {
2746             if (JB_ERR_OK != enlist(csp->tags, tag))
2747             {
2748                log_error(LOG_LEVEL_ERROR,
2749                   "Insufficient memory to add tag \'%s\', "
2750                   "based on tagger \'%s\'",
2751                   tag, b->name);
2752             }
2753             else
2754             {
2755                char *action_message;
2756                /*
2757                 * update the action bits right away, to make
2758                 * tagging based on tags set by earlier taggers
2759                 * of the same kind possible.
2760                 */
2761                if (update_action_bits_for_tag(csp, tag))
2762                {
2763                   action_message = "Action bits updated accordingly.";
2764                }
2765                else
2766                {
2767                   action_message = "No action bits update necessary.";
2768                }
2769
2770                log_error(LOG_LEVEL_TAGGING,
2771                   "Tagger \'%s\' added tag \'%s\'. %s",
2772                   b->name, tag, action_message);
2773             }
2774          }
2775          else
2776          {
2777             /* XXX: Is this log-worthy? */
2778             log_error(LOG_LEVEL_TAGGING,
2779                "Tagger \'%s\' didn't add tag \'%s\'. Tag already present",
2780                b->name, tag);
2781          }
2782          freez(tag);
2783       }
2784    }
2785
2786    return JB_ERR_OK;
2787 }
2788
2789
2790 /*********************************************************************
2791  *
2792  * Function    :  get_url_actions
2793  *
2794  * Description :  Gets the actions for this URL.
2795  *
2796  * Parameters  :
2797  *          1  :  csp = Current client state (buffers, headers, etc...)
2798  *          2  :  http = http_request request for blocked URLs
2799  *
2800  * Returns     :  N/A
2801  *
2802  *********************************************************************/
2803 void get_url_actions(struct client_state *csp, struct http_request *http)
2804 {
2805    struct file_list *fl;
2806    struct url_actions *b;
2807    int i;
2808
2809    init_current_action(csp->action);
2810
2811    for (i = 0; i < MAX_AF_FILES; i++)
2812    {
2813       if (((fl = csp->actions_list[i]) == NULL) || ((b = fl->f) == NULL))
2814       {
2815          return;
2816       }
2817
2818 #ifdef FEATURE_CLIENT_TAGS
2819       apply_url_actions(csp->action, http, csp->client_tags, b);
2820 #else
2821       apply_url_actions(csp->action, http, b);
2822 #endif
2823    }
2824
2825    return;
2826 }
2827
2828 /*********************************************************************
2829  *
2830  * Function    :  apply_url_actions
2831  *
2832  * Description :  Applies a list of URL actions.
2833  *
2834  * Parameters  :
2835  *          1  :  action = Destination.
2836  *          2  :  http = Current URL
2837  *          3  :  client_tags = list of client tags
2838  *          4  :  b = list of URL actions to apply
2839  *
2840  * Returns     :  N/A
2841  *
2842  *********************************************************************/
2843 static void apply_url_actions(struct current_action_spec *action,
2844                               struct http_request *http,
2845 #ifdef FEATURE_CLIENT_TAGS
2846                               const struct list *client_tags,
2847 #endif
2848                               struct url_actions *b)
2849 {
2850    if (b == NULL)
2851    {
2852       /* Should never happen */
2853       return;
2854    }
2855
2856    for (b = b->next; NULL != b; b = b->next)
2857    {
2858       if (url_match(b->url, http))
2859       {
2860          merge_current_action(action, b->action);
2861       }
2862 #ifdef FEATURE_CLIENT_TAGS
2863       if (client_tag_match(b->url, client_tags))
2864       {
2865          merge_current_action(action, b->action);
2866       }
2867 #endif
2868    }
2869 }
2870
2871
2872 /*********************************************************************
2873  *
2874  * Function    :  get_forward_override_settings
2875  *
2876  * Description :  Returns forward settings as specified with the
2877  *                forward-override{} action. forward-override accepts
2878  *                forward lines similar to the one used in the
2879  *                configuration file, but without the URL pattern.
2880  *
2881  *                For example:
2882  *
2883  *                   forward / .
2884  *
2885  *                in the configuration file can be replaced with
2886  *                the action section:
2887  *
2888  *                 {+forward-override{forward .}}
2889  *                 /
2890  *
2891  * Parameters  :
2892  *          1  :  csp = Current client state (buffers, headers, etc...)
2893  *
2894  * Returns     :  Pointer to forwarding structure in case of success.
2895  *                Invalid syntax is fatal.
2896  *
2897  *********************************************************************/
2898 static const struct forward_spec *get_forward_override_settings(struct client_state *csp)
2899 {
2900    const char *forward_override_line = csp->action->string[ACTION_STRING_FORWARD_OVERRIDE];
2901    char forward_settings[BUFFER_SIZE];
2902    char *http_parent = NULL;
2903    /* variable names were chosen for consistency reasons. */
2904    struct forward_spec *fwd = NULL;
2905    int vec_count;
2906    char *vec[3];
2907
2908    assert(csp->action->flags & ACTION_FORWARD_OVERRIDE);
2909    /* Should be enforced by load_one_actions_file() */
2910    assert(strlen(forward_override_line) < sizeof(forward_settings) - 1);
2911
2912    /* Create a copy ssplit can modify */
2913    strlcpy(forward_settings, forward_override_line, sizeof(forward_settings));
2914
2915    if (NULL != csp->fwd)
2916    {
2917       /*
2918        * XXX: Currently necessary to prevent memory
2919        * leaks when the show-url-info cgi page is visited.
2920        */
2921       unload_forward_spec(csp->fwd);
2922    }
2923
2924    /*
2925     * allocate a new forward node, valid only for
2926     * the lifetime of this request. Save its location
2927     * in csp as well, so sweep() can free it later on.
2928     */
2929    fwd = csp->fwd = zalloc_or_die(sizeof(*fwd));
2930
2931    vec_count = ssplit(forward_settings, " \t", vec, SZ(vec));
2932    if ((vec_count == 2) && !strcasecmp(vec[0], "forward"))
2933    {
2934       fwd->type = SOCKS_NONE;
2935
2936       /* Parse the parent HTTP proxy host:port */
2937       http_parent = vec[1];
2938
2939    }
2940    else if ((vec_count == 2) && !strcasecmp(vec[0], "forward-webserver"))
2941    {
2942       fwd->type = FORWARD_WEBSERVER;
2943
2944       /* Parse the parent HTTP server host:port */
2945       http_parent = vec[1];
2946
2947    }
2948    else if (vec_count == 3)
2949    {
2950       char *socks_proxy = NULL;
2951
2952       if  (!strcasecmp(vec[0], "forward-socks4"))
2953       {
2954          fwd->type = SOCKS_4;
2955          socks_proxy = vec[1];
2956       }
2957       else if (!strcasecmp(vec[0], "forward-socks4a"))
2958       {
2959          fwd->type = SOCKS_4A;
2960          socks_proxy = vec[1];
2961       }
2962       else if (!strcasecmp(vec[0], "forward-socks5"))
2963       {
2964          fwd->type = SOCKS_5;
2965          socks_proxy = vec[1];
2966       }
2967       else if (!strcasecmp(vec[0], "forward-socks5t"))
2968       {
2969          fwd->type = SOCKS_5T;
2970          socks_proxy = vec[1];
2971       }
2972
2973       if (NULL != socks_proxy)
2974       {
2975          /* Parse the SOCKS proxy [user:pass@]host[:port] */
2976          fwd->gateway_port = 1080;
2977          parse_forwarder_address(socks_proxy,
2978             &fwd->gateway_host, &fwd->gateway_port,
2979             &fwd->auth_username, &fwd->auth_password);
2980
2981          http_parent = vec[2];
2982       }
2983    }
2984
2985    if (NULL == http_parent)
2986    {
2987       log_error(LOG_LEVEL_FATAL,
2988          "Invalid forward-override syntax in: %s", forward_override_line);
2989       /* Never get here - LOG_LEVEL_FATAL causes program exit */
2990    }
2991
2992    /* Parse http forwarding settings */
2993    if (strcmp(http_parent, ".") != 0)
2994    {
2995       fwd->forward_port = 8000;
2996       parse_forwarder_address(http_parent,
2997          &fwd->forward_host, &fwd->forward_port,
2998          NULL, NULL);
2999    }
3000
3001    assert (NULL != fwd);
3002
3003    log_error(LOG_LEVEL_CONNECT,
3004       "Overriding forwarding settings based on \'%s\'", forward_override_line);
3005
3006    return fwd;
3007 }
3008
3009
3010 /*********************************************************************
3011  *
3012  * Function    :  forward_url
3013  *
3014  * Description :  Should we forward this to another proxy?
3015  *
3016  * Parameters  :
3017  *          1  :  csp = Current client state (buffers, headers, etc...)
3018  *          2  :  http = http_request request for current URL
3019  *
3020  * Returns     :  Pointer to forwarding information.
3021  *
3022  *********************************************************************/
3023 const struct forward_spec *forward_url(struct client_state *csp,
3024                                        const struct http_request *http)
3025 {
3026    static const struct forward_spec fwd_default[1]; /* Zero'ed due to being static. */
3027    struct forward_spec *fwd = csp->config->forward;
3028
3029    if (csp->action->flags & ACTION_FORWARD_OVERRIDE)
3030    {
3031       return get_forward_override_settings(csp);
3032    }
3033
3034    if (fwd == NULL)
3035    {
3036       return fwd_default;
3037    }
3038
3039    while (fwd != NULL)
3040    {
3041       if (url_match(fwd->url, http))
3042       {
3043          return fwd;
3044       }
3045       fwd = fwd->next;
3046    }
3047
3048    return fwd_default;
3049 }
3050
3051
3052 /*********************************************************************
3053  *
3054  * Function    :  direct_response
3055  *
3056  * Description :  Check if Max-Forwards == 0 for an OPTIONS or TRACE
3057  *                request and if so, return a HTTP 501 to the client.
3058  *
3059  *                FIXME: I have a stupid name and I should handle the
3060  *                requests properly. Still, what we do here is rfc-
3061  *                compliant, whereas ignoring or forwarding are not.
3062  *
3063  * Parameters  :
3064  *          1  :  csp = Current client state (buffers, headers, etc...)
3065  *
3066  * Returns     :  http_response if , NULL if nonmatch or handler fail
3067  *
3068  *********************************************************************/
3069 struct http_response *direct_response(struct client_state *csp)
3070 {
3071    struct http_response *rsp;
3072    struct list_entry *p;
3073
3074    if ((0 == strcmpic(csp->http->gpc, "trace"))
3075       || (0 == strcmpic(csp->http->gpc, "options")))
3076    {
3077       for (p = csp->headers->first; (p != NULL) ; p = p->next)
3078       {
3079          if (!strncmpic(p->str, "Max-Forwards:", 13))
3080          {
3081             unsigned int max_forwards;
3082
3083             /*
3084              * If it's a Max-Forwards value of zero,
3085              * we have to intercept the request.
3086              */
3087             if (1 == sscanf(p->str+12, ": %u", &max_forwards) && max_forwards == 0)
3088             {
3089                /*
3090                 * FIXME: We could handle at least TRACE here,
3091                 * but that would require a verbatim copy of
3092                 * the request which we don't have anymore
3093                 */
3094                 log_error(LOG_LEVEL_HEADER,
3095                   "Detected header \'%s\' in OPTIONS or TRACE request. Returning 501.",
3096                   p->str);
3097
3098                /* Get mem for response or fail*/
3099                if (NULL == (rsp = alloc_http_response()))
3100                {
3101                   return cgi_error_memory();
3102                }
3103
3104                rsp->status = strdup_or_die("501 Not Implemented");
3105                rsp->is_static = 1;
3106                rsp->crunch_reason = UNSUPPORTED;
3107
3108                return(finish_http_response(csp, rsp));
3109             }
3110          }
3111       }
3112    }
3113    return NULL;
3114 }
3115
3116
3117 /*********************************************************************
3118  *
3119  * Function    :  content_requires_filtering
3120  *
3121  * Description :  Checks whether there are any content filters
3122  *                enabled for the current request and if they
3123  *                can actually be applied..
3124  *
3125  * Parameters  :
3126  *          1  :  csp = Current client state (buffers, headers, etc...)
3127  *
3128  * Returns     :  TRUE for yes, FALSE otherwise
3129  *
3130  *********************************************************************/
3131 int content_requires_filtering(struct client_state *csp)
3132 {
3133    if ((csp->content_type & CT_TABOO)
3134       && !(csp->action->flags & ACTION_FORCE_TEXT_MODE))
3135    {
3136       return FALSE;
3137    }
3138
3139    /*
3140     * Are we enabling text mode by force?
3141     */
3142    if (csp->action->flags & ACTION_FORCE_TEXT_MODE)
3143    {
3144       /*
3145        * Do we really have to?
3146        */
3147       if (csp->content_type & CT_TEXT)
3148       {
3149          log_error(LOG_LEVEL_HEADER, "Text mode is already enabled.");
3150       }
3151       else
3152       {
3153          csp->content_type |= CT_TEXT;
3154          log_error(LOG_LEVEL_HEADER, "Text mode enabled by force. Take cover!");
3155       }
3156    }
3157
3158    if (!(csp->content_type & CT_DECLARED))
3159    {
3160       /*
3161        * The server didn't bother to declare a MIME-Type.
3162        * Assume it's text that can be filtered.
3163        *
3164        * This also regularly happens with 304 responses,
3165        * therefore logging anything here would cause
3166        * too much noise.
3167        */
3168       csp->content_type |= CT_TEXT;
3169    }
3170
3171    /*
3172     * Choose the applying filter function based on
3173     * the content type and action settings.
3174     */
3175    if ((csp->content_type & CT_TEXT) &&
3176        (!list_is_empty(csp->action->multi[ACTION_MULTI_FILTER]) ||
3177         !list_is_empty(csp->action->multi[ACTION_MULTI_EXTERNAL_FILTER])))
3178    {
3179       return TRUE;
3180    }
3181    else if ((csp->content_type & CT_GIF)  &&
3182             (csp->action->flags & ACTION_DEANIMATE))
3183    {
3184       return TRUE;
3185    }
3186
3187    return FALSE;
3188
3189 }
3190
3191
3192 /*********************************************************************
3193  *
3194  * Function    :  content_filters_enabled
3195  *
3196  * Description :  Checks whether there are any content filters
3197  *                enabled for the current request.
3198  *
3199  * Parameters  :
3200  *          1  :  action = Action spec to check.
3201  *
3202  * Returns     :  TRUE for yes, FALSE otherwise
3203  *
3204  *********************************************************************/
3205 int content_filters_enabled(const struct current_action_spec *action)
3206 {
3207    return ((action->flags & ACTION_DEANIMATE) ||
3208       !list_is_empty(action->multi[ACTION_MULTI_FILTER]) ||
3209       !list_is_empty(action->multi[ACTION_MULTI_EXTERNAL_FILTER]));
3210 }
3211
3212
3213 /*********************************************************************
3214  *
3215  * Function    :  client_body_filters_enabled
3216  *
3217  * Description :  Checks whether there are any client body filters
3218  *                enabled for the current request.
3219  *
3220  * Parameters  :
3221  *          1  :  action = Action spec to check.
3222  *
3223  * Returns     :  TRUE for yes, FALSE otherwise
3224  *
3225  *********************************************************************/
3226 int client_body_filters_enabled(const struct current_action_spec *action)
3227 {
3228    return !list_is_empty(action->multi[ACTION_MULTI_CLIENT_BODY_FILTER]);
3229 }
3230
3231
3232 /*********************************************************************
3233  *
3234  * Function    :  client_body_taggers_enabled
3235  *
3236  * Description :  Checks whether there are any client body taggers
3237  *                enabled for the current request.
3238  *
3239  * Parameters  :
3240  *          1  :  action = Action spec to check.
3241  *
3242  * Returns     :  TRUE for yes, FALSE otherwise
3243  *
3244  *********************************************************************/
3245 int client_body_taggers_enabled(const struct current_action_spec *action)
3246 {
3247    return !list_is_empty(action->multi[ACTION_MULTI_CLIENT_BODY_TAGGER]);
3248 }
3249
3250 /*********************************************************************
3251  *
3252  * Function    :  filters_available
3253  *
3254  * Description :  Checks whether there are any filters available.
3255  *
3256  * Parameters  :
3257  *          1  :  csp = Current client state (buffers, headers, etc...)
3258  *
3259  * Returns     :  TRUE for yes, FALSE otherwise.
3260  *
3261  *********************************************************************/
3262 int filters_available(const struct client_state *csp)
3263 {
3264    int i;
3265    for (i = 0; i < MAX_AF_FILES; i++)
3266    {
3267       const struct file_list *fl = csp->rlist[i];
3268       if ((NULL != fl) && (NULL != fl->f))
3269       {
3270          return TRUE;
3271       }
3272    }
3273    return FALSE;
3274 }
3275
3276 #ifdef FEATURE_EXTENDED_STATISTICS
3277
3278 struct filter_statistics_entry
3279 {
3280    char *filter;
3281    unsigned long long executions;
3282    unsigned long long response_bodies_modified;
3283    unsigned long long hits;
3284
3285    struct filter_statistics_entry *next;
3286 };
3287
3288 static struct filter_statistics_entry *filter_statistics = NULL;
3289
3290
3291 /*********************************************************************
3292  *
3293  * Function    :  register_filter_for_statistics
3294  *
3295  * Description :  Registers a filter so we can gather statistics for
3296  *                it unless the filter has already been registered
3297  *                before.
3298  *
3299  * Parameters  :
3300  *          1  :  filter = Name of the filter to register
3301  *
3302  * Returns     :  void
3303  *
3304  *********************************************************************/
3305 void register_filter_for_statistics(const char *filter)
3306 {
3307    struct filter_statistics_entry *entry;
3308
3309    privoxy_mutex_lock(&filter_statistics_mutex);
3310
3311    if (filter_statistics == NULL)
3312    {
3313       filter_statistics = zalloc_or_die(sizeof(struct filter_statistics_entry));
3314       entry = filter_statistics;
3315       entry->filter = strdup_or_die(filter);
3316       privoxy_mutex_unlock(&filter_statistics_mutex);
3317       return;
3318    }
3319    entry = filter_statistics;
3320    while (entry != NULL)
3321    {
3322       if (!strcmp(entry->filter, filter))
3323       {
3324          /* Already registered, nothing to do. */
3325          break;
3326       }
3327       if (entry->next == NULL)
3328       {
3329          entry->next = zalloc_or_die(sizeof(struct filter_statistics_entry));
3330          entry->next->filter = strdup_or_die(filter);
3331          break;
3332       }
3333       entry = entry->next;
3334    }
3335
3336    privoxy_mutex_unlock(&filter_statistics_mutex);
3337
3338 }
3339
3340
3341 /*********************************************************************
3342  *
3343  * Function    :  update_filter_statistics
3344  *
3345  * Description :  Updates the statistics for a filter.
3346  *
3347  * Parameters  :
3348  *          1  :  filter = Name of the filter to update
3349  *          2  :  hits = Hit count.
3350  *
3351  * Returns     :  void
3352  *
3353  *********************************************************************/
3354 void update_filter_statistics(const char *filter, int hits)
3355 {
3356    struct filter_statistics_entry *entry;
3357
3358    privoxy_mutex_lock(&filter_statistics_mutex);
3359
3360    entry = filter_statistics;
3361    while (entry != NULL)
3362    {
3363       if (!strcmp(entry->filter, filter))
3364       {
3365          entry->executions++;
3366          if (hits != 0)
3367          {
3368             entry->response_bodies_modified++;
3369             entry->hits += (unsigned)hits;
3370          }
3371          break;
3372       }
3373       entry = entry->next;
3374    }
3375
3376    privoxy_mutex_unlock(&filter_statistics_mutex);
3377
3378 }
3379
3380
3381 /*********************************************************************
3382  *
3383  * Function    :  get_filter_statistics
3384  *
3385  * Description :  Gets the statistics for a filter.
3386  *
3387  * Parameters  :
3388  *          1  :  filter = Name of the filter to get statistics for.
3389  *          2  :  executions = Storage for the execution count.
3390  *          3  :  response_bodies_modified = Storage for the number
3391  *                of modified response bodies.
3392  *          4  :  hits = Storage for the number of hits.
3393  *
3394  * Returns     :  void
3395  *
3396  *********************************************************************/
3397 void get_filter_statistics(const char *filter, unsigned long long *executions,
3398                            unsigned long long *response_bodies_modified,
3399                            unsigned long long *hits)
3400 {
3401    struct filter_statistics_entry *entry;
3402
3403    privoxy_mutex_lock(&filter_statistics_mutex);
3404
3405    entry = filter_statistics;
3406    while (entry != NULL)
3407    {
3408       if (!strcmp(entry->filter, filter))
3409       {
3410          *executions = entry->executions;
3411          *response_bodies_modified = entry->response_bodies_modified;
3412          *hits = entry->hits;
3413          break;
3414       }
3415       entry = entry->next;
3416    }
3417
3418    privoxy_mutex_unlock(&filter_statistics_mutex);
3419
3420 }
3421
3422
3423 struct block_statistics_entry
3424 {
3425    char *block_reason;
3426    unsigned long long count;
3427
3428    struct block_statistics_entry *next;
3429 };
3430
3431 static struct block_statistics_entry *block_statistics = NULL;
3432
3433 /*********************************************************************
3434  *
3435  * Function    :  register_block_reason_for_statistics
3436  *
3437  * Description :  Registers a block reason so we can gather statistics
3438  *                for it unless the block reason has already been
3439  *                registered before.
3440  *
3441  * Parameters  :
3442  *          1  :  block_reason = Block reason to register
3443  *
3444  * Returns     :  void
3445  *
3446  *********************************************************************/
3447 void register_block_reason_for_statistics(const char *block_reason)
3448 {
3449    struct block_statistics_entry *entry;
3450
3451    privoxy_mutex_lock(&block_reason_statistics_mutex);
3452
3453    if (block_statistics == NULL)
3454    {
3455       block_statistics = zalloc_or_die(sizeof(struct block_statistics_entry));
3456       entry = block_statistics;
3457       entry->block_reason = strdup_or_die(block_reason);
3458       privoxy_mutex_unlock(&block_reason_statistics_mutex);
3459       return;
3460    }
3461    entry = block_statistics;
3462    while (entry != NULL)
3463    {
3464       if (!strcmp(entry->block_reason, block_reason))
3465       {
3466          /* Already registered, nothing to do. */
3467          break;
3468       }
3469       if (entry->next == NULL)
3470       {
3471          entry->next = zalloc_or_die(sizeof(struct block_statistics_entry));
3472          entry->next->block_reason = strdup_or_die(block_reason);
3473          break;
3474       }
3475       entry = entry->next;
3476    }
3477
3478    privoxy_mutex_unlock(&block_reason_statistics_mutex);
3479
3480 }
3481
3482
3483 /*********************************************************************
3484  *
3485  * Function    :  increment_block_reason_counter
3486  *
3487  * Description :  Updates the counter for a block reason.
3488  *
3489  * Parameters  :
3490  *          1  :  block_reason = Block reason to count
3491  *
3492  * Returns     :  void
3493  *
3494  *********************************************************************/
3495 static void increment_block_reason_counter(const char *block_reason)
3496 {
3497    struct block_statistics_entry *entry;
3498
3499    privoxy_mutex_lock(&block_reason_statistics_mutex);
3500
3501    entry = block_statistics;
3502    while (entry != NULL)
3503    {
3504       if (!strcmp(entry->block_reason, block_reason))
3505       {
3506          entry->count++;
3507          break;
3508       }
3509       entry = entry->next;
3510    }
3511
3512    privoxy_mutex_unlock(&block_reason_statistics_mutex);
3513
3514 }
3515
3516
3517 /*********************************************************************
3518  *
3519  * Function    :  get_block_reason_count
3520  *
3521  * Description :  Gets number of times a block reason was used.
3522  *
3523  * Parameters  :
3524  *          1  :  block_reason = Block reason to get statistics for.
3525  *          2  :  count = Storage for the number of times the block
3526  *                        reason was used.
3527  *
3528  * Returns     :  void
3529  *
3530  *********************************************************************/
3531 void get_block_reason_count(const char *block_reason, unsigned long long *count)
3532 {
3533    struct block_statistics_entry *entry;
3534
3535    privoxy_mutex_lock(&block_reason_statistics_mutex);
3536
3537    entry = block_statistics;
3538    while (entry != NULL)
3539    {
3540       if (!strcmp(entry->block_reason, block_reason))
3541       {
3542          *count = entry->count;
3543          break;
3544       }
3545       entry = entry->next;
3546    }
3547
3548    privoxy_mutex_unlock(&block_reason_statistics_mutex);
3549
3550 }
3551
3552 #endif /* def FEATURE_EXTENDED_STATISTICS */
3553
3554 /*
3555   Local Variables:
3556   tab-width: 3
3557   end:
3558 */