Disable fast-redirects for launchpad.net/
[privoxy.git] / filters.c
1 /*********************************************************************
2  *
3  * File        :  $Source: /cvsroot/ijbswa/current/filters.c,v $
4  *
5  * Purpose     :  Declares functions to parse/crunch headers and pages.
6  *
7  * Copyright   :  Written by and Copyright (C) 2001-2020 the
8  *                Privoxy team. https://www.privoxy.org/
9  *
10  *                Based on the Internet Junkbuster originally written
11  *                by and Copyright (C) 1997 Anonymous Coders and
12  *                Junkbusters Corporation.  http://www.junkbusters.com
13  *
14  *                This program is free software; you can redistribute it
15  *                and/or modify it under the terms of the GNU General
16  *                Public License as published by the Free Software
17  *                Foundation; either version 2 of the License, or (at
18  *                your option) any later version.
19  *
20  *                This program is distributed in the hope that it will
21  *                be useful, but WITHOUT ANY WARRANTY; without even the
22  *                implied warranty of MERCHANTABILITY or FITNESS FOR A
23  *                PARTICULAR PURPOSE.  See the GNU General Public
24  *                License for more details.
25  *
26  *                The GNU General Public License should be included with
27  *                this file.  If not, you can view it at
28  *                http://www.gnu.org/copyleft/gpl.html
29  *                or write to the Free Software Foundation, Inc., 59
30  *                Temple Place - Suite 330, Boston, MA  02111-1307, USA.
31  *
32  *********************************************************************/
33
34
35 #include "config.h"
36
37 #include <stdio.h>
38 #include <sys/types.h>
39 #include <stdlib.h>
40 #include <ctype.h>
41 #include <string.h>
42 #include <assert.h>
43
44 #ifndef _WIN32
45 #include <unistd.h>
46 #include <netinet/in.h>
47 #else
48 #include <winsock2.h>
49 #endif /* ndef _WIN32 */
50
51 #include "project.h"
52 #include "filters.h"
53 #include "encode.h"
54 #include "parsers.h"
55 #include "ssplit.h"
56 #include "errlog.h"
57 #include "jbsockets.h"
58 #include "miscutil.h"
59 #include "actions.h"
60 #include "cgi.h"
61 #include "jcc.h"
62 #include "list.h"
63 #include "deanimate.h"
64 #include "urlmatch.h"
65 #include "loaders.h"
66 #ifdef FEATURE_CLIENT_TAGS
67 #include "client-tags.h"
68 #endif
69 #ifdef FEATURE_HTTPS_INSPECTION
70 #include "ssl.h"
71 #endif
72
73 #ifdef _WIN32
74 #include "win32.h"
75 #endif
76
77 typedef char *(*filter_function_ptr)();
78 static filter_function_ptr get_filter_function(const struct client_state *csp);
79 static jb_err prepare_for_filtering(struct client_state *csp);
80 static void apply_url_actions(struct current_action_spec *action,
81                               struct http_request *http,
82 #ifdef FEATURE_CLIENT_TAGS
83                               const struct list *client_tags,
84 #endif
85                               struct url_actions *b);
86
87 #ifdef FEATURE_EXTENDED_STATISTICS
88 static void increment_block_reason_counter(const char *block_reason);
89 #endif
90
91 #ifdef FEATURE_ACL
92 #ifdef HAVE_RFC2553
93 /*********************************************************************
94  *
95  * Function    :  sockaddr_storage_to_ip
96  *
97  * Description :  Access internal structure of sockaddr_storage
98  *
99  * Parameters  :
100  *          1  :  addr = socket address
101  *          2  :  ip   = IP address as array of octets in network order
102  *                       (it points into addr)
103  *          3  :  len  = length of IP address in octets
104  *          4  :  port = port number in network order;
105  *
106  * Returns     :  void
107  *
108  *********************************************************************/
109 static void sockaddr_storage_to_ip(const struct sockaddr_storage *addr,
110                                    uint8_t **ip, unsigned int *len,
111                                    in_port_t **port)
112 {
113    assert(NULL != addr);
114    assert(addr->ss_family == AF_INET || addr->ss_family == AF_INET6);
115
116    switch (addr->ss_family)
117    {
118       case AF_INET:
119          if (NULL != len)
120          {
121             *len = 4;
122          }
123          if (NULL != ip)
124          {
125             *ip = (uint8_t *)
126                &(((struct sockaddr_in *)addr)->sin_addr.s_addr);
127          }
128          if (NULL != port)
129          {
130             *port = &((struct sockaddr_in *)addr)->sin_port;
131          }
132          break;
133
134       case AF_INET6:
135          if (NULL != len)
136          {
137             *len = 16;
138          }
139          if (NULL != ip)
140          {
141             *ip = ((struct sockaddr_in6 *)addr)->sin6_addr.s6_addr;
142          }
143          if (NULL != port)
144          {
145             *port = &((struct sockaddr_in6 *)addr)->sin6_port;
146          }
147          break;
148
149    }
150 }
151
152
153 /*********************************************************************
154  *
155  * Function    :  match_sockaddr
156  *
157  * Description :  Check whether address matches network (IP address and port)
158  *
159  * Parameters  :
160  *          1  :  network = socket address of subnework
161  *          2  :  netmask = network mask as socket address
162  *          3  :  address = checked socket address against given network
163  *
164  * Returns     :  0 = doesn't match; 1 = does match
165  *
166  *********************************************************************/
167 static int match_sockaddr(const struct sockaddr_storage *network,
168                           const struct sockaddr_storage *netmask,
169                           const struct sockaddr_storage *address)
170 {
171    uint8_t *network_addr, *netmask_addr, *address_addr;
172    unsigned int addr_len;
173    in_port_t *network_port, *netmask_port, *address_port;
174    int i;
175
176    if (network->ss_family != netmask->ss_family)
177    {
178       /* This should never happen */
179       assert(network->ss_family == netmask->ss_family);
180       log_error(LOG_LEVEL_FATAL, "Network and netmask differ in family.");
181    }
182
183    sockaddr_storage_to_ip(network, &network_addr, &addr_len, &network_port);
184    sockaddr_storage_to_ip(netmask, &netmask_addr, NULL, &netmask_port);
185    sockaddr_storage_to_ip(address, &address_addr, NULL, &address_port);
186
187    /* Check for family */
188    if ((network->ss_family == AF_INET) && (address->ss_family == AF_INET6)
189       && IN6_IS_ADDR_V4MAPPED((struct in6_addr *)address_addr))
190    {
191       /* Map AF_INET6 V4MAPPED address into AF_INET */
192       address_addr += 12;
193       addr_len = 4;
194    }
195    else if ((network->ss_family == AF_INET6) && (address->ss_family == AF_INET)
196       && IN6_IS_ADDR_V4MAPPED((struct in6_addr *)network_addr))
197    {
198       /* Map AF_INET6 V4MAPPED network into AF_INET */
199       network_addr += 12;
200       netmask_addr += 12;
201       addr_len = 4;
202    }
203
204    /* XXX: Port check is signaled in netmask */
205    if (*netmask_port && *network_port != *address_port)
206    {
207       return 0;
208    }
209
210    /* TODO: Optimize by checking by words instead of octets */
211    for (i = 0; (i < addr_len) && netmask_addr[i]; i++)
212    {
213       if ((network_addr[i] & netmask_addr[i]) !=
214           (address_addr[i] & netmask_addr[i]))
215       {
216          return 0;
217       }
218    }
219
220    return 1;
221 }
222 #endif /* def HAVE_RFC2553 */
223
224
225 /*********************************************************************
226  *
227  * Function    :  block_acl
228  *
229  * Description :  Block this request?
230  *                Decide yes or no based on ACL file.
231  *
232  * Parameters  :
233  *          1  :  dst = The proxy or gateway address this is going to.
234  *                      Or NULL to check all possible targets.
235  *          2  :  csp = Current client state (buffers, headers, etc...)
236  *                      Also includes the client IP address.
237  *
238  * Returns     : 0 = FALSE (don't block) and 1 = TRUE (do block)
239  *
240  *********************************************************************/
241 int block_acl(const struct access_control_addr *dst, const struct client_state *csp)
242 {
243    struct access_control_list *acl = csp->config->acl;
244
245    /* if not using an access control list, then permit the connection */
246    if (acl == NULL)
247    {
248       return(0);
249    }
250
251    /* search the list */
252    while (acl != NULL)
253    {
254       if (
255 #ifdef HAVE_RFC2553
256             match_sockaddr(&acl->src->addr, &acl->src->mask, &csp->tcp_addr)
257 #else
258             (csp->ip_addr_long & acl->src->mask) == acl->src->addr
259 #endif
260             )
261       {
262          if (dst == NULL)
263          {
264             /* Just want to check if they have any access */
265             if (acl->action == ACL_PERMIT)
266             {
267                return(0);
268             }
269             else
270             {
271                return(1);
272             }
273          }
274          else if (
275 #ifdef HAVE_RFC2553
276                /*
277                 * XXX: An undefined acl->dst is full of zeros and should be
278                 * considered a wildcard address. sockaddr_storage_to_ip()
279                 * fails on such destinations because of unknown sa_familly
280                 * (glibc only?). However this test is not portable.
281                 *
282                 * So, we signal the acl->dst is wildcard in wildcard_dst.
283                 */
284                acl->wildcard_dst ||
285                   match_sockaddr(&acl->dst->addr, &acl->dst->mask, &dst->addr)
286 #else
287                ((dst->addr & acl->dst->mask) == acl->dst->addr)
288            && ((dst->port == acl->dst->port) || (acl->dst->port == 0))
289 #endif
290            )
291          {
292             if (acl->action == ACL_PERMIT)
293             {
294                return(0);
295             }
296             else
297             {
298                return(1);
299             }
300          }
301       }
302       acl = acl->next;
303    }
304
305    return(1);
306
307 }
308
309
310 /*********************************************************************
311  *
312  * Function    :  acl_addr
313  *
314  * Description :  Called from `load_config' to parse an ACL address.
315  *
316  * Parameters  :
317  *          1  :  aspec = String specifying ACL address.
318  *          2  :  aca = struct access_control_addr to fill in.
319  *
320  * Returns     :  0 => Ok, everything else is an error.
321  *
322  *********************************************************************/
323 int acl_addr(const char *aspec, struct access_control_addr *aca)
324 {
325    int i, masklength;
326 #ifdef HAVE_RFC2553
327    struct addrinfo hints, *result;
328    uint8_t *mask_data;
329    in_port_t *mask_port;
330    unsigned int addr_len;
331 #else
332    long port;
333 #endif /* def HAVE_RFC2553 */
334    char *p;
335    char *acl_spec = NULL;
336
337 #ifdef HAVE_RFC2553
338    /* XXX: Depend on ai_family */
339    masklength = 128;
340 #else
341    masklength = 32;
342    port       =  0;
343 #endif
344
345    /*
346     * Use a temporary acl spec copy so we can log
347     * the unmodified original in case of parse errors.
348     */
349    acl_spec = strdup_or_die(aspec);
350
351    if ((p = strchr(acl_spec, '/')) != NULL)
352    {
353       *p++ = '\0';
354       if (privoxy_isdigit(*p) == 0)
355       {
356          freez(acl_spec);
357          return(-1);
358       }
359       masklength = atoi(p);
360    }
361
362    if ((masklength < 0) ||
363 #ifdef HAVE_RFC2553
364          (masklength > 128)
365 #else
366          (masklength > 32)
367 #endif
368          )
369    {
370       freez(acl_spec);
371       return(-1);
372    }
373
374    if ((*acl_spec == '[') && (NULL != (p = strchr(acl_spec, ']'))))
375    {
376       *p = '\0';
377       memmove(acl_spec, acl_spec + 1, (size_t)(p - acl_spec));
378
379       if (*++p != ':')
380       {
381          p = NULL;
382       }
383    }
384    else
385    {
386       p = strchr(acl_spec, ':');
387    }
388    if (p != NULL)
389    {
390       assert(*p == ':');
391       *p = '\0';
392       p++;
393    }
394
395 #ifdef HAVE_RFC2553
396    memset(&hints, 0, sizeof(struct addrinfo));
397    hints.ai_family = AF_UNSPEC;
398    hints.ai_socktype = SOCK_STREAM;
399
400    i = getaddrinfo(acl_spec, p, &hints, &result);
401
402    if (i != 0)
403    {
404       log_error(LOG_LEVEL_ERROR, "Can not resolve [%s]:%s: %s",
405          acl_spec, p, gai_strerror(i));
406       freez(acl_spec);
407       return(-1);
408    }
409    freez(acl_spec);
410
411    /* TODO: Allow multihomed hostnames */
412    memcpy(&(aca->addr), result->ai_addr, result->ai_addrlen);
413    freeaddrinfo(result);
414 #else
415    if (p != NULL)
416    {
417       char *endptr;
418
419       port = strtol(p, &endptr, 10);
420
421       if (port <= 0 || port > 65535 || *endptr != '\0')
422       {
423          freez(acl_spec);
424          return(-1);
425       }
426    }
427
428    aca->port = (unsigned long)port;
429
430    aca->addr = ntohl(resolve_hostname_to_ip(acl_spec));
431    freez(acl_spec);
432
433    if (aca->addr == INADDR_NONE)
434    {
435       /* XXX: This will be logged as parse error. */
436       return(-1);
437    }
438 #endif /* def HAVE_RFC2553 */
439
440    /* build the netmask */
441 #ifdef HAVE_RFC2553
442    /* Clip masklength according to current family. */
443    if ((aca->addr.ss_family == AF_INET) && (masklength > 32))
444    {
445       masklength = 32;
446    }
447
448    aca->mask.ss_family = aca->addr.ss_family;
449    sockaddr_storage_to_ip(&aca->mask, &mask_data, &addr_len, &mask_port);
450
451    if (p)
452    {
453       /* ACL contains a port number, check ports in the future. */
454       *mask_port = 1;
455    }
456
457    /*
458     * XXX: This could be optimized to operate on whole words instead
459     * of octets (128-bit CPU could do it in one iteration).
460     */
461    /*
462     * Octets after prefix can be omitted because of
463     * previous initialization to zeros.
464     */
465    for (i = 0; (i < addr_len) && masklength; i++)
466    {
467       if (masklength >= 8)
468       {
469          mask_data[i] = 0xFF;
470          masklength -= 8;
471       }
472       else
473       {
474          /*
475           * XXX: This assumes MSB of octet is on the left side.
476           * This should be true for all architectures or solved
477           * by the link layer.
478           */
479          mask_data[i] = (uint8_t)~((1 << (8 - masklength)) - 1);
480          masklength = 0;
481       }
482    }
483
484 #else
485    aca->mask = 0;
486    for (i=1; i <= masklength ; i++)
487    {
488       aca->mask |= (1U << (32 - i));
489    }
490
491    /* now mask off the host portion of the ip address
492     * (i.e. save on the network portion of the address).
493     */
494    aca->addr = aca->addr & aca->mask;
495 #endif /* def HAVE_RFC2553 */
496
497    return(0);
498
499 }
500 #endif /* def FEATURE_ACL */
501
502
503 /*********************************************************************
504  *
505  * Function    :  connect_port_is_forbidden
506  *
507  * Description :  Check to see if CONNECT requests to the destination
508  *                port of this request are forbidden. The check is
509  *                independent of the actual request method.
510  *
511  * Parameters  :
512  *          1  :  csp = Current client state (buffers, headers, etc...)
513  *
514  * Returns     :  True if yes, false otherwise.
515  *
516  *********************************************************************/
517 int connect_port_is_forbidden(const struct client_state *csp)
518 {
519    return ((csp->action->flags & ACTION_LIMIT_CONNECT) &&
520      !match_portlist(csp->action->string[ACTION_STRING_LIMIT_CONNECT],
521         csp->http->port));
522 }
523
524
525 /*********************************************************************
526  *
527  * Function    :  block_url
528  *
529  * Description :  Called from `chat'.  Check to see if we need to block this.
530  *
531  * Parameters  :
532  *          1  :  csp = Current client state (buffers, headers, etc...)
533  *
534  * Returns     :  NULL => unblocked, else HTTP block response
535  *
536  *********************************************************************/
537 struct http_response *block_url(struct client_state *csp)
538 {
539    struct http_response *rsp;
540    const char *new_content_type = NULL;
541
542    /*
543     * If it's not blocked, don't block it ;-)
544     */
545    if ((csp->action->flags & ACTION_BLOCK) == 0)
546    {
547       return NULL;
548    }
549    if (csp->action->flags & ACTION_REDIRECT)
550    {
551       log_error(LOG_LEVEL_ERROR, "redirect{} overruled by block.");
552    }
553    /*
554     * Else, prepare a response
555     */
556    if (NULL == (rsp = alloc_http_response()))
557    {
558       return cgi_error_memory();
559    }
560
561 #ifdef FEATURE_EXTENDED_STATISTICS
562    if (csp->action->string[ACTION_STRING_BLOCK] != NULL)
563    {
564       increment_block_reason_counter(csp->action->string[ACTION_STRING_BLOCK]);
565    }
566 #endif
567
568    /*
569     * If it's an image-url, send back an image or redirect
570     * as specified by the relevant +image action
571     */
572 #ifdef FEATURE_IMAGE_BLOCKING
573    if (((csp->action->flags & ACTION_IMAGE_BLOCKER) != 0)
574         && is_imageurl(csp))
575    {
576       char *p;
577       /* determine HOW images should be blocked */
578       p = csp->action->string[ACTION_STRING_IMAGE_BLOCKER];
579
580       if (csp->action->flags & ACTION_HANDLE_AS_EMPTY_DOCUMENT)
581       {
582          log_error(LOG_LEVEL_ERROR, "handle-as-empty-document overruled by handle-as-image.");
583       }
584
585       /* and handle accordingly: */
586       if ((p == NULL) || (0 == strcmpic(p, "pattern")))
587       {
588          rsp->status = strdup_or_die("403 Request blocked by Privoxy");
589          rsp->body = bindup(image_pattern_data, image_pattern_length);
590          if (rsp->body == NULL)
591          {
592             free_http_response(rsp);
593             return cgi_error_memory();
594          }
595          rsp->content_length = image_pattern_length;
596
597          if (enlist_unique_header(rsp->headers, "Content-Type", BUILTIN_IMAGE_MIMETYPE))
598          {
599             free_http_response(rsp);
600             return cgi_error_memory();
601          }
602       }
603       else if (0 == strcmpic(p, "blank"))
604       {
605          rsp->status = strdup_or_die("403 Request blocked by Privoxy");
606          rsp->body = bindup(image_blank_data, image_blank_length);
607          if (rsp->body == NULL)
608          {
609             free_http_response(rsp);
610             return cgi_error_memory();
611          }
612          rsp->content_length = image_blank_length;
613
614          if (enlist_unique_header(rsp->headers, "Content-Type", BUILTIN_IMAGE_MIMETYPE))
615          {
616             free_http_response(rsp);
617             return cgi_error_memory();
618          }
619       }
620       else
621       {
622          rsp->status = strdup_or_die("302 Local Redirect from Privoxy");
623
624          if (enlist_unique_header(rsp->headers, "Location", p))
625          {
626             free_http_response(rsp);
627             return cgi_error_memory();
628          }
629       }
630
631    }
632    else
633 #endif /* def FEATURE_IMAGE_BLOCKING */
634    if (csp->action->flags & ACTION_HANDLE_AS_EMPTY_DOCUMENT)
635    {
636      /*
637       *  Send empty document.
638       */
639       new_content_type = csp->action->string[ACTION_STRING_CONTENT_TYPE];
640
641       freez(rsp->body);
642       rsp->body = strdup_or_die(" ");
643       rsp->content_length = 1;
644
645       if (csp->config->feature_flags & RUNTIME_FEATURE_EMPTY_DOC_RETURNS_OK)
646       {
647          /*
648           * Workaround for firefox bug 492459
649           *   https://bugzilla.mozilla.org/show_bug.cgi?id=492459
650           * Return a 200 OK status for pages blocked with +handle-as-empty-document
651           * if the "handle-as-empty-doc-returns-ok" runtime config option is set.
652           */
653          rsp->status = strdup_or_die("200 Request blocked by Privoxy");
654       }
655       else
656       {
657          rsp->status = strdup_or_die("403 Request blocked by Privoxy");
658       }
659
660       if (new_content_type != 0)
661       {
662          log_error(LOG_LEVEL_HEADER, "Overwriting Content-Type with %s", new_content_type);
663          if (enlist_unique_header(rsp->headers, "Content-Type", new_content_type))
664          {
665             free_http_response(rsp);
666             return cgi_error_memory();
667          }
668       }
669    }
670    else
671
672    /*
673     * Else, generate an HTML "blocked" message:
674     */
675    {
676       jb_err err;
677       struct map * exports;
678
679       rsp->status = strdup_or_die("403 Request blocked by Privoxy");
680
681       exports = default_exports(csp, NULL);
682       if (exports == NULL)
683       {
684          free_http_response(rsp);
685          return cgi_error_memory();
686       }
687
688 #ifdef FEATURE_FORCE_LOAD
689       err = map(exports, "force-prefix", 1, FORCE_PREFIX, 1);
690       /*
691        * Export the force conditional block killer if
692        *
693        * - Privoxy was compiled without FEATURE_FORCE_LOAD, or
694        * - Privoxy is configured to enforce blocks, or
695        * - it's a CONNECT request and enforcing wouldn't work anyway.
696        */
697       if ((csp->config->feature_flags & RUNTIME_FEATURE_ENFORCE_BLOCKS)
698        || (0 == strcmpic(csp->http->gpc, "connect")))
699 #endif /* ndef FEATURE_FORCE_LOAD */
700       {
701          err = map_block_killer(exports, "force-support");
702       }
703
704       if (!err) err = map(exports, "protocol", 1, csp->http->ssl ? "https://" : "http://", 1);
705       if (!err) err = map(exports, "hostport", 1, html_encode(csp->http->hostport), 0);
706       if (!err) err = map(exports, "path", 1, html_encode(csp->http->path), 0);
707       if (!err) err = map(exports, "path-ue", 1, url_encode(csp->http->path), 0);
708       if (!err)
709       {
710          const char *block_reason;
711          if (csp->action->string[ACTION_STRING_BLOCK] != NULL)
712          {
713             block_reason = csp->action->string[ACTION_STRING_BLOCK];
714          }
715          else
716          {
717             assert(connect_port_is_forbidden(csp));
718             block_reason = "Forbidden CONNECT port.";
719          }
720          err = map(exports, "block-reason", 1, html_encode(block_reason), 0);
721       }
722       if (err)
723       {
724          free_map(exports);
725          free_http_response(rsp);
726          return cgi_error_memory();
727       }
728
729       err = template_fill_for_cgi(csp, "blocked", exports, rsp);
730       if (err)
731       {
732          free_http_response(rsp);
733          return cgi_error_memory();
734       }
735    }
736    rsp->crunch_reason = BLOCKED;
737
738    return finish_http_response(csp, rsp);
739
740 }
741
742
743 #ifdef FEATURE_TRUST
744 /*********************************************************************
745  *
746  * Function    :  trust_url FIXME: I should be called distrust_url
747  *
748  * Description :  Calls is_untrusted_url to determine if the URL is trusted
749  *                and if not, returns a HTTP 403 response with a reject message.
750  *
751  * Parameters  :
752  *          1  :  csp = Current client state (buffers, headers, etc...)
753  *
754  * Returns     :  NULL => trusted, else http_response.
755  *
756  *********************************************************************/
757 struct http_response *trust_url(struct client_state *csp)
758 {
759    struct http_response *rsp;
760    struct map * exports;
761    char buf[BUFFER_SIZE];
762    char *p;
763    struct pattern_spec **tl;
764    struct pattern_spec *t;
765    jb_err err;
766
767    /*
768     * Don't bother to work on trusted URLs
769     */
770    if (!is_untrusted_url(csp))
771    {
772       return NULL;
773    }
774
775    /*
776     * Else, prepare a response:
777     */
778    if (NULL == (rsp = alloc_http_response()))
779    {
780       return cgi_error_memory();
781    }
782
783    rsp->status = strdup_or_die("403 Request blocked by Privoxy");
784    exports = default_exports(csp, NULL);
785    if (exports == NULL)
786    {
787       free_http_response(rsp);
788       return cgi_error_memory();
789    }
790
791    /*
792     * Export the protocol, host, port, and referrer information
793     */
794    err = map(exports, "hostport", 1, csp->http->hostport, 1);
795    if (!err) err = map(exports, "protocol", 1, csp->http->ssl ? "https://" : "http://", 1);
796    if (!err) err = map(exports, "path", 1, csp->http->path, 1);
797
798    if (NULL != (p = get_header_value(csp->headers, "Referer:")))
799    {
800       if (!err) err = map(exports, "referrer", 1, html_encode(p), 0);
801    }
802    else
803    {
804       if (!err) err = map(exports, "referrer", 1, "none set", 1);
805    }
806
807    if (err)
808    {
809       free_map(exports);
810       free_http_response(rsp);
811       return cgi_error_memory();
812    }
813
814    /*
815     * Export the trust list
816     */
817    p = strdup_or_die("");
818    for (tl = csp->config->trust_list; (t = *tl) != NULL ; tl++)
819    {
820       snprintf(buf, sizeof(buf), "<li>%s</li>\n", t->spec);
821       string_append(&p, buf);
822    }
823    err = map(exports, "trusted-referrers", 1, p, 0);
824
825    if (err)
826    {
827       free_map(exports);
828       free_http_response(rsp);
829       return cgi_error_memory();
830    }
831
832    /*
833     * Export the trust info, if available
834     */
835    if (csp->config->trust_info->first)
836    {
837       struct list_entry *l;
838
839       p = strdup_or_die("");
840       for (l = csp->config->trust_info->first; l ; l = l->next)
841       {
842          snprintf(buf, sizeof(buf), "<li> <a href=\"%s\">%s</a><br>\n", l->str, l->str);
843          string_append(&p, buf);
844       }
845       err = map(exports, "trust-info", 1, p, 0);
846    }
847    else
848    {
849       err = map_block_killer(exports, "have-trust-info");
850    }
851
852    if (err)
853    {
854       free_map(exports);
855       free_http_response(rsp);
856       return cgi_error_memory();
857    }
858
859    /*
860     * Export the force conditional block killer if
861     *
862     * - Privoxy was compiled without FEATURE_FORCE_LOAD, or
863     * - Privoxy is configured to enforce blocks, or
864     * - it's a CONNECT request and enforcing wouldn't work anyway.
865     */
866 #ifdef FEATURE_FORCE_LOAD
867    if ((csp->config->feature_flags & RUNTIME_FEATURE_ENFORCE_BLOCKS)
868     || (0 == strcmpic(csp->http->gpc, "connect")))
869    {
870       err = map_block_killer(exports, "force-support");
871    }
872    else
873    {
874       err = map(exports, "force-prefix", 1, FORCE_PREFIX, 1);
875    }
876 #else /* ifndef FEATURE_FORCE_LOAD */
877    err = map_block_killer(exports, "force-support");
878 #endif /* ndef FEATURE_FORCE_LOAD */
879
880    if (err)
881    {
882       free_map(exports);
883       free_http_response(rsp);
884       return cgi_error_memory();
885    }
886
887    /*
888     * Build the response
889     */
890    err = template_fill_for_cgi(csp, "untrusted", exports, rsp);
891    if (err)
892    {
893       free_http_response(rsp);
894       return cgi_error_memory();
895    }
896    rsp->crunch_reason = UNTRUSTED;
897
898    return finish_http_response(csp, rsp);
899 }
900 #endif /* def FEATURE_TRUST */
901
902
903 /*********************************************************************
904  *
905  * Function    :  compile_dynamic_pcrs_job_list
906  *
907  * Description :  Compiles a dynamic pcrs job list (one with variables
908  *                resolved at request time)
909  *
910  * Parameters  :
911  *          1  :  csp = Current client state (buffers, headers, etc...)
912  *          2  :  b = The filter list to compile
913  *
914  * Returns     :  NULL in case of errors, otherwise the
915  *                pcrs job list.
916  *
917  *********************************************************************/
918 pcrs_job *compile_dynamic_pcrs_job_list(const struct client_state *csp, const struct re_filterfile_spec *b)
919 {
920    struct list_entry *pattern;
921    pcrs_job *job_list = NULL;
922    pcrs_job *dummy = NULL;
923    pcrs_job *lastjob = NULL;
924    int error = 0;
925
926    const struct pcrs_variable variables[] =
927    {
928       {"url",    csp->http->url,   1},
929       {"path",   csp->http->path,  1},
930       {"host",   csp->http->host,  1},
931       {"origin", csp->ip_addr_str, 1},
932       {"listen-address", csp->listen_addr_str, 1},
933       {NULL,     NULL,             1}
934    };
935
936    for (pattern = b->patterns->first; pattern != NULL; pattern = pattern->next)
937    {
938       assert(pattern->str != NULL);
939
940       dummy = pcrs_compile_dynamic_command(pattern->str, variables, &error);
941       if (NULL == dummy)
942       {
943          log_error(LOG_LEVEL_ERROR,
944             "Compiling dynamic pcrs job '%s' for '%s' failed with error code %d: %s",
945             pattern->str, b->name, error, pcrs_strerror(error));
946          continue;
947       }
948       else
949       {
950          if (error == PCRS_WARN_TRUNCATION)
951          {
952             log_error(LOG_LEVEL_ERROR,
953                "At least one of the variables in \'%s\' had to "
954                "be truncated before compilation", pattern->str);
955          }
956          if (job_list == NULL)
957          {
958             job_list = dummy;
959          }
960          else
961          {
962             lastjob->next = dummy;
963          }
964          lastjob = dummy;
965       }
966    }
967
968    return job_list;
969 }
970
971
972 /*********************************************************************
973  *
974  * Function    :  rewrite_url
975  *
976  * Description :  Rewrites a URL with a single pcrs command
977  *                and returns the result if it differs from the
978  *                original and isn't obviously invalid.
979  *
980  * Parameters  :
981  *          1  :  old_url = URL to rewrite.
982  *          2  :  pcrs_command = pcrs command formatted as string (s@foo@bar@)
983  *
984  *
985  * Returns     :  NULL if the pcrs_command didn't change the url, or
986  *                the result of the modification.
987  *
988  *********************************************************************/
989 char *rewrite_url(char *old_url, const char *pcrs_command)
990 {
991    char *new_url = NULL;
992    int hits;
993
994    assert(old_url);
995    assert(pcrs_command);
996
997    new_url = pcrs_execute_single_command(old_url, pcrs_command, &hits);
998
999    if (hits == 0)
1000    {
1001       log_error(LOG_LEVEL_REDIRECTS,
1002          "pcrs command \"%s\" didn't change \"%s\".",
1003          pcrs_command, old_url);
1004       freez(new_url);
1005    }
1006    else if (hits < 0)
1007    {
1008       log_error(LOG_LEVEL_REDIRECTS,
1009          "executing pcrs command \"%s\" to rewrite %s failed: %s",
1010          pcrs_command, old_url, pcrs_strerror(hits));
1011       freez(new_url);
1012    }
1013    else if (strncmpic(new_url, "http://", 7) && strncmpic(new_url, "https://", 8))
1014    {
1015       log_error(LOG_LEVEL_ERROR,
1016          "pcrs command \"%s\" changed \"%s\" to \"%s\" (%u hi%s), "
1017          "but the result doesn't look like a valid URL and will be ignored.",
1018          pcrs_command, old_url, new_url, hits, (hits == 1) ? "t" : "ts");
1019       freez(new_url);
1020    }
1021    else
1022    {
1023       log_error(LOG_LEVEL_REDIRECTS,
1024          "pcrs command \"%s\" changed \"%s\" to \"%s\" (%u hi%s).",
1025          pcrs_command, old_url, new_url, hits, (hits == 1) ? "t" : "ts");
1026    }
1027
1028    return new_url;
1029
1030 }
1031
1032
1033 #ifdef FEATURE_FAST_REDIRECTS
1034 /*********************************************************************
1035  *
1036  * Function    :  get_last_url
1037  *
1038  * Description :  Search for the last URL inside a string.
1039  *                If the string already is a URL, it will
1040  *                be the first URL found.
1041  *
1042  * Parameters  :
1043  *          1  :  subject = the string to check
1044  *          2  :  redirect_mode = +fast-redirect{} mode
1045  *
1046  * Returns     :  NULL if no URL was found, or
1047  *                the last URL found.
1048  *
1049  *********************************************************************/
1050 static char *get_last_url(char *subject, const char *redirect_mode)
1051 {
1052    char *new_url = NULL;
1053    char *tmp;
1054
1055    assert(subject);
1056    assert(redirect_mode);
1057
1058    subject = strdup(subject);
1059    if (subject == NULL)
1060    {
1061       log_error(LOG_LEVEL_ERROR, "Out of memory while searching for redirects.");
1062       return NULL;
1063    }
1064
1065    if (0 == strcmpic(redirect_mode, "check-decoded-url") && strchr(subject, '%'))
1066    {
1067       char *url_segment = NULL;
1068       char **url_segments;
1069       size_t max_segments;
1070       int segments;
1071
1072       log_error(LOG_LEVEL_REDIRECTS,
1073          "Checking \"%s\" for encoded redirects.", subject);
1074
1075       /*
1076        * Check each parameter in the URL separately.
1077        * Sectionize the URL at "?" and "&",
1078        * go backwards through the segments, URL-decode them
1079        * and look for a URL in the decoded result.
1080        * Stop the search after the first match.
1081        *
1082        * XXX: This estimate is guaranteed to be high enough as we
1083        *      let ssplit() ignore empty fields, but also a bit wasteful.
1084        */
1085       max_segments = strlen(subject) / 2;
1086       url_segments = malloc(max_segments * sizeof(char *));
1087
1088       if (NULL == url_segments)
1089       {
1090          log_error(LOG_LEVEL_ERROR,
1091             "Out of memory while decoding URL: %s", subject);
1092          freez(subject);
1093          return NULL;
1094       }
1095
1096       segments = ssplit(subject, "?&", url_segments, max_segments);
1097
1098       while (segments-- > 0)
1099       {
1100          char *dtoken = url_decode(url_segments[segments]);
1101          if (NULL == dtoken)
1102          {
1103             log_error(LOG_LEVEL_ERROR, "Unable to decode \"%s\".", url_segments[segments]);
1104             continue;
1105          }
1106          url_segment = strstr(dtoken, "http://");
1107          if (NULL == url_segment)
1108          {
1109             url_segment = strstr(dtoken, "https://");
1110          }
1111          if (NULL != url_segment)
1112          {
1113             url_segment = strdup_or_die(url_segment);
1114             freez(dtoken);
1115             break;
1116          }
1117          freez(dtoken);
1118       }
1119       freez(subject);
1120       freez(url_segments);
1121
1122       if (url_segment == NULL)
1123       {
1124          return NULL;
1125       }
1126       subject = url_segment;
1127    }
1128    else
1129    {
1130       /* Look for a URL inside this one, without decoding anything. */
1131       log_error(LOG_LEVEL_REDIRECTS,
1132          "Checking \"%s\" for unencoded redirects.", subject);
1133    }
1134
1135    /*
1136     * Find the last URL encoded in the request
1137     */
1138    tmp = subject;
1139    while ((tmp = strstr(tmp, "http://")) != NULL)
1140    {
1141       new_url = tmp++;
1142    }
1143    tmp = (new_url != NULL) ? new_url : subject;
1144    while ((tmp = strstr(tmp, "https://")) != NULL)
1145    {
1146       new_url = tmp++;
1147    }
1148
1149    if ((new_url != NULL)
1150       && (  (new_url != subject)
1151          || (0 == strncmpic(subject, "http://", 7))
1152          || (0 == strncmpic(subject, "https://", 8))
1153          ))
1154    {
1155       /*
1156        * Return new URL if we found a redirect
1157        * or if the subject already was a URL.
1158        *
1159        * The second case makes sure that we can
1160        * chain get_last_url after another redirection check
1161        * (like rewrite_url) without losing earlier redirects.
1162        */
1163       new_url = strdup(new_url);
1164       freez(subject);
1165       return new_url;
1166    }
1167
1168    freez(subject);
1169    return NULL;
1170
1171 }
1172 #endif /* def FEATURE_FAST_REDIRECTS */
1173
1174
1175 /*********************************************************************
1176  *
1177  * Function    :  redirect_url
1178  *
1179  * Description :  Checks if Privoxy should answer the request with
1180  *                a HTTP redirect and generates the redirect if
1181  *                necessary.
1182  *
1183  * Parameters  :
1184  *          1  :  csp = Current client state (buffers, headers, etc...)
1185  *
1186  * Returns     :  NULL if the request can pass, HTTP redirect otherwise.
1187  *
1188  *********************************************************************/
1189 struct http_response *redirect_url(struct client_state *csp)
1190 {
1191    struct http_response *rsp;
1192 #ifdef FEATURE_FAST_REDIRECTS
1193    /*
1194     * XXX: Do we still need FEATURE_FAST_REDIRECTS
1195     * as compile-time option? The user can easily disable
1196     * it in his action file.
1197     */
1198    char * redirect_mode;
1199 #endif /* def FEATURE_FAST_REDIRECTS */
1200    char *new_url = NULL;
1201    char *redirection_string;
1202
1203    if ((csp->action->flags & ACTION_REDIRECT))
1204    {
1205       redirection_string = csp->action->string[ACTION_STRING_REDIRECT];
1206
1207       /*
1208        * If the redirection string begins with 's',
1209        * assume it's a pcrs command, otherwise treat it as
1210        * properly formatted URL and use it for the redirection
1211        * directly.
1212        *
1213        * According to (the now obsolete) RFC 2616 section 14.30
1214        * the URL has to be absolute and if the user tries:
1215        * +redirect{sadly/this/will/be/parsed/as/pcrs_command.html}
1216        * she would get undefined results anyway.
1217        *
1218        * RFC 7231 7.1.2 actually allows relative references,
1219        * but those start with a leading slash (RFC 3986 4.2) and
1220        * thus can't be mistaken for pcrs commands either.
1221        */
1222
1223       if (*redirection_string == 's')
1224       {
1225          char *requested_url;
1226
1227 #ifdef FEATURE_HTTPS_INSPECTION
1228          if (client_use_ssl(csp))
1229          {
1230             jb_err err;
1231
1232             requested_url = strdup_or_die("https://");
1233             err = string_append(&requested_url, csp->http->hostport);
1234             if (!err) err = string_append(&requested_url, csp->http->path);
1235             if (err)
1236             {
1237                log_error(LOG_LEVEL_FATAL,
1238                   "Failed to rebuild URL 'https://%s%s'",
1239                   csp->http->hostport, csp->http->path);
1240             }
1241          }
1242          else
1243 #endif
1244          {
1245             requested_url = csp->http->url;
1246          }
1247          new_url = rewrite_url(requested_url, redirection_string);
1248 #ifdef FEATURE_HTTPS_INSPECTION
1249          if (requested_url != csp->http->url)
1250          {
1251             assert(client_use_ssl(csp));
1252             freez(requested_url);
1253          }
1254 #endif
1255       }
1256       else
1257       {
1258          log_error(LOG_LEVEL_REDIRECTS,
1259             "No pcrs command recognized, assuming that \"%s\" is already properly formatted.",
1260             redirection_string);
1261          new_url = strdup(redirection_string);
1262       }
1263    }
1264
1265 #ifdef FEATURE_FAST_REDIRECTS
1266    if ((csp->action->flags & ACTION_FAST_REDIRECTS))
1267    {
1268       char *old_url;
1269
1270       redirect_mode = csp->action->string[ACTION_STRING_FAST_REDIRECTS];
1271
1272       /*
1273        * If it exists, use the previously rewritten URL as input
1274        * otherwise just use the old path.
1275        */
1276       old_url = (new_url != NULL) ? new_url : strdup(csp->http->path);
1277       new_url = get_last_url(old_url, redirect_mode);
1278       freez(old_url);
1279    }
1280 #endif /* def FEATURE_FAST_REDIRECTS */
1281
1282    /* Did any redirect action trigger? */
1283    if (new_url)
1284    {
1285       if (url_requires_percent_encoding(new_url))
1286       {
1287          char *encoded_url;
1288          log_error(LOG_LEVEL_REDIRECTS, "Percent-encoding redirect URL: %N",
1289             strlen(new_url), new_url);
1290          encoded_url = percent_encode_url(new_url);
1291          freez(new_url);
1292          if (encoded_url == NULL)
1293          {
1294             return cgi_error_memory();
1295          }
1296          new_url = encoded_url;
1297          assert(FALSE == url_requires_percent_encoding(new_url));
1298       }
1299
1300       if (0 == strcmpic(new_url, csp->http->url))
1301       {
1302          log_error(LOG_LEVEL_ERROR,
1303             "New URL \"%s\" and old URL \"%s\" are the same. Redirection loop prevented.",
1304             csp->http->url, new_url);
1305             freez(new_url);
1306       }
1307       else
1308       {
1309          log_error(LOG_LEVEL_REDIRECTS, "New URL is: %s", new_url);
1310
1311          if (NULL == (rsp = alloc_http_response()))
1312          {
1313             freez(new_url);
1314             return cgi_error_memory();
1315          }
1316
1317          rsp->status = strdup_or_die("302 Local Redirect from Privoxy");
1318          if (enlist_unique_header(rsp->headers, "Location", new_url))
1319          {
1320             freez(new_url);
1321             free_http_response(rsp);
1322             return cgi_error_memory();
1323          }
1324          rsp->crunch_reason = REDIRECTED;
1325          freez(new_url);
1326
1327          return finish_http_response(csp, rsp);
1328       }
1329    }
1330
1331    /* Only reached if no redirect is required */
1332    return NULL;
1333
1334 }
1335
1336
1337 #ifdef FEATURE_IMAGE_BLOCKING
1338 /*********************************************************************
1339  *
1340  * Function    :  is_imageurl
1341  *
1342  * Description :  Given a URL, decide whether it should be treated
1343  *                as image URL or not.
1344  *
1345  * Parameters  :
1346  *          1  :  csp = Current client state (buffers, headers, etc...)
1347  *
1348  * Returns     :  True (nonzero) if URL is an image URL, false (0)
1349  *                otherwise
1350  *
1351  *********************************************************************/
1352 int is_imageurl(const struct client_state *csp)
1353 {
1354    return ((csp->action->flags & ACTION_IMAGE) != 0);
1355
1356 }
1357 #endif /* def FEATURE_IMAGE_BLOCKING */
1358
1359
1360 #ifdef FEATURE_TRUST
1361 /*********************************************************************
1362  *
1363  * Function    :  is_untrusted_url
1364  *
1365  * Description :  Should we "distrust" this URL (and block it)?
1366  *
1367  *                Yes if it matches a line in the trustfile, or if the
1368  *                    referrer matches a line starting with "+" in the
1369  *                    trustfile.
1370  *                No  otherwise.
1371  *
1372  * Parameters  :
1373  *          1  :  csp = Current client state (buffers, headers, etc...)
1374  *
1375  * Returns     :  0 => trusted, 1 => untrusted
1376  *
1377  *********************************************************************/
1378 int is_untrusted_url(const struct client_state *csp)
1379 {
1380    struct file_list *fl;
1381    struct block_spec *b;
1382    struct pattern_spec **trusted_url;
1383    struct http_request rhttp[1];
1384    const char * referer;
1385    jb_err err;
1386
1387    /*
1388     * If we don't have a trustlist, we trust everybody
1389     */
1390    if (((fl = csp->tlist) == NULL) || ((b  = fl->f) == NULL))
1391    {
1392       return 0;
1393    }
1394
1395    memset(rhttp, '\0', sizeof(*rhttp));
1396
1397    /*
1398     * Do we trust the request URL itself?
1399     */
1400    for (b = b->next; b ; b = b->next)
1401    {
1402       if (url_match(b->url, csp->http))
1403       {
1404          return b->reject;
1405       }
1406    }
1407
1408    if (NULL == (referer = get_header_value(csp->headers, "Referer:")))
1409    {
1410       /* no referrer was supplied */
1411       return 1;
1412    }
1413
1414
1415    /*
1416     * If not, do we maybe trust its referrer?
1417     */
1418    err = parse_http_url(referer, rhttp, REQUIRE_PROTOCOL);
1419    if (err)
1420    {
1421       return 1;
1422    }
1423
1424    for (trusted_url = csp->config->trust_list; *trusted_url != NULL; trusted_url++)
1425    {
1426       if (url_match(*trusted_url, rhttp))
1427       {
1428          /* if the URL's referrer is from a trusted referrer, then
1429           * add the target spec to the trustfile as an unblocked
1430           * domain and return 0 (which means it's OK).
1431           */
1432
1433          FILE *fp;
1434
1435          if (NULL != (fp = fopen(csp->config->trustfile, "a")))
1436          {
1437             char * path;
1438             char * path_end;
1439             char * new_entry = strdup_or_die("~");
1440
1441             string_append(&new_entry, csp->http->hostport);
1442
1443             path = csp->http->path;
1444             if ( (path[0] == '/')
1445               && (path[1] == '~')
1446               && ((path_end = strchr(path + 2, '/')) != NULL))
1447             {
1448                /* since this path points into a user's home space
1449                 * be sure to include this spec in the trustfile.
1450                 */
1451                long path_len = path_end - path; /* save offset */
1452                path = strdup(path); /* Copy string */
1453                if (path != NULL)
1454                {
1455                   path_end = path + path_len; /* regenerate ptr to new buffer */
1456                   *(path_end + 1) = '\0'; /* Truncate path after '/' */
1457                }
1458                string_join(&new_entry, path);
1459             }
1460
1461             /*
1462              * Give a reason for generating this entry.
1463              */
1464             string_append(&new_entry, " # Trusted referrer was: ");
1465             string_append(&new_entry, referer);
1466
1467             if (new_entry != NULL)
1468             {
1469                if (-1 == fprintf(fp, "%s\n", new_entry))
1470                {
1471                   log_error(LOG_LEVEL_ERROR, "Failed to append \'%s\' to trustfile \'%s\': %E",
1472                      new_entry, csp->config->trustfile);
1473                }
1474                freez(new_entry);
1475             }
1476             else
1477             {
1478                /* FIXME: No way to handle out-of memory, so mostly ignoring it */
1479                log_error(LOG_LEVEL_ERROR, "Out of memory adding pattern to trust file");
1480             }
1481
1482             fclose(fp);
1483          }
1484          else
1485          {
1486             log_error(LOG_LEVEL_ERROR, "Failed to append new entry for \'%s\' to trustfile \'%s\': %E",
1487                csp->http->hostport, csp->config->trustfile);
1488          }
1489          return 0;
1490       }
1491    }
1492
1493    return 1;
1494 }
1495 #endif /* def FEATURE_TRUST */
1496
1497
1498 /*********************************************************************
1499  *
1500  * Function    :  get_filter
1501  *
1502  * Description :  Get a filter with a given name and type.
1503  *                Note that taggers are filters, too.
1504  *
1505  * Parameters  :
1506  *          1  :  csp = Current client state (buffers, headers, etc...)
1507  *          2  :  requested_name = Name of the content filter to get
1508  *          3  :  requested_type = Type of the filter to tagger to lookup
1509  *
1510  * Returns     :  A pointer to the requested filter
1511  *                or NULL if the filter wasn't found
1512  *
1513  *********************************************************************/
1514 struct re_filterfile_spec *get_filter(const struct client_state *csp,
1515                                       const char *requested_name,
1516                                       enum filter_type requested_type)
1517 {
1518    int i;
1519    struct re_filterfile_spec *b;
1520    struct file_list *fl;
1521
1522    for (i = 0; i < MAX_AF_FILES; i++)
1523    {
1524      fl = csp->rlist[i];
1525      if ((NULL == fl) || (NULL == fl->f))
1526      {
1527         /*
1528          * Either there are no filter files left or this
1529          * filter file just contains no valid filters.
1530          *
1531          * Continue to be sure we don't miss valid filter
1532          * files that are chained after empty or invalid ones.
1533          */
1534         continue;
1535      }
1536
1537      for (b = fl->f; b != NULL; b = b->next)
1538      {
1539         if (b->type != requested_type)
1540         {
1541            /* The callers isn't interested in this filter type. */
1542            continue;
1543         }
1544         if (strcmp(b->name, requested_name) == 0)
1545         {
1546            /* The requested filter has been found. Abort search. */
1547            return b;
1548         }
1549      }
1550    }
1551
1552    /* No filter with the given name and type exists. */
1553    return NULL;
1554
1555 }
1556
1557
1558 /*********************************************************************
1559  *
1560  * Function    :  pcrs_filter_impl
1561  *
1562  * Description :  Execute all text substitutions from all applying
1563  *                (based on filter_response_body value) +filter
1564  *                or +client_body_filter actions on the given buffer.
1565  *
1566  * Parameters  :
1567  *          1  :  csp = Current client state (buffers, headers, etc...)
1568  *          2  :  filter_response_body = when TRUE execute +filter
1569  *                actions; execute +client_body_filter actions otherwise
1570  *          3  :  data = Target data
1571  *          4  :  data_len = Target data len
1572  *
1573  * Returns     :  a pointer to the (newly allocated) modified buffer.
1574  *                or NULL if there were no hits or something went wrong
1575  *
1576  *********************************************************************/
1577 static char *pcrs_filter_impl(const struct client_state *csp, int filter_response_body,
1578                               const char *data, size_t *data_len)
1579 {
1580    int hits = 0;
1581    size_t size, prev_size;
1582    const int filters_idx =
1583       filter_response_body ? ACTION_MULTI_FILTER : ACTION_MULTI_CLIENT_BODY_FILTER;
1584    const enum filter_type filter_type =
1585       filter_response_body ? FT_CONTENT_FILTER : FT_CLIENT_BODY_FILTER;
1586
1587    const char *old = NULL;
1588    char *new = NULL;
1589    pcrs_job *job;
1590
1591    struct re_filterfile_spec *b;
1592    struct list_entry *filtername;
1593
1594    /*
1595     * Sanity first
1596     */
1597    if (*data_len == 0)
1598    {
1599       return(NULL);
1600    }
1601
1602    if (filters_available(csp) == FALSE)
1603    {
1604       log_error(LOG_LEVEL_ERROR, "Inconsistent configuration: "
1605          "content filtering enabled, but no content filters available.");
1606       return(NULL);
1607    }
1608
1609    size = *data_len;
1610    old = data;
1611
1612    /*
1613     * For all applying actions, look if a filter by that
1614     * name exists and if yes, execute it's pcrs_joblist on the
1615     * buffer.
1616     */
1617    for (filtername = csp->action->multi[filters_idx]->first;
1618         filtername != NULL; filtername = filtername->next)
1619    {
1620       int current_hits = 0; /* Number of hits caused by this filter */
1621       int job_number   = 0; /* Which job we're currently executing  */
1622       int job_hits     = 0; /* How many hits the current job caused */
1623       pcrs_job *joblist;
1624
1625       b = get_filter(csp, filtername->str, filter_type);
1626       if (b == NULL)
1627       {
1628          continue;
1629       }
1630
1631       joblist = b->joblist;
1632
1633       if (b->dynamic) joblist = compile_dynamic_pcrs_job_list(csp, b);
1634
1635       if (NULL == joblist)
1636       {
1637          log_error(LOG_LEVEL_RE_FILTER, "Filter %s has empty joblist. Nothing to do.", b->name);
1638          continue;
1639       }
1640
1641       prev_size = size;
1642       /* Apply all jobs from the joblist */
1643       for (job = joblist; NULL != job; job = job->next)
1644       {
1645          job_number++;
1646          job_hits = pcrs_execute(job, old, size, &new, &size);
1647
1648          if (job_hits >= 0)
1649          {
1650             /*
1651              * That went well. Continue filtering
1652              * and use the result of this job as
1653              * input for the next one.
1654              */
1655             current_hits += job_hits;
1656             if (old != data)
1657             {
1658                freez(old);
1659             }
1660             old = new;
1661          }
1662          else
1663          {
1664             /*
1665              * This job caused an unexpected error. Inform the user
1666              * and skip the rest of the jobs in this filter. We could
1667              * continue with the next job, but usually the jobs
1668              * depend on each other or are similar enough to
1669              * fail for the same reason.
1670              *
1671              * At the moment our pcrs expects the error codes of pcre 3.4,
1672              * but newer pcre versions can return additional error codes.
1673              * As a result pcrs_strerror()'s error message might be
1674              * "Unknown error ...", therefore we print the numerical value
1675              * as well.
1676              *
1677              * XXX: Is this important enough for LOG_LEVEL_ERROR or
1678              * should we use LOG_LEVEL_RE_FILTER instead?
1679              */
1680             log_error(LOG_LEVEL_ERROR, "Skipped filter \'%s\' after job number %u: %s (%d)",
1681                b->name, job_number, pcrs_strerror(job_hits), job_hits);
1682             break;
1683          }
1684       }
1685
1686       if (b->dynamic) pcrs_free_joblist(joblist);
1687
1688       if (filter_response_body)
1689       {
1690          log_error(LOG_LEVEL_RE_FILTER,
1691             "filtering %s%s (size %lu) with \'%s\' produced %d hits (new size %lu).",
1692             csp->http->hostport, csp->http->path, prev_size, b->name, current_hits, size);
1693       }
1694       else
1695       {
1696          log_error(LOG_LEVEL_RE_FILTER, "filtering request body from client %s "
1697             "(size %lu) with \'%s\' produced %d hits (new size %lu).",
1698             csp->ip_addr_str, prev_size, b->name, current_hits, size);
1699       }
1700 #ifdef FEATURE_EXTENDED_STATISTICS
1701       update_filter_statistics(b->name, current_hits);
1702 #endif
1703       hits += current_hits;
1704    }
1705
1706    /*
1707     * If there were no hits, destroy our copy and let
1708     * chat() use the original content
1709     */
1710    if (!hits)
1711    {
1712       if (old != data && old != new)
1713       {
1714          freez(old);
1715       }
1716       freez(new);
1717       return(NULL);
1718    }
1719
1720    *data_len = size;
1721    return(new);
1722 }
1723
1724
1725 /*********************************************************************
1726  *
1727  * Function    :  pcrs_filter_response_body
1728  *
1729  * Description :  Execute all text substitutions from all applying
1730  *                +filter actions on the text buffer that's been
1731  *                accumulated in csp->iob->buf.
1732  *
1733  * Parameters  :
1734  *          1  :  csp = Current client state (buffers, headers, etc...)
1735  *
1736  * Returns     :  a pointer to the (newly allocated) modified buffer.
1737  *                or NULL if there were no hits or something went wrong
1738  *
1739  *********************************************************************/
1740 static char *pcrs_filter_response_body(struct client_state *csp)
1741 {
1742    size_t size = (size_t)(csp->iob->eod - csp->iob->cur);
1743
1744    char *new = NULL;
1745
1746    /*
1747     * Sanity first
1748     */
1749    if (csp->iob->cur >= csp->iob->eod)
1750    {
1751       return NULL;
1752    }
1753
1754    new = pcrs_filter_impl(csp, TRUE, csp->iob->cur, &size);
1755
1756    if (new != NULL)
1757    {
1758       csp->flags |= CSP_FLAG_MODIFIED;
1759       csp->content_length = size;
1760       clear_iob(csp->iob);
1761    }
1762
1763    return new;
1764 }
1765
1766
1767 #ifdef FEATURE_EXTERNAL_FILTERS
1768 /*********************************************************************
1769  *
1770  * Function    :  get_external_filter
1771  *
1772  * Description :  Lookup the code to execute for an external filter.
1773  *                Masks the misuse of the re_filterfile_spec.
1774  *
1775  * Parameters  :
1776  *          1  :  csp = Current client state (buffers, headers, etc...)
1777  *          2  :  name = Name of the content filter to get
1778  *
1779  * Returns     :  A pointer to the requested code
1780  *                or NULL if the filter wasn't found
1781  *
1782  *********************************************************************/
1783 static const char *get_external_filter(const struct client_state *csp,
1784                                 const char *name)
1785 {
1786    struct re_filterfile_spec *external_filter;
1787
1788    external_filter = get_filter(csp, name, FT_EXTERNAL_CONTENT_FILTER);
1789    if (external_filter == NULL)
1790    {
1791       log_error(LOG_LEVEL_FATAL,
1792          "Didn't find stuff to execute for external filter: %s",
1793          name);
1794    }
1795
1796    return external_filter->patterns->first->str;
1797
1798 }
1799
1800
1801 /*********************************************************************
1802  *
1803  * Function    :  set_privoxy_variables
1804  *
1805  * Description :  Sets a couple of privoxy-specific environment variables
1806  *
1807  * Parameters  :
1808  *          1  :  csp = Current client state (buffers, headers, etc...)
1809  *
1810  * Returns     :  N/A
1811  *
1812  *********************************************************************/
1813 static void set_privoxy_variables(const struct client_state *csp)
1814 {
1815    int i;
1816    struct {
1817       const char *name;
1818       const char *value;
1819    } env[] = {
1820       { "PRIVOXY_URL",    csp->http->url   },
1821       { "PRIVOXY_PATH",   csp->http->path  },
1822       { "PRIVOXY_HOST",   csp->http->host  },
1823       { "PRIVOXY_ORIGIN", csp->ip_addr_str },
1824       { "PRIVOXY_LISTEN_ADDRESS", csp->listen_addr_str },
1825    };
1826
1827    for (i = 0; i < SZ(env); i++)
1828    {
1829       if (setenv(env[i].name, env[i].value, 1))
1830       {
1831          log_error(LOG_LEVEL_ERROR, "Failed to set %s=%s: %E",
1832             env[i].name, env[i].value);
1833       }
1834    }
1835 }
1836
1837
1838 /*********************************************************************
1839  *
1840  * Function    :  execute_external_filter
1841  *
1842  * Description :  Pipe content into external filter and return the output
1843  *
1844  * Parameters  :
1845  *          1  :  csp = Current client state (buffers, headers, etc...)
1846  *          2  :  name = Name of the external filter to execute
1847  *          3  :  content = The original content to filter
1848  *          4  :  size = The size of the content buffer
1849  *
1850  * Returns     :  a pointer to the (newly allocated) modified buffer.
1851  *                or NULL if there were no hits or something went wrong
1852  *
1853  *********************************************************************/
1854 static char *execute_external_filter(const struct client_state *csp,
1855    const char *name, char *content, size_t *size)
1856 {
1857    char cmd[200];
1858    char file_name[FILENAME_MAX];
1859    FILE *fp;
1860    char *filter_output;
1861    int fd;
1862    int ret;
1863    size_t new_size;
1864    const char *external_filter;
1865
1866    if (csp->config->temporary_directory == NULL)
1867    {
1868       log_error(LOG_LEVEL_ERROR,
1869          "No temporary-directory configured. Can't execute filter: %s",
1870          name);
1871       return NULL;
1872    }
1873
1874    external_filter = get_external_filter(csp, name);
1875
1876    if (sizeof(file_name) < snprintf(file_name, sizeof(file_name),
1877          "%s/privoxy-XXXXXXXX", csp->config->temporary_directory))
1878    {
1879       log_error(LOG_LEVEL_ERROR, "temporary-directory path too long");
1880       return NULL;
1881    }
1882
1883    fd = mkstemp(file_name);
1884    if (fd == -1)
1885    {
1886       log_error(LOG_LEVEL_ERROR, "mkstemp() failed to create %s: %E", file_name);
1887       return NULL;
1888    }
1889
1890    fp = fdopen(fd, "w");
1891    if (fp == NULL)
1892    {
1893       log_error(LOG_LEVEL_ERROR, "fdopen() failed: %E");
1894       unlink(file_name);
1895       return NULL;
1896    }
1897
1898    /*
1899     * The size may be zero if a previous filter discarded everything.
1900     *
1901     * This isn't necessary unintentional, so we just don't try
1902     * to fwrite() nothing and let the user deal with the rest.
1903     */
1904    if ((*size != 0) && fwrite(content, *size, 1, fp) != 1)
1905    {
1906       log_error(LOG_LEVEL_ERROR, "fwrite(..., %lu, 1, ..) failed: %E", *size);
1907       unlink(file_name);
1908       fclose(fp);
1909       return NULL;
1910    }
1911    fclose(fp);
1912
1913    if (sizeof(cmd) < snprintf(cmd, sizeof(cmd), "%s < %s", external_filter, file_name))
1914    {
1915       log_error(LOG_LEVEL_ERROR,
1916          "temporary-directory or external filter path too long");
1917       unlink(file_name);
1918       return NULL;
1919    }
1920
1921    log_error(LOG_LEVEL_RE_FILTER, "Executing '%s': %s", name, cmd);
1922
1923    /*
1924     * The locking is necessary to prevent other threads
1925     * from overwriting the environment variables before
1926     * the popen fork. Afterwards this no longer matters.
1927     */
1928    privoxy_mutex_lock(&external_filter_mutex);
1929    set_privoxy_variables(csp);
1930    fp = popen(cmd, "r");
1931    privoxy_mutex_unlock(&external_filter_mutex);
1932    if (fp == NULL)
1933    {
1934       log_error(LOG_LEVEL_ERROR, "popen(\"%s\", \"r\") failed: %E", cmd);
1935       unlink(file_name);
1936       return NULL;
1937    }
1938
1939    /* Allocate at least one byte */
1940    filter_output = malloc_or_die(*size + 1);
1941
1942    new_size = 0;
1943    while (!feof(fp) && !ferror(fp))
1944    {
1945       size_t len;
1946       /* Could be bigger ... */
1947       enum { READ_LENGTH = 2048 };
1948
1949       if (new_size + READ_LENGTH >= *size)
1950       {
1951          char *p;
1952
1953          /* Could be considered wasteful if the content is 'large'. */
1954          *size += (*size >= READ_LENGTH) ? *size : READ_LENGTH;
1955
1956          p = realloc(filter_output, *size);
1957          if (p == NULL)
1958          {
1959             log_error(LOG_LEVEL_ERROR, "Out of memory while reading "
1960                "external filter output. Using what we got so far.");
1961             break;
1962          }
1963          filter_output = p;
1964       }
1965       assert(new_size + READ_LENGTH < *size);
1966       len = fread(&filter_output[new_size], 1, READ_LENGTH, fp);
1967       if (len > 0)
1968       {
1969          new_size += len;
1970       }
1971    }
1972
1973    ret = pclose(fp);
1974    if (ret == -1)
1975    {
1976       log_error(LOG_LEVEL_ERROR, "Executing %s failed: %E", cmd);
1977    }
1978    else
1979    {
1980       log_error(LOG_LEVEL_RE_FILTER,
1981          "Executing '%s' resulted in return value %d. "
1982          "Read %lu of up to %lu bytes.", name, (ret >> 8), new_size, *size);
1983    }
1984
1985    unlink(file_name);
1986    *size = new_size;
1987
1988    return filter_output;
1989
1990 }
1991 #endif /* def FEATURE_EXTERNAL_FILTERS */
1992
1993
1994 /*********************************************************************
1995  *
1996  * Function    :  pcrs_filter_request_body
1997  *
1998  * Description :  Execute all text substitutions from all applying
1999  *                +client_body_filter actions on the given text buffer.
2000  *
2001  * Parameters  :
2002  *          1  :  csp = Current client state (buffers, headers, etc...)
2003  *          2  :  data = Target data
2004  *          3  :  data_len = Target data len
2005  *
2006  * Returns     :  a pointer to the (newly allocated) modified buffer.
2007  *                or NULL if there were no hits or something went wrong
2008  *
2009  *********************************************************************/
2010 static char *pcrs_filter_request_body(const struct client_state *csp, const char *data, size_t *data_len)
2011 {
2012    return pcrs_filter_impl(csp, FALSE, data, data_len);
2013 }
2014
2015
2016 /*********************************************************************
2017  *
2018  * Function    :  gif_deanimate_response
2019  *
2020  * Description :  Deanimate the GIF image that has been accumulated in
2021  *                csp->iob->buf, set csp->content_length to the modified
2022  *                size and raise the CSP_FLAG_MODIFIED flag.
2023  *
2024  * Parameters  :
2025  *          1  :  csp = Current client state (buffers, headers, etc...)
2026  *
2027  * Returns     :  a pointer to the (newly allocated) modified buffer.
2028  *                or NULL in case something went wrong.
2029  *
2030  *********************************************************************/
2031 #ifdef FUZZ
2032 char *gif_deanimate_response(struct client_state *csp)
2033 #else
2034 static char *gif_deanimate_response(struct client_state *csp)
2035 #endif
2036 {
2037    struct binbuffer *in, *out;
2038    char *p;
2039    size_t size;
2040
2041    size = (size_t)(csp->iob->eod - csp->iob->cur);
2042
2043    in =  zalloc_or_die(sizeof(*in));
2044    out = zalloc_or_die(sizeof(*out));
2045
2046    in->buffer = csp->iob->cur;
2047    in->size = size;
2048
2049    if (gif_deanimate(in, out, strncmp("last", csp->action->string[ACTION_STRING_DEANIMATE], 4)))
2050    {
2051       log_error(LOG_LEVEL_DEANIMATE, "failed! (gif parsing)");
2052       freez(in);
2053       buf_free(out);
2054       return(NULL);
2055    }
2056    else
2057    {
2058       if ((int)size == out->offset)
2059       {
2060          log_error(LOG_LEVEL_DEANIMATE, "GIF not changed.");
2061       }
2062       else
2063       {
2064          log_error(LOG_LEVEL_DEANIMATE,
2065             "Success! GIF shrunk from %lu bytes to %lu.", size, out->offset);
2066       }
2067       csp->content_length = out->offset;
2068       csp->flags |= CSP_FLAG_MODIFIED;
2069       p = out->buffer;
2070       freez(in);
2071       freez(out);
2072       return(p);
2073    }
2074
2075 }
2076
2077
2078 /*********************************************************************
2079  *
2080  * Function    :  get_filter_function
2081  *
2082  * Description :  Decides which content filter function has
2083  *                to be applied (if any). Only considers functions
2084  *                for internal filters which are mutually-exclusive.
2085  *
2086  * Parameters  :
2087  *          1  :  csp = Current client state (buffers, headers, etc...)
2088  *
2089  * Returns     :  The content filter function to run, or
2090  *                NULL if no content filter is active
2091  *
2092  *********************************************************************/
2093 static filter_function_ptr get_filter_function(const struct client_state *csp)
2094 {
2095    filter_function_ptr filter_function = NULL;
2096
2097    /*
2098     * Choose the applying filter function based on
2099     * the content type and action settings.
2100     */
2101    if ((csp->content_type & CT_TEXT) &&
2102        (!list_is_empty(csp->action->multi[ACTION_MULTI_FILTER])))
2103    {
2104       filter_function = pcrs_filter_response_body;
2105    }
2106    else if ((csp->content_type & CT_GIF) &&
2107             (csp->action->flags & ACTION_DEANIMATE))
2108    {
2109       filter_function = gif_deanimate_response;
2110    }
2111
2112    return filter_function;
2113 }
2114
2115
2116 /*********************************************************************
2117  *
2118  * Function    :  get_bytes_to_next_chunk_start
2119  *
2120  * Description :  Returns the number of bytes to the start of the
2121  *                next chunk in the buffer.
2122  *
2123  * Parameters  :
2124  *          1  :  buffer = Pointer to the text buffer
2125  *          2  :  size = Number of bytes in the buffer.
2126  *          3  :  offset = Where to expect the beginning of the next chunk.
2127  *
2128  * Returns     :  -1 if the size can't be determined or data is missing,
2129  *                otherwise the number of bytes to the start of the next chunk
2130  *                or 0 if the last chunk has been fully buffered.
2131  *
2132  *********************************************************************/
2133 static int get_bytes_to_next_chunk_start(char *buffer, size_t size, size_t offset)
2134 {
2135    char *chunk_start;
2136    char *p;
2137    unsigned int chunk_size = 0;
2138    int bytes_to_skip;
2139
2140    if (size <= offset || size < 5)
2141    {
2142       /*
2143        * Not enough bytes bufferd to figure
2144        * out the size of the next chunk.
2145        */
2146       return -1;
2147    }
2148
2149    chunk_start = buffer + offset;
2150
2151    p = strstr(chunk_start, "\r\n");
2152    if (NULL == p)
2153    {
2154       /*
2155        * The line with the chunk-size hasn't been completely received
2156        * yet (or is invalid).
2157        */
2158       log_error(LOG_LEVEL_RE_FILTER,
2159          "Not enough or invalid data in buffer in chunk size line.");
2160       return -1;
2161    }
2162
2163    if (sscanf(chunk_start, "%x", &chunk_size) != 1)
2164    {
2165       /* XXX: Write test case to trigger this. */
2166       log_error(LOG_LEVEL_ERROR, "Failed to parse chunk size. "
2167          "Size: %lu, offset: %lu. Chunk size start: %N", size, offset,
2168          (size - offset), chunk_start);
2169       return -1;
2170    }
2171
2172    /*
2173     * To get to the start of the next chunk size we have to skip
2174     * the line with the current chunk size followed by "\r\n" followd
2175     * by the actual data and another "\r\n" following the data.
2176     */
2177    bytes_to_skip = (int)(p - chunk_start) + 2 + (int)chunk_size + 2;
2178
2179    if (bytes_to_skip <= 0)
2180    {
2181       log_error(LOG_LEVEL_ERROR,
2182          "Failed to figure out chunk offset. %u and %d seem dubious.",
2183          chunk_size, bytes_to_skip);
2184       return -1;
2185    }
2186    if (chunk_size == 0)
2187    {
2188       if (bytes_to_skip <= (size - offset))
2189       {
2190          return 0;
2191       }
2192       else
2193       {
2194          log_error(LOG_LEVEL_INFO,
2195             "Last chunk detected but we're still missing data.");
2196          return -1;
2197       }
2198    }
2199
2200    return bytes_to_skip;
2201 }
2202
2203
2204 /*********************************************************************
2205  *
2206  * Function    :  get_bytes_missing_from_chunked_data
2207  *
2208  * Description :  Figures out how many bytes of data we need to get
2209  *                to the start of the next chunk of data (XXX: terminology).
2210  *                Due to the nature of chunk-encoded data we can only see
2211  *                how many data is missing according to the last chunk size
2212  *                buffered.
2213  *
2214  * Parameters  :
2215  *          1  :  buffer = Pointer to the text buffer
2216  *          2  :  size = Number of bytes in the buffer.
2217  *          3  :  offset = Where to expect the beginning of the next chunk.
2218  *
2219  * Returns     :  -1 if the data can't be parsed (yet),
2220  *                 0 if the buffer is complete or a
2221  *                 number of bytes that is missing.
2222  *
2223  *********************************************************************/
2224 int get_bytes_missing_from_chunked_data(char *buffer, size_t size, size_t offset)
2225 {
2226    int ret = -1;
2227    int last_valid_offset = -1;
2228
2229    if (size < offset || size < 5)
2230    {
2231       /* Not enough data buffered yet */
2232       return -1;
2233    }
2234
2235    do
2236    {
2237       ret = get_bytes_to_next_chunk_start(buffer, size, offset);
2238       if (ret == -1)
2239       {
2240          return last_valid_offset;
2241       }
2242       if (ret == 0)
2243       {
2244          return 0;
2245       }
2246       if (offset != 0)
2247       {
2248          last_valid_offset = (int)offset;
2249       }
2250       offset += (size_t)ret;
2251    } while (offset < size);
2252
2253    return (int)offset;
2254
2255 }
2256
2257
2258 /*********************************************************************
2259  *
2260  * Function    :  chunked_data_is_complete
2261  *
2262  * Description :  Detects if a buffer with chunk-encoded data looks
2263  *                complete.
2264  *
2265  * Parameters  :
2266  *          1  :  buffer = Pointer to the text buffer
2267  *          2  :  size = Number of bytes in the buffer.
2268  *          3  :  offset = Where to expect the beginning of the
2269  *                         first complete chunk.
2270  *
2271  * Returns     :  TRUE if it looks like the data is complete,
2272  *                FALSE otherwise.
2273  *
2274  *********************************************************************/
2275 int chunked_data_is_complete(char *buffer, size_t size, size_t offset)
2276 {
2277    return (0 == get_bytes_missing_from_chunked_data(buffer, size, offset));
2278
2279 }
2280
2281
2282 /*********************************************************************
2283  *
2284  * Function    :  remove_chunked_transfer_coding
2285  *
2286  * Description :  In-situ remove the "chunked" transfer coding as defined
2287  *                in RFC 7230 4.1 from a buffer. XXX: The implementation
2288  *                is neither complete nor compliant (TODO #129).
2289  *
2290  * Parameters  :
2291  *          1  :  buffer = Pointer to the text buffer
2292  *          2  :  size =  In: Number of bytes to be processed,
2293  *                       Out: Number of bytes after de-chunking.
2294  *                       (undefined in case of errors)
2295  *
2296  * Returns     :  JB_ERR_OK for success,
2297  *                JB_ERR_PARSE otherwise
2298  *
2299  *********************************************************************/
2300 #ifdef FUZZ
2301 extern jb_err remove_chunked_transfer_coding(char *buffer, size_t *size)
2302 #else
2303 static jb_err remove_chunked_transfer_coding(char *buffer, size_t *size)
2304 #endif
2305 {
2306    size_t newsize = 0;
2307    unsigned int chunksize = 0;
2308    char *from_p, *to_p;
2309    const char *end_of_buffer = buffer + *size;
2310
2311    if (*size == 0)
2312    {
2313       log_error(LOG_LEVEL_FATAL, "Invalid chunked input. Buffer is empty.");
2314       return JB_ERR_PARSE;
2315    }
2316
2317    assert(buffer);
2318    from_p = to_p = buffer;
2319
2320 #ifndef FUZZ
2321    /*
2322     * Refuse to de-chunk invalid or incomplete data unless we're fuzzing.
2323     */
2324    if (!chunked_data_is_complete(buffer, *size, 0))
2325    {
2326       log_error(LOG_LEVEL_ERROR,
2327          "Chunk-encoding appears to be invalid. Content can't be filtered.");
2328       return JB_ERR_PARSE;
2329    }
2330 #endif
2331
2332    if (sscanf(buffer, "%x", &chunksize) != 1)
2333    {
2334       log_error(LOG_LEVEL_ERROR, "Invalid first chunksize while stripping \"chunked\" transfer coding");
2335       return JB_ERR_PARSE;
2336    }
2337
2338    while (chunksize > 0U)
2339    {
2340       /*
2341        * If the chunk-size is valid, we should have at least
2342        * chunk-size bytes of chunk-data and five bytes of
2343        * meta data (chunk-size, CRLF, CRLF) left in the buffer.
2344        */
2345       if (chunksize + 5 >= *size - newsize)
2346       {
2347          log_error(LOG_LEVEL_ERROR,
2348             "Chunk size %u exceeds buffered data left. "
2349             "Already digested %lu of %lu buffered bytes.",
2350             chunksize, newsize, *size);
2351          return JB_ERR_PARSE;
2352       }
2353
2354       /*
2355        * Skip the chunk-size, the optional chunk-ext and the CRLF
2356        * that is supposed to be located directly before the start
2357        * of chunk-data.
2358        */
2359       if (NULL == (from_p = strstr(from_p, "\r\n")))
2360       {
2361          log_error(LOG_LEVEL_ERROR,
2362             "Failed to strip \"chunked\" transfer coding. "
2363             "Line with chunk size doesn't seem to end properly.");
2364          return JB_ERR_PARSE;
2365       }
2366       from_p += 2;
2367
2368       /*
2369        * The previous strstr() does not enforce chunk-validity
2370        * and is sattisfied as long a CRLF is left in the buffer.
2371        *
2372        * Make sure the bytes we consider chunk-data are within
2373        * the valid range.
2374        */
2375       if (from_p + chunksize >= end_of_buffer)
2376       {
2377          log_error(LOG_LEVEL_ERROR,
2378             "Failed to decode content for filtering. "
2379             "One chunk end is beyond the end of the buffer.");
2380          return JB_ERR_PARSE;
2381       }
2382
2383       memmove(to_p, from_p, (size_t) chunksize);
2384       newsize += chunksize;
2385       to_p = buffer + newsize;
2386       from_p += chunksize;
2387
2388       /*
2389        * Not merging this check with the previous one allows us
2390        * to keep chunks without trailing CRLF. It's not clear
2391        * if we actually have to care about those, though.
2392        */
2393       if (from_p + 2 >= end_of_buffer)
2394       {
2395          log_error(LOG_LEVEL_ERROR, "Not enough room for trailing CRLF.");
2396          return JB_ERR_PARSE;
2397       }
2398       from_p += 2;
2399       if (sscanf(from_p, "%x", &chunksize) != 1)
2400       {
2401          log_error(LOG_LEVEL_INFO, "Invalid \"chunked\" transfer encoding detected and ignored.");
2402          break;
2403       }
2404    }
2405
2406    /* XXX: Should get its own loglevel. */
2407    log_error(LOG_LEVEL_RE_FILTER,
2408       "De-chunking successful. Shrunk from %lu to %lu", *size, newsize);
2409
2410    *size = newsize;
2411
2412    return JB_ERR_OK;
2413
2414 }
2415
2416
2417 /*********************************************************************
2418  *
2419  * Function    :  prepare_for_filtering
2420  *
2421  * Description :  If necessary, de-chunks and decompresses
2422  *                the content so it can get filterd.
2423  *
2424  * Parameters  :
2425  *          1  :  csp = Current client state (buffers, headers, etc...)
2426  *
2427  * Returns     :  JB_ERR_OK for success,
2428  *                JB_ERR_PARSE otherwise
2429  *
2430  *********************************************************************/
2431 static jb_err prepare_for_filtering(struct client_state *csp)
2432 {
2433    jb_err err = JB_ERR_OK;
2434
2435    /*
2436     * If the body has a "chunked" transfer-encoding,
2437     * get rid of it, adjusting size and iob->eod
2438     */
2439    if (csp->flags & CSP_FLAG_CHUNKED)
2440    {
2441       size_t size = (size_t)(csp->iob->eod - csp->iob->cur);
2442
2443       log_error(LOG_LEVEL_RE_FILTER, "Need to de-chunk first");
2444       err = remove_chunked_transfer_coding(csp->iob->cur, &size);
2445       if (JB_ERR_OK == err)
2446       {
2447          csp->iob->eod = csp->iob->cur + size;
2448          csp->flags |= CSP_FLAG_MODIFIED;
2449       }
2450       else
2451       {
2452          return JB_ERR_PARSE;
2453       }
2454    }
2455
2456 #ifdef FEATURE_ZLIB
2457    /*
2458     * If the body has a supported transfer-encoding,
2459     * decompress it, adjusting size and iob->eod.
2460     */
2461    if ((csp->content_type & (CT_GZIP|CT_DEFLATE))
2462 #ifdef FEATURE_BROTLI
2463       || (csp->content_type & CT_BROTLI)
2464 #endif
2465        )
2466    {
2467       if (0 == csp->iob->eod - csp->iob->cur)
2468       {
2469          /* Nothing left after de-chunking. */
2470          return JB_ERR_OK;
2471       }
2472
2473       err = decompress_iob(csp);
2474
2475       if (JB_ERR_OK == err)
2476       {
2477          csp->flags |= CSP_FLAG_MODIFIED;
2478          csp->content_type &= ~CT_TABOO;
2479       }
2480       else
2481       {
2482          /*
2483           * Unset content types to remember not to
2484           * modify the Content-Encoding header later.
2485           */
2486          csp->content_type &= ~CT_GZIP;
2487          csp->content_type &= ~CT_DEFLATE;
2488 #ifdef FEATURE_BROTLI
2489          csp->content_type &= ~CT_BROTLI;
2490 #endif
2491       }
2492    }
2493 #endif
2494
2495    return err;
2496 }
2497
2498
2499 /*********************************************************************
2500  *
2501  * Function    :  execute_content_filters
2502  *
2503  * Description :  Executes a given content filter.
2504  *
2505  * Parameters  :
2506  *          1  :  csp = Current client state (buffers, headers, etc...)
2507  *
2508  * Returns     :  Pointer to the modified buffer, or
2509  *                NULL if filtering failed or wasn't necessary.
2510  *
2511  *********************************************************************/
2512 char *execute_content_filters(struct client_state *csp)
2513 {
2514    char *content;
2515    filter_function_ptr content_filter;
2516
2517    assert(content_filters_enabled(csp->action));
2518
2519    if (0 == csp->iob->eod - csp->iob->cur)
2520    {
2521       /*
2522        * No content (probably status code 301, 302 ...),
2523        * no filtering necessary.
2524        */
2525       return NULL;
2526    }
2527
2528    if (JB_ERR_OK != prepare_for_filtering(csp))
2529    {
2530       /*
2531        * We failed to de-chunk or decompress, don't accept
2532        * another request on the client connection.
2533        */
2534       csp->flags &= ~CSP_FLAG_CLIENT_CONNECTION_KEEP_ALIVE;
2535       return NULL;
2536    }
2537
2538    if (0 == csp->iob->eod - csp->iob->cur)
2539    {
2540       /*
2541        * Clown alarm: chunked and/or compressed nothing delivered.
2542        */
2543       return NULL;
2544    }
2545
2546    content_filter = get_filter_function(csp);
2547    content = (content_filter != NULL) ? (*content_filter)(csp) : NULL;
2548
2549 #ifdef FEATURE_EXTERNAL_FILTERS
2550    if ((csp->content_type & CT_TEXT) &&
2551        !list_is_empty(csp->action->multi[ACTION_MULTI_EXTERNAL_FILTER]))
2552    {
2553       struct list_entry *filtername;
2554       size_t size = (size_t)csp->content_length;
2555
2556       if (content == NULL)
2557       {
2558          content = csp->iob->cur;
2559          size = (size_t)(csp->iob->eod - csp->iob->cur);
2560       }
2561
2562       for (filtername = csp->action->multi[ACTION_MULTI_EXTERNAL_FILTER]->first;
2563            filtername ; filtername = filtername->next)
2564       {
2565          char *result = execute_external_filter(csp, filtername->str, content, &size);
2566          if (result != NULL)
2567          {
2568             if (content != csp->iob->cur)
2569             {
2570                free(content);
2571             }
2572             content = result;
2573          }
2574       }
2575       csp->flags |= CSP_FLAG_MODIFIED;
2576       csp->content_length = size;
2577    }
2578 #endif /* def FEATURE_EXTERNAL_FILTERS */
2579
2580    return content;
2581
2582 }
2583
2584
2585 /*********************************************************************
2586  *
2587  * Function    :  execute_client_body_filters
2588  *
2589  * Description :  Executes client body filters for the request that is buffered
2590  *                in the client_iob. The client_iob is updated with the filtered
2591  *                content.
2592  *
2593  * Parameters  :
2594  *          1  :  csp = Current client state (buffers, headers, etc...)
2595  *          2  :  content_length = content length. Upon successful filtering
2596  *                the passed value is updated with the new content length.
2597  *
2598  * Returns     :  1 if the content has been filterd. 0 if it hasn't.
2599  *
2600  *********************************************************************/
2601 int execute_client_body_filters(struct client_state *csp, size_t *content_length)
2602 {
2603    char *filtered_content;
2604
2605    assert(client_body_filters_enabled(csp->action));
2606
2607    if (content_length == 0)
2608    {
2609       /*
2610        * No content, no filtering necessary.
2611        */
2612       return 0;
2613    }
2614
2615    filtered_content = pcrs_filter_request_body(csp, csp->client_iob->cur, content_length);
2616    if (filtered_content != NULL)
2617    {
2618       freez(csp->client_iob->buf);
2619       csp->client_iob->buf  = filtered_content;
2620       csp->client_iob->cur  = csp->client_iob->buf;
2621       csp->client_iob->eod  = csp->client_iob->cur + *content_length;
2622       csp->client_iob->size = *content_length;
2623
2624       return 1;
2625    }
2626    
2627    return 0;
2628 }
2629
2630
2631 /*********************************************************************
2632  *
2633  * Function    :  execute_client_body_taggers
2634  *
2635  * Description :  Executes client body taggers for the request that is
2636  *                buffered in the client_iob.
2637  *                XXX: Lots of code shared with header_tagger
2638  *
2639  * Parameters  :
2640  *          1  :  csp = Current client state (buffers, headers, etc...)
2641  *          2  :  content_length = content length.
2642  *
2643  * Returns     :  XXX
2644  *
2645  *********************************************************************/
2646 jb_err execute_client_body_taggers(struct client_state *csp, size_t content_length)
2647 {
2648    enum filter_type wanted_filter_type = FT_CLIENT_BODY_TAGGER;
2649    int multi_action_index = ACTION_MULTI_CLIENT_BODY_TAGGER;
2650    pcrs_job *job;
2651
2652    struct re_filterfile_spec *b;
2653    struct list_entry *tag_name;
2654
2655    assert(client_body_taggers_enabled(csp->action));
2656
2657    if (content_length == 0)
2658    {
2659       /*
2660        * No content, no tagging necessary.
2661        */
2662       return JB_ERR_OK;
2663    }
2664
2665    log_error(LOG_LEVEL_INFO, "Got to execute tagger on %N",
2666       content_length, csp->client_iob->cur);
2667
2668    if (list_is_empty(csp->action->multi[multi_action_index])
2669       || filters_available(csp) == FALSE)
2670    {
2671       /* Return early if no taggers apply or if none are available. */
2672       return JB_ERR_OK;
2673    }
2674
2675    /* Execute all applying taggers */
2676    for (tag_name = csp->action->multi[multi_action_index]->first;
2677         NULL != tag_name; tag_name = tag_name->next)
2678    {
2679       char *modified_tag = NULL;
2680       char *tag = csp->client_iob->cur;
2681       size_t size = content_length;
2682       pcrs_job *joblist;
2683
2684       b = get_filter(csp, tag_name->str, wanted_filter_type);
2685       if (b == NULL)
2686       {
2687          continue;
2688       }
2689
2690       joblist = b->joblist;
2691
2692       if (b->dynamic) joblist = compile_dynamic_pcrs_job_list(csp, b);
2693
2694       if (NULL == joblist)
2695       {
2696          log_error(LOG_LEVEL_TAGGING,
2697             "Tagger %s has empty joblist. Nothing to do.", b->name);
2698          continue;
2699       }
2700
2701       /* execute their pcrs_joblist on the body. */
2702       for (job = joblist; NULL != job; job = job->next)
2703       {
2704          const int hits = pcrs_execute(job, tag, size, &modified_tag, &size);
2705
2706          if (0 < hits)
2707          {
2708             /* Success, continue with the modified version. */
2709             if (tag != csp->client_iob->cur)
2710             {
2711                freez(tag);
2712             }
2713             tag = modified_tag;
2714          }
2715          else
2716          {
2717             /* Tagger doesn't match */
2718             if (0 > hits)
2719             {
2720                /* Regex failure, log it but continue anyway. */
2721                log_error(LOG_LEVEL_ERROR,
2722                   "Problems with tagger \'%s\': %s",
2723                   b->name, pcrs_strerror(hits));
2724             }
2725             freez(modified_tag);
2726          }
2727       }
2728
2729       if (b->dynamic) pcrs_free_joblist(joblist);
2730
2731       /* If this tagger matched */
2732       if (tag != csp->client_iob->cur)
2733       {
2734          if (0 == size)
2735          {
2736             /*
2737              * There is no technical limitation which makes
2738              * it impossible to use empty tags, but I assume
2739              * no one would do it intentionally.
2740              */
2741             freez(tag);
2742             log_error(LOG_LEVEL_TAGGING,
2743                "Tagger \'%s\' created an empty tag. Ignored.", b->name);
2744             continue;
2745          }
2746
2747          if (list_contains_item(csp->action->multi[ACTION_MULTI_SUPPRESS_TAG], tag))
2748          {
2749             log_error(LOG_LEVEL_TAGGING,
2750                "Tagger \'%s\' didn't add tag \'%s\': suppressed",
2751                b->name, tag);
2752             freez(tag);
2753             continue;
2754          }
2755
2756          if (!list_contains_item(csp->tags, tag))
2757          {
2758             if (JB_ERR_OK != enlist(csp->tags, tag))
2759             {
2760                log_error(LOG_LEVEL_ERROR,
2761                   "Insufficient memory to add tag \'%s\', "
2762                   "based on tagger \'%s\'",
2763                   tag, b->name);
2764             }
2765             else
2766             {
2767                char *action_message;
2768                /*
2769                 * update the action bits right away, to make
2770                 * tagging based on tags set by earlier taggers
2771                 * of the same kind possible.
2772                 */
2773                if (update_action_bits_for_tag(csp, tag))
2774                {
2775                   action_message = "Action bits updated accordingly.";
2776                }
2777                else
2778                {
2779                   action_message = "No action bits update necessary.";
2780                }
2781
2782                log_error(LOG_LEVEL_TAGGING,
2783                   "Tagger \'%s\' added tag \'%s\'. %s",
2784                   b->name, tag, action_message);
2785             }
2786          }
2787          else
2788          {
2789             /* XXX: Is this log-worthy? */
2790             log_error(LOG_LEVEL_TAGGING,
2791                "Tagger \'%s\' didn't add tag \'%s\'. Tag already present",
2792                b->name, tag);
2793          }
2794          freez(tag);
2795       }
2796    }
2797
2798    return JB_ERR_OK;
2799 }
2800
2801
2802 /*********************************************************************
2803  *
2804  * Function    :  get_url_actions
2805  *
2806  * Description :  Gets the actions for this URL.
2807  *
2808  * Parameters  :
2809  *          1  :  csp = Current client state (buffers, headers, etc...)
2810  *          2  :  http = http_request request for blocked URLs
2811  *
2812  * Returns     :  N/A
2813  *
2814  *********************************************************************/
2815 void get_url_actions(struct client_state *csp, struct http_request *http)
2816 {
2817    struct file_list *fl;
2818    struct url_actions *b;
2819    int i;
2820
2821    init_current_action(csp->action);
2822
2823    for (i = 0; i < MAX_AF_FILES; i++)
2824    {
2825       if (((fl = csp->actions_list[i]) == NULL) || ((b = fl->f) == NULL))
2826       {
2827          return;
2828       }
2829
2830 #ifdef FEATURE_CLIENT_TAGS
2831       apply_url_actions(csp->action, http, csp->client_tags, b);
2832 #else
2833       apply_url_actions(csp->action, http, b);
2834 #endif
2835    }
2836
2837    return;
2838 }
2839
2840 /*********************************************************************
2841  *
2842  * Function    :  apply_url_actions
2843  *
2844  * Description :  Applies a list of URL actions.
2845  *
2846  * Parameters  :
2847  *          1  :  action = Destination.
2848  *          2  :  http = Current URL
2849  *          3  :  client_tags = list of client tags
2850  *          4  :  b = list of URL actions to apply
2851  *
2852  * Returns     :  N/A
2853  *
2854  *********************************************************************/
2855 static void apply_url_actions(struct current_action_spec *action,
2856                               struct http_request *http,
2857 #ifdef FEATURE_CLIENT_TAGS
2858                               const struct list *client_tags,
2859 #endif
2860                               struct url_actions *b)
2861 {
2862    if (b == NULL)
2863    {
2864       /* Should never happen */
2865       return;
2866    }
2867
2868    for (b = b->next; NULL != b; b = b->next)
2869    {
2870       if (url_match(b->url, http))
2871       {
2872          merge_current_action(action, b->action);
2873       }
2874 #ifdef FEATURE_CLIENT_TAGS
2875       if (client_tag_match(b->url, client_tags))
2876       {
2877          merge_current_action(action, b->action);
2878       }
2879 #endif
2880    }
2881 }
2882
2883
2884 /*********************************************************************
2885  *
2886  * Function    :  get_forward_override_settings
2887  *
2888  * Description :  Returns forward settings as specified with the
2889  *                forward-override{} action. forward-override accepts
2890  *                forward lines similar to the one used in the
2891  *                configuration file, but without the URL pattern.
2892  *
2893  *                For example:
2894  *
2895  *                   forward / .
2896  *
2897  *                in the configuration file can be replaced with
2898  *                the action section:
2899  *
2900  *                 {+forward-override{forward .}}
2901  *                 /
2902  *
2903  * Parameters  :
2904  *          1  :  csp = Current client state (buffers, headers, etc...)
2905  *
2906  * Returns     :  Pointer to forwarding structure in case of success.
2907  *                Invalid syntax is fatal.
2908  *
2909  *********************************************************************/
2910 static const struct forward_spec *get_forward_override_settings(struct client_state *csp)
2911 {
2912    const char *forward_override_line = csp->action->string[ACTION_STRING_FORWARD_OVERRIDE];
2913    char forward_settings[BUFFER_SIZE];
2914    char *http_parent = NULL;
2915    /* variable names were chosen for consistency reasons. */
2916    struct forward_spec *fwd = NULL;
2917    int vec_count;
2918    char *vec[3];
2919
2920    assert(csp->action->flags & ACTION_FORWARD_OVERRIDE);
2921    /* Should be enforced by load_one_actions_file() */
2922    assert(strlen(forward_override_line) < sizeof(forward_settings) - 1);
2923
2924    /* Create a copy ssplit can modify */
2925    strlcpy(forward_settings, forward_override_line, sizeof(forward_settings));
2926
2927    if (NULL != csp->fwd)
2928    {
2929       /*
2930        * XXX: Currently necessary to prevent memory
2931        * leaks when the show-url-info cgi page is visited.
2932        */
2933       unload_forward_spec(csp->fwd);
2934    }
2935
2936    /*
2937     * allocate a new forward node, valid only for
2938     * the lifetime of this request. Save its location
2939     * in csp as well, so sweep() can free it later on.
2940     */
2941    fwd = csp->fwd = zalloc_or_die(sizeof(*fwd));
2942
2943    vec_count = ssplit(forward_settings, " \t", vec, SZ(vec));
2944    if ((vec_count == 2) && !strcasecmp(vec[0], "forward"))
2945    {
2946       fwd->type = SOCKS_NONE;
2947
2948       /* Parse the parent HTTP proxy host:port */
2949       http_parent = vec[1];
2950
2951    }
2952    else if ((vec_count == 2) && !strcasecmp(vec[0], "forward-webserver"))
2953    {
2954       fwd->type = FORWARD_WEBSERVER;
2955
2956       /* Parse the parent HTTP server host:port */
2957       http_parent = vec[1];
2958
2959    }
2960    else if (vec_count == 3)
2961    {
2962       char *socks_proxy = NULL;
2963
2964       if  (!strcasecmp(vec[0], "forward-socks4"))
2965       {
2966          fwd->type = SOCKS_4;
2967          socks_proxy = vec[1];
2968       }
2969       else if (!strcasecmp(vec[0], "forward-socks4a"))
2970       {
2971          fwd->type = SOCKS_4A;
2972          socks_proxy = vec[1];
2973       }
2974       else if (!strcasecmp(vec[0], "forward-socks5"))
2975       {
2976          fwd->type = SOCKS_5;
2977          socks_proxy = vec[1];
2978       }
2979       else if (!strcasecmp(vec[0], "forward-socks5t"))
2980       {
2981          fwd->type = SOCKS_5T;
2982          socks_proxy = vec[1];
2983       }
2984
2985       if (NULL != socks_proxy)
2986       {
2987          /* Parse the SOCKS proxy [user:pass@]host[:port] */
2988          fwd->gateway_port = 1080;
2989          parse_forwarder_address(socks_proxy,
2990             &fwd->gateway_host, &fwd->gateway_port,
2991             &fwd->auth_username, &fwd->auth_password);
2992
2993          http_parent = vec[2];
2994       }
2995    }
2996
2997    if (NULL == http_parent)
2998    {
2999       log_error(LOG_LEVEL_FATAL,
3000          "Invalid forward-override syntax in: %s", forward_override_line);
3001       /* Never get here - LOG_LEVEL_FATAL causes program exit */
3002    }
3003
3004    /* Parse http forwarding settings */
3005    if (strcmp(http_parent, ".") != 0)
3006    {
3007       fwd->forward_port = 8000;
3008       parse_forwarder_address(http_parent,
3009          &fwd->forward_host, &fwd->forward_port,
3010          NULL, NULL);
3011    }
3012
3013    assert (NULL != fwd);
3014
3015    log_error(LOG_LEVEL_CONNECT,
3016       "Overriding forwarding settings based on \'%s\'", forward_override_line);
3017
3018    return fwd;
3019 }
3020
3021
3022 /*********************************************************************
3023  *
3024  * Function    :  forward_url
3025  *
3026  * Description :  Should we forward this to another proxy?
3027  *
3028  * Parameters  :
3029  *          1  :  csp = Current client state (buffers, headers, etc...)
3030  *          2  :  http = http_request request for current URL
3031  *
3032  * Returns     :  Pointer to forwarding information.
3033  *
3034  *********************************************************************/
3035 const struct forward_spec *forward_url(struct client_state *csp,
3036                                        const struct http_request *http)
3037 {
3038    static const struct forward_spec fwd_default[1]; /* Zero'ed due to being static. */
3039    struct forward_spec *fwd = csp->config->forward;
3040
3041    if (csp->action->flags & ACTION_FORWARD_OVERRIDE)
3042    {
3043       return get_forward_override_settings(csp);
3044    }
3045
3046    if (fwd == NULL)
3047    {
3048       return fwd_default;
3049    }
3050
3051    while (fwd != NULL)
3052    {
3053       if (url_match(fwd->url, http))
3054       {
3055          return fwd;
3056       }
3057       fwd = fwd->next;
3058    }
3059
3060    return fwd_default;
3061 }
3062
3063
3064 /*********************************************************************
3065  *
3066  * Function    :  direct_response
3067  *
3068  * Description :  Check if Max-Forwards == 0 for an OPTIONS or TRACE
3069  *                request and if so, return a HTTP 501 to the client.
3070  *
3071  *                FIXME: I have a stupid name and I should handle the
3072  *                requests properly. Still, what we do here is rfc-
3073  *                compliant, whereas ignoring or forwarding are not.
3074  *
3075  * Parameters  :
3076  *          1  :  csp = Current client state (buffers, headers, etc...)
3077  *
3078  * Returns     :  http_response if , NULL if nonmatch or handler fail
3079  *
3080  *********************************************************************/
3081 struct http_response *direct_response(struct client_state *csp)
3082 {
3083    struct http_response *rsp;
3084    struct list_entry *p;
3085
3086    if ((0 == strcmpic(csp->http->gpc, "trace"))
3087       || (0 == strcmpic(csp->http->gpc, "options")))
3088    {
3089       for (p = csp->headers->first; (p != NULL) ; p = p->next)
3090       {
3091          if (!strncmpic(p->str, "Max-Forwards:", 13))
3092          {
3093             unsigned int max_forwards;
3094
3095             /*
3096              * If it's a Max-Forwards value of zero,
3097              * we have to intercept the request.
3098              */
3099             if (1 == sscanf(p->str+12, ": %u", &max_forwards) && max_forwards == 0)
3100             {
3101                /*
3102                 * FIXME: We could handle at least TRACE here,
3103                 * but that would require a verbatim copy of
3104                 * the request which we don't have anymore
3105                 */
3106                 log_error(LOG_LEVEL_HEADER,
3107                   "Detected header \'%s\' in OPTIONS or TRACE request. Returning 501.",
3108                   p->str);
3109
3110                /* Get mem for response or fail*/
3111                if (NULL == (rsp = alloc_http_response()))
3112                {
3113                   return cgi_error_memory();
3114                }
3115
3116                rsp->status = strdup_or_die("501 Not Implemented");
3117                rsp->is_static = 1;
3118                rsp->crunch_reason = UNSUPPORTED;
3119
3120                return(finish_http_response(csp, rsp));
3121             }
3122          }
3123       }
3124    }
3125    return NULL;
3126 }
3127
3128
3129 /*********************************************************************
3130  *
3131  * Function    :  content_requires_filtering
3132  *
3133  * Description :  Checks whether there are any content filters
3134  *                enabled for the current request and if they
3135  *                can actually be applied..
3136  *
3137  * Parameters  :
3138  *          1  :  csp = Current client state (buffers, headers, etc...)
3139  *
3140  * Returns     :  TRUE for yes, FALSE otherwise
3141  *
3142  *********************************************************************/
3143 int content_requires_filtering(struct client_state *csp)
3144 {
3145    if ((csp->content_type & CT_TABOO)
3146       && !(csp->action->flags & ACTION_FORCE_TEXT_MODE))
3147    {
3148       return FALSE;
3149    }
3150
3151    /*
3152     * Are we enabling text mode by force?
3153     */
3154    if (csp->action->flags & ACTION_FORCE_TEXT_MODE)
3155    {
3156       /*
3157        * Do we really have to?
3158        */
3159       if (csp->content_type & CT_TEXT)
3160       {
3161          log_error(LOG_LEVEL_HEADER, "Text mode is already enabled.");
3162       }
3163       else
3164       {
3165          csp->content_type |= CT_TEXT;
3166          log_error(LOG_LEVEL_HEADER, "Text mode enabled by force. Take cover!");
3167       }
3168    }
3169
3170    if (!(csp->content_type & CT_DECLARED))
3171    {
3172       /*
3173        * The server didn't bother to declare a MIME-Type.
3174        * Assume it's text that can be filtered.
3175        *
3176        * This also regularly happens with 304 responses,
3177        * therefore logging anything here would cause
3178        * too much noise.
3179        */
3180       csp->content_type |= CT_TEXT;
3181    }
3182
3183    /*
3184     * Choose the applying filter function based on
3185     * the content type and action settings.
3186     */
3187    if ((csp->content_type & CT_TEXT) &&
3188        (!list_is_empty(csp->action->multi[ACTION_MULTI_FILTER]) ||
3189         !list_is_empty(csp->action->multi[ACTION_MULTI_EXTERNAL_FILTER])))
3190    {
3191       return TRUE;
3192    }
3193    else if ((csp->content_type & CT_GIF)  &&
3194             (csp->action->flags & ACTION_DEANIMATE))
3195    {
3196       return TRUE;
3197    }
3198
3199    return FALSE;
3200
3201 }
3202
3203
3204 /*********************************************************************
3205  *
3206  * Function    :  content_filters_enabled
3207  *
3208  * Description :  Checks whether there are any content filters
3209  *                enabled for the current request.
3210  *
3211  * Parameters  :
3212  *          1  :  action = Action spec to check.
3213  *
3214  * Returns     :  TRUE for yes, FALSE otherwise
3215  *
3216  *********************************************************************/
3217 int content_filters_enabled(const struct current_action_spec *action)
3218 {
3219    return ((action->flags & ACTION_DEANIMATE) ||
3220       !list_is_empty(action->multi[ACTION_MULTI_FILTER]) ||
3221       !list_is_empty(action->multi[ACTION_MULTI_EXTERNAL_FILTER]));
3222 }
3223
3224
3225 /*********************************************************************
3226  *
3227  * Function    :  client_body_filters_enabled
3228  *
3229  * Description :  Checks whether there are any client body filters
3230  *                enabled for the current request.
3231  *
3232  * Parameters  :
3233  *          1  :  action = Action spec to check.
3234  *
3235  * Returns     :  TRUE for yes, FALSE otherwise
3236  *
3237  *********************************************************************/
3238 int client_body_filters_enabled(const struct current_action_spec *action)
3239 {
3240    return !list_is_empty(action->multi[ACTION_MULTI_CLIENT_BODY_FILTER]);
3241 }
3242
3243
3244 /*********************************************************************
3245  *
3246  * Function    :  client_body_taggers_enabled
3247  *
3248  * Description :  Checks whether there are any client body taggers
3249  *                enabled for the current request.
3250  *
3251  * Parameters  :
3252  *          1  :  action = Action spec to check.
3253  *
3254  * Returns     :  TRUE for yes, FALSE otherwise
3255  *
3256  *********************************************************************/
3257 int client_body_taggers_enabled(const struct current_action_spec *action)
3258 {
3259    return !list_is_empty(action->multi[ACTION_MULTI_CLIENT_BODY_TAGGER]);
3260 }
3261
3262 /*********************************************************************
3263  *
3264  * Function    :  filters_available
3265  *
3266  * Description :  Checks whether there are any filters available.
3267  *
3268  * Parameters  :
3269  *          1  :  csp = Current client state (buffers, headers, etc...)
3270  *
3271  * Returns     :  TRUE for yes, FALSE otherwise.
3272  *
3273  *********************************************************************/
3274 int filters_available(const struct client_state *csp)
3275 {
3276    int i;
3277    for (i = 0; i < MAX_AF_FILES; i++)
3278    {
3279       const struct file_list *fl = csp->rlist[i];
3280       if ((NULL != fl) && (NULL != fl->f))
3281       {
3282          return TRUE;
3283       }
3284    }
3285    return FALSE;
3286 }
3287
3288 #ifdef FEATURE_EXTENDED_STATISTICS
3289
3290 struct filter_statistics_entry
3291 {
3292    char *filter;
3293    unsigned long long executions;
3294    unsigned long long response_bodies_modified;
3295    unsigned long long hits;
3296
3297    struct filter_statistics_entry *next;
3298 };
3299
3300 static struct filter_statistics_entry *filter_statistics = NULL;
3301
3302
3303 /*********************************************************************
3304  *
3305  * Function    :  register_filter_for_statistics
3306  *
3307  * Description :  Registers a filter so we can gather statistics for
3308  *                it unless the filter has already been registered
3309  *                before.
3310  *
3311  * Parameters  :
3312  *          1  :  filter = Name of the filter to register
3313  *
3314  * Returns     :  void
3315  *
3316  *********************************************************************/
3317 void register_filter_for_statistics(const char *filter)
3318 {
3319    struct filter_statistics_entry *entry;
3320
3321    privoxy_mutex_lock(&filter_statistics_mutex);
3322
3323    if (filter_statistics == NULL)
3324    {
3325       filter_statistics = zalloc_or_die(sizeof(struct filter_statistics_entry));
3326       entry = filter_statistics;
3327       entry->filter = strdup_or_die(filter);
3328       privoxy_mutex_unlock(&filter_statistics_mutex);
3329       return;
3330    }
3331    entry = filter_statistics;
3332    while (entry != NULL)
3333    {
3334       if (!strcmp(entry->filter, filter))
3335       {
3336          /* Already registered, nothing to do. */
3337          break;
3338       }
3339       if (entry->next == NULL)
3340       {
3341          entry->next = zalloc_or_die(sizeof(struct filter_statistics_entry));
3342          entry->next->filter = strdup_or_die(filter);
3343          break;
3344       }
3345       entry = entry->next;
3346    }
3347
3348    privoxy_mutex_unlock(&filter_statistics_mutex);
3349
3350 }
3351
3352
3353 /*********************************************************************
3354  *
3355  * Function    :  update_filter_statistics
3356  *
3357  * Description :  Updates the statistics for a filter.
3358  *
3359  * Parameters  :
3360  *          1  :  filter = Name of the filter to update
3361  *          2  :  hits = Hit count.
3362  *
3363  * Returns     :  void
3364  *
3365  *********************************************************************/
3366 void update_filter_statistics(const char *filter, int hits)
3367 {
3368    struct filter_statistics_entry *entry;
3369
3370    privoxy_mutex_lock(&filter_statistics_mutex);
3371
3372    entry = filter_statistics;
3373    while (entry != NULL)
3374    {
3375       if (!strcmp(entry->filter, filter))
3376       {
3377          entry->executions++;
3378          if (hits != 0)
3379          {
3380             entry->response_bodies_modified++;
3381             entry->hits += (unsigned)hits;
3382          }
3383          break;
3384       }
3385       entry = entry->next;
3386    }
3387
3388    privoxy_mutex_unlock(&filter_statistics_mutex);
3389
3390 }
3391
3392
3393 /*********************************************************************
3394  *
3395  * Function    :  get_filter_statistics
3396  *
3397  * Description :  Gets the statistics for a filter.
3398  *
3399  * Parameters  :
3400  *          1  :  filter = Name of the filter to get statistics for.
3401  *          2  :  executions = Storage for the execution count.
3402  *          3  :  response_bodies_modified = Storage for the number
3403  *                of modified response bodies.
3404  *          4  :  hits = Storage for the number of hits.
3405  *
3406  * Returns     :  void
3407  *
3408  *********************************************************************/
3409 void get_filter_statistics(const char *filter, unsigned long long *executions,
3410                            unsigned long long *response_bodies_modified,
3411                            unsigned long long *hits)
3412 {
3413    struct filter_statistics_entry *entry;
3414
3415    privoxy_mutex_lock(&filter_statistics_mutex);
3416
3417    entry = filter_statistics;
3418    while (entry != NULL)
3419    {
3420       if (!strcmp(entry->filter, filter))
3421       {
3422          *executions = entry->executions;
3423          *response_bodies_modified = entry->response_bodies_modified;
3424          *hits = entry->hits;
3425          break;
3426       }
3427       entry = entry->next;
3428    }
3429
3430    privoxy_mutex_unlock(&filter_statistics_mutex);
3431
3432 }
3433
3434
3435 struct block_statistics_entry
3436 {
3437    char *block_reason;
3438    unsigned long long count;
3439
3440    struct block_statistics_entry *next;
3441 };
3442
3443 static struct block_statistics_entry *block_statistics = NULL;
3444
3445 /*********************************************************************
3446  *
3447  * Function    :  register_block_reason_for_statistics
3448  *
3449  * Description :  Registers a block reason so we can gather statistics
3450  *                for it unless the block reason has already been
3451  *                registered before.
3452  *
3453  * Parameters  :
3454  *          1  :  block_reason = Block reason to register
3455  *
3456  * Returns     :  void
3457  *
3458  *********************************************************************/
3459 void register_block_reason_for_statistics(const char *block_reason)
3460 {
3461    struct block_statistics_entry *entry;
3462
3463    privoxy_mutex_lock(&block_reason_statistics_mutex);
3464
3465    if (block_statistics == NULL)
3466    {
3467       block_statistics = zalloc_or_die(sizeof(struct block_statistics_entry));
3468       entry = block_statistics;
3469       entry->block_reason = strdup_or_die(block_reason);
3470       privoxy_mutex_unlock(&block_reason_statistics_mutex);
3471       return;
3472    }
3473    entry = block_statistics;
3474    while (entry != NULL)
3475    {
3476       if (!strcmp(entry->block_reason, block_reason))
3477       {
3478          /* Already registered, nothing to do. */
3479          break;
3480       }
3481       if (entry->next == NULL)
3482       {
3483          entry->next = zalloc_or_die(sizeof(struct block_statistics_entry));
3484          entry->next->block_reason = strdup_or_die(block_reason);
3485          break;
3486       }
3487       entry = entry->next;
3488    }
3489
3490    privoxy_mutex_unlock(&block_reason_statistics_mutex);
3491
3492 }
3493
3494
3495 /*********************************************************************
3496  *
3497  * Function    :  increment_block_reason_counter
3498  *
3499  * Description :  Updates the counter for a block reason.
3500  *
3501  * Parameters  :
3502  *          1  :  block_reason = Block reason to count
3503  *
3504  * Returns     :  void
3505  *
3506  *********************************************************************/
3507 static void increment_block_reason_counter(const char *block_reason)
3508 {
3509    struct block_statistics_entry *entry;
3510
3511    privoxy_mutex_lock(&block_reason_statistics_mutex);
3512
3513    entry = block_statistics;
3514    while (entry != NULL)
3515    {
3516       if (!strcmp(entry->block_reason, block_reason))
3517       {
3518          entry->count++;
3519          break;
3520       }
3521       entry = entry->next;
3522    }
3523
3524    privoxy_mutex_unlock(&block_reason_statistics_mutex);
3525
3526 }
3527
3528
3529 /*********************************************************************
3530  *
3531  * Function    :  get_block_reason_count
3532  *
3533  * Description :  Gets number of times a block reason was used.
3534  *
3535  * Parameters  :
3536  *          1  :  block_reason = Block reason to get statistics for.
3537  *          2  :  count = Storage for the number of times the block
3538  *                        reason was used.
3539  *
3540  * Returns     :  void
3541  *
3542  *********************************************************************/
3543 void get_block_reason_count(const char *block_reason, unsigned long long *count)
3544 {
3545    struct block_statistics_entry *entry;
3546
3547    privoxy_mutex_lock(&block_reason_statistics_mutex);
3548
3549    entry = block_statistics;
3550    while (entry != NULL)
3551    {
3552       if (!strcmp(entry->block_reason, block_reason))
3553       {
3554          *count = entry->count;
3555          break;
3556       }
3557       entry = entry->next;
3558    }
3559
3560    privoxy_mutex_unlock(&block_reason_statistics_mutex);
3561
3562 }
3563
3564 #endif /* def FEATURE_EXTENDED_STATISTICS */
3565
3566 /*
3567   Local Variables:
3568   tab-width: 3
3569   end:
3570 */