Replace TABs by spaces in source code.
[privoxy.git] / filters.c
1 const char filters_rcs[] = "$Id: filters.c,v 1.65 2006/09/21 12:54:43 fabiankeil Exp $";
2 /*********************************************************************
3  *
4  * File        :  $Source: /cvsroot/ijbswa/current/filters.c,v $
5  *
6  * Purpose     :  Declares functions to parse/crunch headers and pages.
7  *                Functions declared include:
8  *                   `acl_addr', `add_stats', `block_acl', `block_imageurl',
9  *                   `block_url', `url_actions', `domain_split',
10  *                   `filter_popups', `forward_url', 'redirect_url',
11  *                   `ij_untrusted_url', `intercept_url', `pcrs_filter_respose',
12  *                   `ijb_send_banner', `trust_url', `gif_deanimate_response',
13  *                   `jpeg_inspect_response'
14  *
15  * Copyright   :  Written by and Copyright (C) 2001, 2004 the SourceForge
16  *                Privoxy team. http://www.privoxy.org/
17  *
18  *                Based on the Internet Junkbuster originally written
19  *                by and Copyright (C) 1997 Anonymous Coders and
20  *                Junkbusters Corporation.  http://www.junkbusters.com
21  *
22  *                This program is free software; you can redistribute it
23  *                and/or modify it under the terms of the GNU General
24  *                Public License as published by the Free Software
25  *                Foundation; either version 2 of the License, or (at
26  *                your option) any later version.
27  *
28  *                This program is distributed in the hope that it will
29  *                be useful, but WITHOUT ANY WARRANTY; without even the
30  *                implied warranty of MERCHANTABILITY or FITNESS FOR A
31  *                PARTICULAR PURPOSE.  See the GNU General Public
32  *                License for more details.
33  *
34  *                The GNU General Public License should be included with
35  *                this file.  If not, you can view it at
36  *                http://www.gnu.org/copyleft/gpl.html
37  *                or write to the Free Software Foundation, Inc., 59
38  *                Temple Place - Suite 330, Boston, MA  02111-1307, USA.
39  *
40  * Revisions   :
41  *    $Log: filters.c,v $
42  *    Revision 1.65  2006/09/21 12:54:43  fabiankeil
43  *    Fix +redirect{}. Didn't work with -fast-redirects.
44  *
45  *    Revision 1.64  2006/08/31 10:55:49  fabiankeil
46  *    Block requests for untrusted URLs with status
47  *    code 403 instead of 200.
48  *
49  *    Revision 1.63  2006/08/31 10:11:28  fabiankeil
50  *    Don't free p which is still in use and will be later
51  *    freed by free_map(). Don't claim the referrer is unknown
52  *    when the client didn't set one.
53  *
54  *    Revision 1.62  2006/08/14 00:27:47  david__schmidt
55  *    Feature request 595948: Re-Filter logging in single line
56  *
57  *    Revision 1.61  2006/08/03 02:46:41  david__schmidt
58  *    Incorporate Fabian Keil's patch work:\rhttp://www.fabiankeil.de/sourcecode/privoxy/
59  *
60  *    Revision 1.60  2006/07/18 14:48:46  david__schmidt
61  *    Reorganizing the repository: swapping out what was HEAD (the old 3.1 branch)
62  *    with what was really the latest development (the v_3_0_branch branch)
63  *
64  *    Revision 1.58.2.9  2006/01/29 23:10:56  david__schmidt
65  *    Multiple filter file support
66  *
67  *    Revision 1.58.2.8  2005/05/07 21:50:55  david__schmidt
68  *    A few memory leaks plugged (mostly on error paths)
69  *
70  *    Revision 1.58.2.7  2004/10/03 12:53:32  david__schmidt
71  *    Add the ability to check jpeg images for invalid
72  *    lengths of comment blocks.  Defensive strategy
73  *    against the exploit:
74  *       Microsoft Security Bulletin MS04-028
75  *       Buffer Overrun in JPEG Processing (GDI+) Could
76  *       Allow Code Execution (833987)
77  *    Enabled with +inspect-jpegs in actions files.
78  *
79  *    Revision 1.58.2.6  2003/12/06 22:18:27  gliptak
80  *    Correcting compile problem with FEATURE_IMAGE_BLOCKING
81  *
82  *    Revision 1.58.2.5  2003/11/11 13:10:31  oes
83  *    Fixed bug #839859: "See why" link URL now gets url-encoded.
84  *
85  *    Revision 1.58.2.4  2003/02/28 12:52:45  oes
86  *    Fixed a typo
87  *
88  *    Revision 1.58.2.3  2002/09/25 14:51:51  oes
89  *    Added basic support for OPTIONS and TRACE HTTP methods:
90  *    New function direct_response which handles OPTIONS and
91  *    TRACE requests whose Max-Forwards header field is zero.
92  *
93  *    Revision 1.58.2.2  2002/08/01 17:18:28  oes
94  *    Fixed BR 537651 / SR 579724 (MSIE image detect improper for IE/Mac)
95  *
96  *    Revision 1.58.2.1  2002/07/26 15:18:53  oes
97  *    - Bugfix: Executing a filters without jobs no longer results in
98  *      turing off *all* filters.
99  *    - Security fix: Malicious web servers can't cause a seg fault
100  *      through bogus chunk sizes anymore
101  *
102  *    Revision 1.58  2002/04/24 02:11:17  oes
103  *    Jon's multiple AF patch: url_actions now evaluates rules
104  *    from all AFs.
105  *
106  *    Revision 1.57  2002/04/08 20:38:34  swa
107  *    fixed JB spelling
108  *
109  *    Revision 1.56  2002/04/05 15:51:24  oes
110  *     - bugfix: error-pages now get correct request protocol
111  *     - fix for invalid HTML in trust info
112  *
113  *    Revision 1.55  2002/04/02 16:13:51  oes
114  *    Fix: No "Go there anyway" for SSL
115  *
116  *    Revision 1.54  2002/04/02 14:55:56  oes
117  *    Bugfix: is_untrusted_url() now depends on FEATURE_TRUST, not FEATURE_COOKIE_JAR
118  *
119  *    Revision 1.53  2002/03/26 22:29:54  swa
120  *    we have a new homepage!
121  *
122  *    Revision 1.52  2002/03/24 16:35:57  jongfoster
123  *    Removing logo
124  *
125  *    Revision 1.51  2002/03/24 15:23:33  jongfoster
126  *    Name changes
127  *
128  *    Revision 1.50  2002/03/24 13:25:43  swa
129  *    name change related issues
130  *
131  *    Revision 1.49  2002/03/16 20:29:14  oes
132  *    Cosmetics
133  *
134  *    Revision 1.48  2002/03/13 20:25:34  oes
135  *    Better logging for content filters
136  *
137  *    Revision 1.47  2002/03/13 00:30:52  jongfoster
138  *    Killing warnings
139  *    Added option of always sending redirect for imageblock,
140  *    currently disabled with #if 0.
141  *
142  *    Revision 1.46  2002/03/12 01:42:49  oes
143  *    Introduced modular filters
144  *
145  *    Revision 1.45  2002/03/08 16:47:50  oes
146  *    Added choice beween GIF and PNG built-in images
147  *
148  *    Revision 1.44  2002/03/07 03:49:31  oes
149  *     - Fixed compiler warnings etc
150  *     - Changed built-in images from GIF to PNG
151  *       (with regard to Unisys patent issue)
152  *     - Added a 4x4 pattern PNG which is less intrusive
153  *       than the logo but also clearly marks the deleted banners
154  *
155  *    Revision 1.43  2002/01/22 23:51:59  jongfoster
156  *    Replacing strsav() with the safer string_append().
157  *
158  *    Adding missing html_encode() to error message generators.  Where encoded
159  *    and unencoded versions of a string were provided, removing the unencoded
160  *    one.
161  *
162  *    Revision 1.42  2002/01/17 21:00:32  jongfoster
163  *    Moving all our URL and URL pattern parsing code to urlmatch.c.
164  *
165  *    Using a single, simple url_match(pattern,url) function - rather than
166  *    the 3-line match routine which was repeated all over the place.
167  *
168  *    Renaming free_url to free_url_spec, since it frees a struct url_spec.
169  *
170  *    Using parse_http_url() to parse URLs without faking a HTTP
171  *    request line for parse_http_request().
172  *
173  *    Revision 1.41  2001/11/13 00:14:07  jongfoster
174  *    Fixing stupid bug now I've figured out what || means.
175  *    (It always returns 0 or 1, not one of it's paramaters.)
176  *
177  *    Revision 1.40  2001/10/26 17:37:55  oes
178  *    - Re-enabled Netscape 200/404 bug workaround in block_url():
179  *      - Removed OS/2 special case
180  *      - Made block_url() independant from sed() having been run
181  *    - Made trust_url independant from sed() having been run
182  *    - Made is_imageurl independant from sed() having been run.
183  *      It now checks User-Agent: and Accept: by itself.
184  *
185  *
186  *    Revision 1.39  2001/10/25 03:40:48  david__schmidt
187  *    Change in porting tactics: OS/2's EMX porting layer doesn't allow multiple
188  *    threads to call select() simultaneously.  So, it's time to do a real, live,
189  *    native OS/2 port.  See defines for __EMX__ (the porting layer) vs. __OS2__
190  *    (native). Both versions will work, but using __OS2__ offers multi-threading.
191  *
192  *    Revision 1.38  2001/10/23 21:32:33  jongfoster
193  *    Adding error-checking to selected functions
194  *
195  *    Revision 1.37  2001/10/22 15:33:56  david__schmidt
196  *    Special-cased OS/2 out of the Netscape-abort-on-404-in-js problem in
197  *    filters.c.  Added a FIXME in front of the offending code.  I'll gladly
198  *    put in a better/more robust fix for all parties if one is presented...
199  *    It seems that just returning 200 instead of 404 would pretty much fix
200  *    it for everyone, but I don't know all the history of the problem.
201  *
202  *    Revision 1.36  2001/10/10 16:44:16  oes
203  *    Added match_portlist function
204  *
205  *    Revision 1.35  2001/10/07 15:41:23  oes
206  *    Replaced 6 boolean members of csp with one bitmap (csp->flags)
207  *
208  *    New function remove_chunked_transfer_coding that strips chunked
209  *      transfer coding to plain and is called by pcrs_filter_response
210  *      and gif_deanimate_response if neccessary
211  *
212  *    Improved handling of zero-change re_filter runs
213  *
214  *    pcrs_filter_response and gif_deanimate_response now remove
215  *      chunked transfer codeing before processing the body.
216  *
217  *    Revision 1.34  2001/09/20 15:49:36  steudten
218  *
219  *    Fix BUG: Change int size to size_t size in pcrs_filter_response().
220  *    See cgi.c fill_template().
221  *
222  *    Revision 1.33  2001/09/16 17:05:14  jongfoster
223  *    Removing unused #include showarg.h
224  *
225  *    Revision 1.32  2001/09/16 13:21:27  jongfoster
226  *    Changes to use new list functions.
227  *
228  *    Revision 1.31  2001/09/16 11:38:02  jongfoster
229  *    Splitting fill_template() into 2 functions:
230  *    template_load() loads the file
231  *    template_fill() performs the PCRS regexps.
232  *    This is because the CGI edit interface has a "table row"
233  *    template which is used many times in the page - this
234  *    change means it's only loaded from disk once.
235  *
236  *    Revision 1.30  2001/09/16 11:00:10  jongfoster
237  *    New function alloc_http_response, for symmetry with free_http_response
238  *
239  *    Revision 1.29  2001/09/13 23:32:40  jongfoster
240  *    Moving image data to cgi.c rather than cgi.h
241  *    Fixing a GPF under Win32 (and any other OS that protects global
242  *    constants from being written to).
243  *
244  *    Revision 1.28  2001/09/10 10:18:51  oes
245  *    Silenced compiler warnings
246  *
247  *    Revision 1.27  2001/08/05 16:06:20  jongfoster
248  *    Modifiying "struct map" so that there are now separate header and
249  *    "map_entry" structures.  This means that functions which modify a
250  *    map no longer need to return a pointer to the modified map.
251  *    Also, it no longer reverses the order of the entries (which may be
252  *    important with some advanced template substitutions).
253  *
254  *    Revision 1.26  2001/07/30 22:08:36  jongfoster
255  *    Tidying up #defines:
256  *    - All feature #defines are now of the form FEATURE_xxx
257  *    - Permanently turned off WIN_GUI_EDIT
258  *    - Permanently turned on WEBDAV and SPLIT_PROXY_ARGS
259  *
260  *    Revision 1.25  2001/07/26 10:09:46  oes
261  *    Made browser detection a little less naive
262  *
263  *    Revision 1.24  2001/07/25 17:22:51  oes
264  *    Added workaround for Netscape bug that prevents display of page when loading a component fails.
265  *
266  *    Revision 1.23  2001/07/23 13:40:12  oes
267  *    Fixed bug that caused document body to be dropped when pcrs joblist was empty.
268  *
269  *    Revision 1.22  2001/07/18 12:29:34  oes
270  *    - Made gif_deanimate_response respect
271  *      csp->action->string[ACTION_STRING_DEANIMATE]
272  *    - Logging cosmetics
273  *
274  *    Revision 1.21  2001/07/13 13:59:53  oes
275  *     - Introduced gif_deanimate_response which shares the
276  *       generic content modification interface of pcrs_filter_response
277  *       and acts as a wrapper to deanimate.c:gif_deanimate()
278  *     - Renamed re_process_buffer to pcrs_filter_response
279  *     - pcrs_filter_response now returns NULL on failiure
280  *     - Removed all #ifdef PCRS
281  *
282  *    Revision 1.20  2001/07/01 17:01:04  oes
283  *    Added comments and missing return statement in is_untrusted_url()
284  *
285  *    Revision 1.19  2001/06/29 21:45:41  oes
286  *    Indentation, CRLF->LF, Tab-> Space
287  *
288  *    Revision 1.18  2001/06/29 13:27:38  oes
289  *    - Cleaned up, renamed and reorderd functions
290  *      and improved comments
291  *
292  *    - block_url:
293  *      - Ported to CGI platform. Now delivers
294  *        http_response or NULL
295  *      - Unified HTML and GIF generation (moved image detection
296  *        and GIF generation here from jcc.c:chat())
297  *      - Fixed HTTP status to:
298  *       -  403 (Forbidden) for the "blocked" HTML message
299  *       -  200 (OK) for GIF answers
300  *       -  302 (Redirect) for redirect to GIF
301  *
302  *    - trust_url:
303  *      - Ported to CGI platform. Now delivers
304  *        http_response or NULL
305  *      - Separated detection of untrusted URL into
306  *        (bool)is_untrusted_url
307  *      - Added enforcement of untrusted requests
308  *
309  *    - Moved redirect_url() from cgi.c to here
310  *      and ported it to the CGI platform
311  *
312  *    - Removed logentry from cancelled commit
313  *
314  *    Revision 1.17  2001/06/09 10:55:28  jongfoster
315  *    Changing BUFSIZ ==> BUFFER_SIZE
316  *
317  *    Revision 1.16  2001/06/07 23:10:26  jongfoster
318  *    Allowing unanchored domain patterns to back off and retry
319  *    if they partially match.  Optimized right-anchored patterns.
320  *    Moving ACL and forward files into config file.
321  *    Replacing struct gateway with struct forward_spec
322  *
323  *    Revision 1.15  2001/06/03 19:12:00  oes
324  *    extracted-CGI relevant stuff
325  *
326  *    Revision 1.14  2001/06/01 10:30:55  oes
327  *    Added optional left-anchoring to domaincmp
328  *
329  *    Revision 1.13  2001/05/31 21:21:30  jongfoster
330  *    Permissionsfile / actions file changes:
331  *    - Changed "permission" to "action" throughout
332  *    - changes to file format to allow string parameters
333  *    - Moved helper functions to actions.c
334  *
335  *    Revision 1.12  2001/05/31 17:35:20  oes
336  *
337  *     - Enhanced domain part globbing with infix and prefix asterisk
338  *       matching and optional unanchored operation
339  *
340  *    Revision 1.11  2001/05/29 11:53:23  oes
341  *    "See why" link added to "blocked" page
342  *
343  *    Revision 1.10  2001/05/29 09:50:24  jongfoster
344  *    Unified blocklist/imagelist/permissionslist.
345  *    File format is still under discussion, but the internal changes
346  *    are (mostly) done.
347  *
348  *    Also modified interceptor behaviour:
349  *    - We now intercept all URLs beginning with one of the following
350  *      prefixes (and *only* these prefixes):
351  *        * http://i.j.b/
352  *        * http://ijbswa.sf.net/config/
353  *        * http://ijbswa.sourceforge.net/config/
354  *    - New interceptors "home page" - go to http://i.j.b/ to see it.
355  *    - Internal changes so that intercepted and fast redirect pages
356  *      are not replaced with an image.
357  *    - Interceptors now have the option to send a binary page direct
358  *      to the client. (i.e. ijb-send-banner uses this)
359  *    - Implemented show-url-info interceptor.  (Which is why I needed
360  *      the above interceptors changes - a typical URL is
361  *      "http://i.j.b/show-url-info?url=www.somesite.com/banner.gif".
362  *      The previous mechanism would not have intercepted that, and
363  *      if it had been intercepted then it then it would have replaced
364  *      it with an image.)
365  *
366  *    Revision 1.9  2001/05/27 22:17:04  oes
367  *
368  *    - re_process_buffer no longer writes the modified buffer
369  *      to the client, which was very ugly. It now returns the
370  *      buffer, which it is then written by chat.
371  *
372  *    - content_length now adjusts the Content-Length: header
373  *      for modified documents rather than crunch()ing it.
374  *      (Length info in csp->content_length, which is 0 for
375  *      unmodified documents)
376  *
377  *    - For this to work, sed() is called twice when filtering.
378  *
379  *    Revision 1.8  2001/05/26 17:13:28  jongfoster
380  *    Filled in a function comment.
381  *
382  *    Revision 1.7  2001/05/26 15:26:15  jongfoster
383  *    ACL feature now provides more security by immediately dropping
384  *    connections from untrusted hosts.
385  *
386  *    Revision 1.6  2001/05/26 00:28:36  jongfoster
387  *    Automatic reloading of config file.
388  *    Removed obsolete SIGHUP support (Unix) and Reload menu option (Win32).
389  *    Most of the global variables have been moved to a new
390  *    struct configuration_spec, accessed through csp->config->globalname
391  *    Most of the globals remaining are used by the Win32 GUI.
392  *
393  *    Revision 1.5  2001/05/25 22:34:30  jongfoster
394  *    Hard tabs->Spaces
395  *
396  *    Revision 1.4  2001/05/22 18:46:04  oes
397  *
398  *    - Enabled filtering banners by size rather than URL
399  *      by adding patterns that replace all standard banner
400  *      sizes with the "Junkbuster" gif to the re_filterfile
401  *
402  *    - Enabled filtering WebBugs by providing a pattern
403  *      which kills all 1x1 images
404  *
405  *    - Added support for PCRE_UNGREEDY behaviour to pcrs,
406  *      which is selected by the (nonstandard and therefore
407  *      capital) letter 'U' in the option string.
408  *      It causes the quantifiers to be ungreedy by default.
409  *      Appending a ? turns back to greedy (!).
410  *
411  *    - Added a new interceptor ijb-send-banner, which
412  *      sends back the "Junkbuster" gif. Without imagelist or
413  *      MSIE detection support, or if tinygif = 1, or the
414  *      URL isn't recognized as an imageurl, a lame HTML
415  *      explanation is sent instead.
416  *
417  *    - Added new feature, which permits blocking remote
418  *      script redirects and firing back a local redirect
419  *      to the browser.
420  *      The feature is conditionally compiled, i.e. it
421  *      can be disabled with --disable-fast-redirects,
422  *      plus it must be activated by a "fast-redirects"
423  *      line in the config file, has its own log level
424  *      and of course wants to be displayed by show-proxy-args
425  *      Note: Boy, all the #ifdefs in 1001 locations and
426  *      all the fumbling with configure.in and acconfig.h
427  *      were *way* more work than the feature itself :-(
428  *
429  *    - Because a generic redirect template was needed for
430  *      this, tinygif = 3 now uses the same.
431  *
432  *    - Moved GIFs, and other static HTTP response templates
433  *      to project.h
434  *
435  *    - Some minor fixes
436  *
437  *    - Removed some >400 CRs again (Jon, you really worked
438  *      a lot! ;-)
439  *
440  *    Revision 1.3  2001/05/20 16:44:47  jongfoster
441  *    Removing last hardcoded Junkbusters.com URLs.
442  *
443  *    Revision 1.2  2001/05/20 01:21:20  jongfoster
444  *    Version 2.9.4 checkin.
445  *    - Merged popupfile and cookiefile, and added control over PCRS
446  *      filtering, in new "permissionsfile".
447  *    - Implemented LOG_LEVEL_FATAL, so that if there is a configuration
448  *      file error you now get a message box (in the Win32 GUI) rather
449  *      than the program exiting with no explanation.
450  *    - Made killpopup use the PCRS MIME-type checking and HTTP-header
451  *      skipping.
452  *    - Removed tabs from "config"
453  *    - Moved duplicated url parsing code in "loaders.c" to a new funcition.
454  *    - Bumped up version number.
455  *
456  *    Revision 1.1.1.1  2001/05/15 13:58:52  oes
457  *    Initial import of version 2.9.3 source tree
458  *
459  *
460  *********************************************************************/
461 \f
462
463 #include "config.h"
464
465 #include <stdio.h>
466 #include <sys/types.h>
467 #include <stdlib.h>
468 #include <ctype.h>
469 #include <string.h>
470 #include <assert.h>
471
472 #ifndef _WIN32
473 #ifndef __OS2__
474 #include <unistd.h>
475 #endif /* ndef __OS2__ */
476 #include <netinet/in.h>
477 #else
478 #include <winsock2.h>
479 #endif /* ndef _WIN32 */
480
481 #ifdef __OS2__
482 #include <utils.h>
483 #endif /* def __OS2__ */
484
485 #include "project.h"
486 #include "filters.h"
487 #include "encode.h"
488 #include "parsers.h"
489 #include "ssplit.h"
490 #include "errlog.h"
491 #include "jbsockets.h"
492 #include "miscutil.h"
493 #include "actions.h"
494 #include "cgi.h"
495 #include "list.h"
496 #include "deanimate.h"
497 #include "urlmatch.h"
498
499 #ifdef _WIN32
500 #include "win32.h"
501 #endif
502
503 const char filters_h_rcs[] = FILTERS_H_VERSION;
504
505 /* Fix a problem with Solaris.  There should be no effect on other
506  * platforms.
507  * Solaris's isspace() is a macro which uses it's argument directly
508  * as an array index.  Therefore we need to make sure that high-bit
509  * characters generate +ve values, and ideally we also want to make
510  * the argument match the declared parameter type of "int".
511  */
512 #define ijb_isdigit(__X) isdigit((int)(unsigned char)(__X))
513
514
515 #ifdef FEATURE_ACL
516 /*********************************************************************
517  *
518  * Function    :  block_acl
519  *
520  * Description :  Block this request?
521  *                Decide yes or no based on ACL file.
522  *
523  * Parameters  :
524  *          1  :  dst = The proxy or gateway address this is going to.
525  *                      Or NULL to check all possible targets.
526  *          2  :  csp = Current client state (buffers, headers, etc...)
527  *                      Also includes the client IP address.
528  *
529  * Returns     : 0 = FALSE (don't block) and 1 = TRUE (do block)
530  *
531  *********************************************************************/
532 int block_acl(struct access_control_addr *dst, struct client_state *csp)
533 {
534    struct access_control_list *acl = csp->config->acl;
535
536    /* if not using an access control list, then permit the connection */
537    if (acl == NULL)
538    {
539       return(0);
540    }
541
542    /* search the list */
543    while (acl != NULL)
544    {
545       if ((csp->ip_addr_long & acl->src->mask) == acl->src->addr)
546       {
547          if (dst == NULL)
548          {
549             /* Just want to check if they have any access */
550             if (acl->action == ACL_PERMIT)
551             {
552                return(0);
553             }
554          }
555          else if ( ((dst->addr & acl->dst->mask) == acl->dst->addr)
556            && ((dst->port == acl->dst->port) || (acl->dst->port == 0)))
557          {
558             if (acl->action == ACL_PERMIT)
559             {
560                return(0);
561             }
562             else
563             {
564                return(1);
565             }
566          }
567       }
568       acl = acl->next;
569    }
570
571    return(1);
572
573 }
574
575
576 /*********************************************************************
577  *
578  * Function    :  acl_addr
579  *
580  * Description :  Called from `load_config' to parse an ACL address.
581  *
582  * Parameters  :
583  *          1  :  aspec = String specifying ACL address.
584  *          2  :  aca = struct access_control_addr to fill in.
585  *
586  * Returns     :  0 => Ok, everything else is an error.
587  *
588  *********************************************************************/
589 int acl_addr(char *aspec, struct access_control_addr *aca)
590 {
591    int i, masklength, port;
592    char *p;
593
594    masklength = 32;
595    port       =  0;
596
597    if ((p = strchr(aspec, '/')) != NULL)
598    {
599       *p++ = '\0';
600
601       if (ijb_isdigit(*p) == 0)
602       {
603          return(-1);
604       }
605       masklength = atoi(p);
606    }
607
608    if ((masklength < 0) || (masklength > 32))
609    {
610       return(-1);
611    }
612
613    if ((p = strchr(aspec, ':')) != NULL)
614    {
615       *p++ = '\0';
616
617       if (ijb_isdigit(*p) == 0)
618       {
619          return(-1);
620       }
621       port = atoi(p);
622    }
623
624    aca->port = port;
625
626    aca->addr = ntohl(resolve_hostname_to_ip(aspec));
627
628    if (aca->addr == INADDR_NONE)
629    {
630       return(-1);
631    }
632
633    /* build the netmask */
634    aca->mask = 0;
635    for (i=1; i <= masklength ; i++)
636    {
637       aca->mask |= (1 << (32 - i));
638    }
639
640    /* now mask off the host portion of the ip address
641     * (i.e. save on the network portion of the address).
642     */
643    aca->addr = aca->addr & aca->mask;
644
645    return(0);
646
647 }
648 #endif /* def FEATURE_ACL */
649
650
651 /*********************************************************************
652  *
653  * Function    :  match_portlist
654  *
655  * Description :  Check if a given number is covered by a comma
656  *                separated list of numbers and ranges (a,b-c,d,..)
657  *
658  * Parameters  :
659  *          1  :  portlist = String with list
660  *          2  :  port = port to check
661  *
662  * Returns     :  0 => no match
663  *                1 => match
664  *
665  *********************************************************************/
666 int match_portlist(const char *portlist, int port)
667 {
668    char *min, *max, *next, *portlist_copy;
669
670    min = next = portlist_copy = strdup(portlist);
671
672    /*
673     * Zero-terminate first item and remember offset for next
674     */
675    if (NULL != (next = strchr(portlist_copy, (int) ',')))
676    {
677       *next++ = '\0';
678    }
679
680    /*
681     * Loop through all items, checking for match
682     */
683    while(min)
684    {
685       if (NULL == (max = strchr(min, (int) '-')))
686       {
687          /*
688           * No dash, check for equality
689           */
690          if (port == atoi(min))
691          {
692             free(portlist_copy);
693             return(1);
694          }
695       }
696       else
697       {
698          /*
699           * This is a range, so check if between min and max,
700           * or, if max was omitted, between min and 65K
701           */
702          *max++ = '\0';
703          if(port >= atoi(min) && port <= (atoi(max) ? atoi(max) : 65535))
704          {
705             free(portlist_copy);
706             return(1);
707          }
708
709       }
710
711       /*
712        * Jump to next item
713        */
714       min = next;
715
716       /*
717        * Zero-terminate next item and remember offset for n+1
718        */
719       if ((NULL != next) && (NULL != (next = strchr(next, (int) ','))))
720       {
721          *next++ = '\0';
722       }
723    }
724
725    free(portlist_copy);
726    return 0;
727
728 }
729
730
731 /*********************************************************************
732  *
733  * Function    :  block_url
734  *
735  * Description :  Called from `chat'.  Check to see if we need to block this.
736  *
737  * Parameters  :
738  *          1  :  csp = Current client state (buffers, headers, etc...)
739  *
740  * Returns     :  NULL => unblocked, else HTTP block response
741  *
742  *********************************************************************/
743 struct http_response *block_url(struct client_state *csp)
744 {
745    struct http_response *rsp;
746    const char *new_content_type = NULL;
747
748    /*
749     * If it's not blocked, don't block it ;-)
750     */
751    if ((csp->action->flags & ACTION_BLOCK) == 0)
752    {
753       return NULL;
754    }
755    if (csp->action->flags & ACTION_REDIRECT)
756    {
757       log_error(LOG_LEVEL_ERROR, "redirect{} overruled by block.");     
758    }
759    /*
760     * Else, prepare a response
761     */
762    if (NULL == (rsp = alloc_http_response()))
763    {
764       return cgi_error_memory();
765    }
766
767    /*
768     * If it's an image-url, send back an image or redirect
769     * as specified by the relevant +image action
770     */
771 #ifdef FEATURE_IMAGE_BLOCKING
772    if (((csp->action->flags & ACTION_IMAGE_BLOCKER) != 0)
773         && is_imageurl(csp))
774    {
775       char *p;
776       /* determine HOW images should be blocked */
777       p = csp->action->string[ACTION_STRING_IMAGE_BLOCKER];
778
779       if(csp->action->flags & ACTION_HANDLE_AS_EMPTY_DOCUMENT)
780       {
781          log_error(LOG_LEVEL_ERROR, "handle-as-empty-document overruled by handle-as-image.");
782       }
783 #if 1 /* Two alternative strategies, use this one for now: */
784
785       /* and handle accordingly: */
786       if ((p == NULL) || (0 == strcmpic(p, "pattern")))
787       {
788          rsp->status = strdup("403 Request blocked by Privoxy");
789          if (rsp->status == NULL)
790          {
791             free_http_response(rsp);
792             return cgi_error_memory();
793          }
794          rsp->body = bindup(image_pattern_data, image_pattern_length);
795          if (rsp->body == NULL)
796          {
797             free_http_response(rsp);
798             return cgi_error_memory();
799          }
800          rsp->content_length = image_pattern_length;
801
802          if (enlist_unique_header(rsp->headers, "Content-Type", BUILTIN_IMAGE_MIMETYPE))
803          {
804             free_http_response(rsp);
805             return cgi_error_memory();
806          }
807       }
808
809       else if (0 == strcmpic(p, "blank"))
810       {
811          rsp->status = strdup("403 Request blocked by Privoxy");
812          if (rsp->status == NULL)
813          {
814             free_http_response(rsp);
815             return cgi_error_memory();
816          }
817          rsp->body = bindup(image_blank_data, image_blank_length);
818          if (rsp->body == NULL)
819          {
820             free_http_response(rsp);
821             return cgi_error_memory();
822          }
823          rsp->content_length = image_blank_length;
824
825          if (enlist_unique_header(rsp->headers, "Content-Type", BUILTIN_IMAGE_MIMETYPE))
826          {
827             free_http_response(rsp);
828             return cgi_error_memory();
829          }
830       }
831
832       else
833       {
834          rsp->status = strdup("302 Local Redirect from Privoxy");
835          if (rsp->status == NULL)
836          {
837             free_http_response(rsp);
838             return cgi_error_memory();
839          }
840
841          if (enlist_unique_header(rsp->headers, "Location", p))
842          {
843             free_http_response(rsp);
844             return cgi_error_memory();
845          }
846       }
847
848 #else /* Following code is disabled for now */
849
850       /* and handle accordingly: */
851       if ((p == NULL) || (0 == strcmpic(p, "pattern")))
852       {
853          p = CGI_PREFIX "send-banner?type=pattern";
854       }
855       else if (0 == strcmpic(p, "blank"))
856       {
857          p = CGI_PREFIX "send-banner?type=blank";
858       }
859       rsp->status = strdup("302 Local Redirect from Privoxy");
860       if (rsp->status == NULL)
861       {
862          free_http_response(rsp);
863          return cgi_error_memory();
864       }
865
866       if (enlist_unique_header(rsp->headers, "Location", p))
867       {
868          free_http_response(rsp);
869          return cgi_error_memory();
870       }
871 #endif /* Preceeding code is disabled for now */
872    }
873    else if(csp->action->flags & ACTION_HANDLE_AS_EMPTY_DOCUMENT)
874    {
875      /*
876       *  Send empty document.               
877       */
878       new_content_type = csp->action->string[ACTION_STRING_CONTENT_TYPE];
879
880       freez(rsp->body);
881       rsp->body = strdup(" ");
882       rsp->content_length = 1;
883
884       rsp->status = strdup("403 Request blocked by Privoxy");
885       if (rsp->status == NULL)
886       {
887          free_http_response(rsp);
888          return cgi_error_memory();
889       }
890       if (new_content_type != 0)
891       {
892          log_error(LOG_LEVEL_HEADER, "Overwriting Content-Type with %s", new_content_type);
893          if (enlist_unique_header(rsp->headers, "Content-Type", new_content_type))
894          {
895             free_http_response(rsp);
896             return cgi_error_memory();
897          }
898       }
899
900    }
901    else
902 #endif /* def FEATURE_IMAGE_BLOCKING */
903
904    /*
905     * Else, generate an HTML "blocked" message:
906     */
907    {
908       jb_err err;
909       struct map * exports;
910       char *p;
911
912       /*
913        * Workaround for stupid Netscape bug which prevents
914        * pages from being displayed if loading a referenced
915        * JavaScript or style sheet fails. So make it appear
916        * as if it succeeded.
917        */
918       if ( NULL != (p = get_header_value(csp->headers, "User-Agent:"))
919            && !strncmpic(p, "mozilla", 7) /* Catch Netscape but */
920            && !strstr(p, "Gecko")         /* save Mozilla, */
921            && !strstr(p, "compatible")    /* MSIE */
922            && !strstr(p, "Opera"))        /* and Opera. */
923       {
924          rsp->status = strdup("200 Request for blocked URL");
925       }
926       else
927       {
928          rsp->status = strdup("404 Request for blocked URL");
929       }
930
931       if (rsp->status == NULL)
932       {
933          free_http_response(rsp);
934          return cgi_error_memory();
935       }
936
937       exports = default_exports(csp, NULL);
938       if (exports == NULL)
939       {
940          free_http_response(rsp);
941          return cgi_error_memory();
942       }
943
944 #ifdef FEATURE_FORCE_LOAD
945       err = map(exports, "force-prefix", 1, FORCE_PREFIX, 1);
946       if (csp->http->ssl != 0)
947 #endif /* ndef FEATURE_FORCE_LOAD */
948       {
949          err = map_block_killer(exports, "force-support");
950       }
951
952       if (!err) err = map(exports, "protocol", 1, csp->http->ssl ? "https://" : "http://", 1);
953       if (!err) err = map(exports, "hostport", 1, html_encode(csp->http->hostport), 0);
954       if (!err) err = map(exports, "path", 1, html_encode(csp->http->path), 0);
955       if (!err) err = map(exports, "path-ue", 1, url_encode(csp->http->path), 0);
956
957       if (err)
958       {
959          free_map(exports);
960          free_http_response(rsp);
961          return cgi_error_memory();
962       }
963
964       err = template_fill_for_cgi(csp, "blocked", exports, rsp);
965       if (err)
966       {
967          free_http_response(rsp);
968          return cgi_error_memory();
969       }
970    }
971
972    return finish_http_response(rsp);
973
974 }
975
976
977 #ifdef FEATURE_TRUST
978 /*********************************************************************
979  *
980  * Function    :  trust_url FIXME: I should be called distrust_url
981  *
982  * Description :  Calls is_untrusted_url to determine if the URL is trusted
983  *                and if not, returns a HTTP 403 response with a reject message.
984  *
985  * Parameters  :
986  *          1  :  csp = Current client state (buffers, headers, etc...)
987  *
988  * Returns     :  NULL => trusted, else http_response.
989  *
990  *********************************************************************/
991 struct http_response *trust_url(struct client_state *csp)
992 {
993    struct http_response *rsp;
994    struct map * exports;
995    char buf[BUFFER_SIZE];
996    char *p;
997    struct url_spec **tl;
998    struct url_spec *t;
999    jb_err err;
1000
1001    /*
1002     * Don't bother to work on trusted URLs
1003     */
1004    if (!is_untrusted_url(csp))
1005    {
1006       return NULL;
1007    }
1008
1009    /*
1010     * Else, prepare a response:
1011     */
1012    if (NULL == (rsp = alloc_http_response()))
1013    {
1014       return cgi_error_memory();
1015    }
1016
1017    rsp->status = strdup("403 Request blocked by Privoxy");
1018    exports = default_exports(csp, NULL);
1019    if (exports == NULL || rsp->status == NULL)
1020    {
1021       free_http_response(rsp);
1022       return cgi_error_memory();
1023    }
1024
1025    /*
1026     * Export the protocol, host, port, and referrer information
1027     */
1028    err = map(exports, "hostport", 1, csp->http->hostport, 1);
1029    if (!err) err = map(exports, "protocol", 1, csp->http->ssl ? "https://" : "http://", 1); 
1030    if (!err) err = map(exports, "path", 1, csp->http->path, 1);
1031
1032    if (NULL != (p = get_header_value(csp->headers, "Referer:")))
1033    {
1034       if (!err) err = map(exports, "referrer", 1, html_encode(p), 0);
1035    }
1036    else
1037    {
1038       if (!err) err = map(exports, "referrer", 1, "none set", 1);
1039    }
1040
1041    if (err)
1042    {
1043       free_map(exports);
1044       free_http_response(rsp);
1045       return cgi_error_memory();
1046    }
1047
1048    /*
1049     * Export the trust list
1050     */
1051    p = strdup("");
1052    for (tl = csp->config->trust_list; (t = *tl) != NULL ; tl++)
1053    {
1054       sprintf(buf, "<li>%s</li>\n", t->spec);
1055       string_append(&p, buf);
1056    }
1057    err = map(exports, "trusted-referrers", 1, p, 0);
1058
1059    if (err)
1060    {
1061       free_map(exports);
1062       free_http_response(rsp);
1063       return cgi_error_memory();
1064    }
1065
1066    /*
1067     * Export the trust info, if available
1068     */
1069    if (csp->config->trust_info->first)
1070    {
1071       struct list_entry *l;
1072
1073       p = strdup("");
1074       for (l = csp->config->trust_info->first; l ; l = l->next)
1075       {
1076          sprintf(buf, "<li> <a href=\"%s\">%s</a><br>\n",l->str, l->str);
1077          string_append(&p, buf);
1078       }
1079       err = map(exports, "trust-info", 1, p, 0);
1080    }
1081    else
1082    {
1083       err = map_block_killer(exports, "have-trust-info");
1084    }
1085
1086    if (err)
1087    {
1088       free_map(exports);
1089       free_http_response(rsp);
1090       return cgi_error_memory();
1091    }
1092
1093    /*
1094     * Export the force prefix or the force conditional block killer
1095     */
1096 #ifdef FEATURE_FORCE_LOAD
1097    err = map(exports, "force-prefix", 1, FORCE_PREFIX, 1);
1098 #else /* ifndef FEATURE_FORCE_LOAD */
1099    err = map_block_killer(exports, "force-support");
1100 #endif /* ndef FEATURE_FORCE_LOAD */
1101
1102    if (err)
1103    {
1104       free_map(exports);
1105       free_http_response(rsp);
1106       return cgi_error_memory();
1107    }
1108
1109    /*
1110     * Build the response
1111     */
1112    err = template_fill_for_cgi(csp, "untrusted", exports, rsp);
1113    if (err)
1114    {
1115       free_http_response(rsp);
1116       return cgi_error_memory();
1117    }
1118
1119    return finish_http_response(rsp);
1120 }
1121 #endif /* def FEATURE_TRUST */
1122
1123
1124 #ifdef FEATURE_FAST_REDIRECTS
1125 /*********************************************************************
1126  *
1127  * Function    :  redirect_url
1128  *
1129  * Description :  Checks for redirection URLs and returns a HTTP redirect
1130  *                to the destination URL, if necessary
1131  *
1132  * Parameters  :
1133  *          1  :  csp = Current client state (buffers, headers, etc...)
1134  *
1135  * Returns     :  NULL if URL was clean, HTTP redirect otherwise.
1136  *
1137  *********************************************************************/
1138 struct http_response *redirect_url(struct client_state *csp)
1139 {
1140    char *p, *q;
1141    struct http_response *rsp;
1142    char *redirect_mode = NULL;
1143    int x, y;
1144
1145    if ((csp->action->flags & ACTION_REDIRECT))
1146    {
1147       q = csp->action->string[ACTION_STRING_REDIRECT];
1148    }
1149    else if ((csp->action->flags & ACTION_FAST_REDIRECTS))
1150    {
1151       redirect_mode = csp->action->string[ACTION_STRING_FAST_REDIRECTS];
1152       if (0 == strcmpic(redirect_mode, "check-decoded-url"))
1153       {  
1154          p = q = csp->http->path; 
1155          log_error(LOG_LEVEL_REDIRECTS, "Decoding path: %s if necessary.", p);
1156          while (*p)
1157          {
1158             if (*p == '%') /* Escape sequence? */
1159             {
1160                /* Yes, translate from hexadecimal to decimal */
1161                p++;
1162                /* First byte */
1163                x=((int)*p++)-48;
1164                if (x>9) x-=7;
1165                x<<=4;
1166                /* Second byte */
1167                y=((int)*p++)-48;
1168                if (y>9)y-=7;
1169                /* Merge */
1170                *q++=(char)(x|y);
1171             }
1172             else
1173             {
1174                /* No, forward character. */
1175                *q++=*p++;
1176             }
1177          }
1178          *q='\0';
1179       }
1180       p = q = csp->http->path;
1181       log_error(LOG_LEVEL_REDIRECTS, "Checking path for redirects: %s", p);
1182
1183       /*
1184        * find the last URL encoded in the request
1185        */
1186       while ((p = strstr(p, "http://")) != NULL)
1187       {
1188          q = p++;
1189       }
1190    }
1191    else
1192    {
1193       /* All redirection actions are disabled */
1194       return NULL;
1195    }
1196    /*
1197     * if there was any, generate and return a HTTP redirect
1198     */
1199    if (q != csp->http->path)
1200    {
1201       log_error(LOG_LEVEL_REDIRECTS, "redirecting to: %s", q);
1202
1203       if (NULL == (rsp = alloc_http_response()))
1204       {
1205          return cgi_error_memory();
1206       }
1207
1208       if ( enlist_unique_header(rsp->headers, "Location", q)
1209         || (NULL == (rsp->status = strdup("302 Local Redirect from Privoxy"))) )
1210       {
1211          free_http_response(rsp);
1212          return cgi_error_memory();
1213       }
1214
1215       return finish_http_response(rsp);
1216    }
1217    else
1218    {
1219       return NULL;
1220    }
1221
1222 }
1223 #endif /* def FEATURE_FAST_REDIRECTS */
1224
1225
1226 #ifdef FEATURE_IMAGE_BLOCKING
1227 /*********************************************************************
1228  *
1229  * Function    :  is_imageurl
1230  *
1231  * Description :  Given a URL, decide whether it is an image or not,
1232  *                using either the info from a previous +image action
1233  *                or, #ifdef FEATURE_IMAGE_DETECT_MSIE, and the browser
1234  *                is MSIE and not on a Mac, tell from the browser's accept
1235  *                header.
1236  *
1237  * Parameters  :
1238  *          1  :  csp = Current client state (buffers, headers, etc...)
1239  *
1240  * Returns     :  True (nonzero) if URL is an image, false (0)
1241  *                otherwise
1242  *
1243  *********************************************************************/
1244 int is_imageurl(struct client_state *csp)
1245 {
1246 #ifdef FEATURE_IMAGE_DETECT_MSIE
1247    char *tmp;
1248
1249    tmp = get_header_value(csp->headers, "User-Agent:");
1250    if (tmp && strstr(tmp, "MSIE") && !strstr(tmp, "Mac_"))
1251    {
1252       tmp = get_header_value(csp->headers, "Accept:");
1253       if (tmp && strstr(tmp, "image/gif"))
1254       {
1255          /* Client will accept HTML.  If this seems counterintuitive,
1256           * blame Microsoft.
1257           */
1258          return(0);
1259       }
1260       else
1261       {
1262          return(1);
1263       }
1264    }
1265 #endif /* def FEATURE_IMAGE_DETECT_MSIE */
1266
1267    return ((csp->action->flags & ACTION_IMAGE) != 0);
1268
1269 }
1270 #endif /* def FEATURE_IMAGE_BLOCKING */
1271
1272
1273 #ifdef FEATURE_TRUST
1274 /*********************************************************************
1275  *
1276  * Function    :  is_untrusted_url
1277  *
1278  * Description :  Should we "distrust" this URL (and block it)?
1279  *
1280  *                Yes if it matches a line in the trustfile, or if the
1281  *                    referrer matches a line starting with "+" in the
1282  *                    trustfile.
1283  *                No  otherwise.
1284  *
1285  * Parameters  :
1286  *          1  :  csp = Current client state (buffers, headers, etc...)
1287  *
1288  * Returns     :  0 => trusted, 1 => untrusted
1289  *
1290  *********************************************************************/
1291 int is_untrusted_url(struct client_state *csp)
1292 {
1293    struct file_list *fl;
1294    struct block_spec *b;
1295    struct url_spec **trusted_url;
1296    struct http_request rhttp[1];
1297    const char * referer;
1298    jb_err err;
1299
1300    /*
1301     * If we don't have a trustlist, we trust everybody
1302     */
1303    if (((fl = csp->tlist) == NULL) || ((b  = fl->f) == NULL))
1304    {
1305       return 0;
1306    }
1307
1308    memset(rhttp, '\0', sizeof(*rhttp));
1309
1310    /*
1311     * Do we trust the request URL itself?
1312     */
1313    for (b = b->next; b ; b = b->next)
1314    {
1315       if (url_match(b->url, csp->http))
1316       {
1317          return b->reject;
1318       }
1319    }
1320
1321    if (NULL == (referer = get_header_value(csp->headers, "Referer:")))
1322    {
1323       /* no referrer was supplied */
1324       return 1;
1325    }
1326
1327
1328    /*
1329     * If not, do we maybe trust its referrer?
1330     */
1331    err = parse_http_url(referer, rhttp, csp);
1332    if (err)
1333    {
1334       return 1;
1335    }
1336
1337    for (trusted_url = csp->config->trust_list; *trusted_url != NULL; trusted_url++)
1338    {
1339       if (url_match(*trusted_url, rhttp))
1340       {
1341          /* if the URL's referrer is from a trusted referrer, then
1342           * add the target spec to the trustfile as an unblocked
1343           * domain and return NULL (which means it's OK).
1344           */
1345
1346          FILE *fp;
1347
1348          if (NULL != (fp = fopen(csp->config->trustfile, "a")))
1349          {
1350             char * path;
1351             char * path_end;
1352             char * new_entry = strdup("~");
1353
1354             string_append(&new_entry, csp->http->hostport);
1355
1356             path = csp->http->path;
1357             if ( (path[0] == '/')
1358               && (path[1] == '~')
1359               && ((path_end = strchr(path + 2, '/')) != NULL))
1360             {
1361                /* since this path points into a user's home space
1362                 * be sure to include this spec in the trustfile.
1363                 */
1364                int path_len = path_end - path; /* save offset */
1365                path = strdup(path); /* Copy string */
1366                if (path != NULL)
1367                {
1368                   path_end = path + path_len; /* regenerate ptr to new buffer */
1369                   *(path_end + 1) = '\0'; /* Truncate path after '/' */
1370                }
1371                string_join(&new_entry, path);
1372             }
1373
1374             if (new_entry != NULL)
1375             {
1376                fprintf(fp, "%s\n", new_entry);
1377                free(new_entry);
1378             }
1379             else
1380             {
1381                /* FIXME: No way to handle out-of memory, so mostly ignoring it */
1382                log_error(LOG_LEVEL_ERROR, "Out of memory adding pattern to trust file");
1383             }
1384
1385             fclose(fp);
1386          }
1387          return 0;
1388       }
1389    }
1390    return 1;
1391 }
1392 #endif /* def FEATURE_TRUST */
1393
1394
1395 /*********************************************************************
1396  *
1397  * Function    :  pcrs_filter_response
1398  *
1399  * Description :  Execute all text substitutions from all applying
1400  *                +filter actions on the text buffer that's been accumulated
1401  *                in csp->iob->buf. If this changes the contents, set
1402  *                csp->content_length to the modified size and raise the
1403  *                CSP_FLAG_MODIFIED flag.
1404  *
1405  * Parameters  :
1406  *          1  :  csp = Current client state (buffers, headers, etc...)
1407  *
1408  * Returns     :  a pointer to the (newly allocated) modified buffer.
1409  *                or NULL if there were no hits or something went wrong
1410  *
1411  *********************************************************************/
1412 char *pcrs_filter_response(struct client_state *csp)
1413 {
1414    int hits=0;
1415    size_t size, prev_size;
1416
1417    char *old = csp->iob->cur, *new = NULL;
1418    pcrs_job *job;
1419
1420    struct file_list *fl;
1421    struct re_filterfile_spec *b;
1422    struct list_entry *filtername;
1423
1424    int i, found_filters = 0;
1425
1426    /* 
1427     * Sanity first
1428     */
1429    if (csp->iob->cur >= csp->iob->eod)
1430    {
1431       return(NULL);
1432    }
1433    size = csp->iob->eod - csp->iob->cur;
1434
1435    /*
1436     * Need to check the set of re_filterfiles...
1437     */
1438    for (i = 0; i < MAX_AF_FILES; i++)
1439    {
1440       fl = csp->rlist[i];
1441       if (NULL != fl)
1442       {
1443          if (NULL != fl->f)
1444          {
1445            found_filters = 1;
1446            break;
1447          }
1448       }
1449    }
1450
1451    if (0 == found_filters)
1452    {
1453       log_error(LOG_LEVEL_ERROR, "Unable to get current state of regexp filtering.");
1454          return(NULL);
1455    }
1456
1457    /*
1458     * If the body has a "chunked" transfer-encoding,
1459     * get rid of it first, adjusting size and iob->eod
1460     */
1461    if (csp->flags & CSP_FLAG_CHUNKED)
1462    {
1463       log_error(LOG_LEVEL_RE_FILTER, "Need to de-chunk first");
1464       if (0 == (size = remove_chunked_transfer_coding(csp->iob->cur, size)))
1465       {
1466          return(NULL);
1467       }
1468       csp->iob->eod = csp->iob->cur + size;
1469       csp->flags |= CSP_FLAG_MODIFIED;
1470    }
1471
1472    for (i = 0; i < MAX_AF_FILES; i++)
1473    {
1474      fl = csp->rlist[i];
1475      if ((NULL == fl) || (NULL == fl->f))
1476        break;
1477    /*
1478     * For all applying +filter actions, look if a filter by that
1479     * name exists and if yes, execute it's pcrs_joblist on the
1480     * buffer.
1481     */
1482    for (b = fl->f; b; b = b->next)
1483    {
1484       for (filtername = csp->action->multi[ACTION_MULTI_FILTER]->first;
1485            filtername ; filtername = filtername->next)
1486       {
1487          if (strcmp(b->name, filtername->str) == 0)
1488          {
1489             int current_hits = 0;
1490
1491             if ( NULL == b->joblist )
1492             {
1493                log_error(LOG_LEVEL_RE_FILTER, "Filter %s has empty joblist. Nothing to do.", b->name);
1494                continue;
1495             }
1496
1497             prev_size = size;
1498             /* Apply all jobs from the joblist */
1499             for (job = b->joblist; NULL != job; job = job->next)
1500             {
1501                current_hits += pcrs_execute(job, old, size, &new, &size);
1502                if (old != csp->iob->cur) free(old);
1503                old=new;
1504             }
1505
1506             log_error(LOG_LEVEL_RE_FILTER, "re_filtering %s%s (size %d) with filter %s produced %d hits (new size %d).",
1507                       csp->http->hostport, csp->http->path, prev_size, b->name, current_hits, size);
1508
1509             hits += current_hits;
1510          }
1511       }
1512    }
1513    }
1514
1515    /*
1516     * If there were no hits, destroy our copy and let
1517     * chat() use the original in csp->iob
1518     */
1519    if (!hits)
1520    {
1521       free(new);
1522       return(NULL);
1523    }
1524
1525    csp->flags |= CSP_FLAG_MODIFIED;
1526    csp->content_length = size;
1527    IOB_RESET(csp);
1528
1529    return(new);
1530
1531 }
1532
1533
1534 /*********************************************************************
1535  *
1536  * Function    :  gif_deanimate_response
1537  *
1538  * Description :  Deanimate the GIF image that has been accumulated in
1539  *                csp->iob->buf, set csp->content_length to the modified
1540  *                size and raise the CSP_FLAG_MODIFIED flag.
1541  *
1542  * Parameters  :
1543  *          1  :  csp = Current client state (buffers, headers, etc...)
1544  *
1545  * Returns     :  a pointer to the (newly allocated) modified buffer.
1546  *                or NULL in case something went wrong.
1547  *
1548  *********************************************************************/
1549 char *gif_deanimate_response(struct client_state *csp)
1550 {
1551    struct binbuffer *in, *out;
1552    char *p;
1553    size_t size = csp->iob->eod - csp->iob->cur;
1554
1555    /*
1556     * If the body has a "chunked" transfer-encoding,
1557     * get rid of it first, adjusting size and iob->eod
1558     */
1559    if (csp->flags & CSP_FLAG_CHUNKED)
1560    {
1561       log_error(LOG_LEVEL_DEANIMATE, "Need to de-chunk first");
1562       if (0 == (size = remove_chunked_transfer_coding(csp->iob->cur, size)))
1563       {
1564          return(NULL);
1565       }
1566       csp->iob->eod = csp->iob->cur + size;
1567       csp->flags |= CSP_FLAG_MODIFIED;
1568    }
1569
1570    if (  (NULL == (in =  (struct binbuffer *)zalloc(sizeof *in )))
1571       || (NULL == (out = (struct binbuffer *)zalloc(sizeof *out))) )
1572    {
1573       log_error(LOG_LEVEL_DEANIMATE, "failed! (no mem)");
1574       return NULL;
1575    }
1576
1577    in->buffer = csp->iob->cur;
1578    in->size = size;
1579
1580    if (gif_deanimate(in, out, strncmp("last", csp->action->string[ACTION_STRING_DEANIMATE], 4)))
1581    {
1582       log_error(LOG_LEVEL_DEANIMATE, "failed! (gif parsing)");
1583       free(in);
1584       buf_free(out);
1585       return(NULL);
1586    }
1587    else
1588    {
1589       if ((int)size == out->offset)
1590       {
1591          log_error(LOG_LEVEL_DEANIMATE, "GIF not changed.");
1592       }
1593       else
1594       {
1595          log_error(LOG_LEVEL_DEANIMATE, "Success! GIF shrunk from %d bytes to %d.", size, out->offset);
1596       }
1597       csp->content_length = out->offset;
1598       csp->flags |= CSP_FLAG_MODIFIED;
1599       p = out->buffer;
1600       free(in);
1601       free(out);
1602       return(p);
1603    }
1604
1605 }
1606
1607
1608 /*********************************************************************
1609  *
1610  * Function    :  jpeg_inspect_response
1611  *
1612  * Description :  
1613  *
1614  * Parameters  :
1615  *          1  :  csp = Current client state (buffers, headers, etc...)
1616  *
1617  * Returns     :  a pointer to the (newly allocated) modified buffer
1618  *                or NULL in case something went wrong.
1619  *
1620  *********************************************************************/
1621 char *jpeg_inspect_response(struct client_state *csp)
1622 {
1623    struct binbuffer *in = NULL, *out = NULL;
1624    char *p = NULL;
1625    size_t size = csp->iob->eod - csp->iob->cur;
1626
1627    /*
1628     * If the body has a "chunked" transfer-encoding,
1629     * get rid of it first, adjusting size and iob->eod
1630     */
1631    if (csp->flags & CSP_FLAG_CHUNKED)
1632    {
1633       log_error(LOG_LEVEL_DEANIMATE, "Need to de-chunk first");
1634       if (0 == (size = remove_chunked_transfer_coding(csp->iob->cur, size)))
1635       {
1636          return(NULL);
1637       }
1638       csp->iob->eod = csp->iob->cur + size;
1639       csp->flags |= CSP_FLAG_MODIFIED;
1640    }
1641
1642    if (NULL == (in =  (struct binbuffer *)zalloc(sizeof *in )))
1643    {
1644       log_error(LOG_LEVEL_DEANIMATE, "failed! (jpeg no mem 1)");
1645       return NULL;
1646    }
1647
1648    if (NULL == (out = (struct binbuffer *)zalloc(sizeof *out)))
1649    {
1650       log_error(LOG_LEVEL_DEANIMATE, "failed! (jpeg no mem 2)");
1651       return NULL;
1652    }
1653
1654    in->buffer = csp->iob->cur;
1655    in->size = size;
1656
1657    /*
1658     * Calling jpeg_inspect has the side-effect of creating and 
1659     * modifying the image buffer of "out" directly.
1660     */
1661    if (jpeg_inspect(in, out))
1662    {
1663       log_error(LOG_LEVEL_DEANIMATE, "failed! (jpeg parsing)");
1664       free(in);
1665       buf_free(out);
1666       return(NULL);
1667
1668    }
1669    else
1670    {
1671       csp->content_length = out->offset;
1672       csp->flags |= CSP_FLAG_MODIFIED;
1673       p = out->buffer;
1674       free(in);
1675       free(out);
1676       return(p);
1677    }
1678
1679 }
1680
1681
1682 /*********************************************************************
1683  *
1684  * Function    :  remove_chunked_transfer_coding
1685  *
1686  * Description :  In-situ remove the "chunked" transfer coding as defined
1687  *                in rfc2616 from a buffer.
1688  *
1689  * Parameters  :
1690  *          1  :  buffer = Pointer to the text buffer
1691  *          2  :  size = Number of bytes to be processed
1692  *
1693  * Returns     :  The new size, i.e. the number of bytes from buffer which
1694  *                are occupied by the stripped body, or 0 in case something
1695  *                went wrong
1696  *
1697  *********************************************************************/
1698 int remove_chunked_transfer_coding(char *buffer, const size_t size)
1699 {
1700    size_t newsize = 0;
1701    unsigned int chunksize = 0;
1702    char *from_p, *to_p;
1703
1704    assert(buffer);
1705    from_p = to_p = buffer;
1706
1707    if (sscanf(buffer, "%x", &chunksize) != 1)
1708    {
1709       log_error(LOG_LEVEL_ERROR, "Invalid first chunksize while stripping \"chunked\" transfer coding");
1710       return(0);
1711    }
1712
1713    while (chunksize > 0)
1714    {
1715       if (NULL == (from_p = strstr(from_p, "\r\n")))
1716       {
1717          log_error(LOG_LEVEL_ERROR, "Parse error while stripping \"chunked\" transfer coding");
1718          return(0);
1719       }
1720
1721       if ((newsize += chunksize) >= size)
1722       {
1723          log_error(LOG_LEVEL_ERROR, "Chunksize exceeds buffer in  \"chunked\" transfer coding");
1724          return(0);
1725       }
1726       from_p += 2;
1727
1728       memmove(to_p, from_p, (size_t) chunksize);
1729       to_p = buffer + newsize;
1730       from_p += chunksize + 2;
1731
1732       if (sscanf(from_p, "%x", &chunksize) != 1)
1733       {
1734          log_error(LOG_LEVEL_ERROR, "Parse error while stripping \"chunked\" transfer coding");
1735          return(0);
1736       }
1737    }
1738
1739    /* FIXME: Should this get its own loglevel? */
1740    log_error(LOG_LEVEL_RE_FILTER, "De-chunking successful. Shrunk from %d to %d\n", size, newsize);
1741    return(newsize);
1742
1743 }
1744
1745
1746 /*********************************************************************
1747  *
1748  * Function    :  url_actions
1749  *
1750  * Description :  Gets the actions for this URL.
1751  *
1752  * Parameters  :
1753  *          1  :  http = http_request request for blocked URLs
1754  *          2  :  csp = Current client state (buffers, headers, etc...)
1755  *
1756  * Returns     :  N/A
1757  *
1758  *********************************************************************/
1759 void url_actions(struct http_request *http,
1760                  struct client_state *csp)
1761 {
1762    struct file_list *fl;
1763    struct url_actions *b;
1764    int i;
1765
1766    init_current_action(csp->action);
1767
1768    for (i = 0; i < MAX_AF_FILES; i++)
1769    {
1770       if (((fl = csp->actions_list[i]) == NULL) || ((b = fl->f) == NULL))
1771       {
1772          return;
1773       }
1774
1775       apply_url_actions(csp->action, http, b);
1776    }
1777
1778    return;
1779 }
1780
1781
1782 /*********************************************************************
1783  *
1784  * Function    :  apply_url_actions
1785  *
1786  * Description :  Applies a list of URL actions.
1787  *
1788  * Parameters  :
1789  *          1  :  action = Destination.
1790  *          2  :  http = Current URL
1791  *          3  :  b = list of URL actions to apply
1792  *
1793  * Returns     :  N/A
1794  *
1795  *********************************************************************/
1796 void apply_url_actions(struct current_action_spec *action,
1797                        struct http_request *http,
1798                        struct url_actions *b)
1799 {
1800    if (b == NULL)
1801    {
1802       /* Should never happen */
1803       return;
1804    }
1805
1806    for (b = b->next; NULL != b; b = b->next)
1807    {
1808       if (url_match(b->url, http))
1809       {
1810          merge_current_action(action, b->action);
1811       }
1812    }
1813 }
1814
1815
1816 /*********************************************************************
1817  *
1818  * Function    :  forward_url
1819  *
1820  * Description :  Should we forward this to another proxy?
1821  *
1822  * Parameters  :
1823  *          1  :  http = http_request request for current URL
1824  *          2  :  csp = Current client state (buffers, headers, etc...)
1825  *
1826  * Returns     :  Pointer to forwarding information.
1827  *
1828  *********************************************************************/
1829 const struct forward_spec * forward_url(struct http_request *http,
1830                                         struct client_state *csp)
1831 {
1832    static const struct forward_spec fwd_default[1] = { FORWARD_SPEC_INITIALIZER };
1833    struct forward_spec *fwd = csp->config->forward;
1834
1835    if (fwd == NULL)
1836    {
1837       return fwd_default;
1838    }
1839
1840    while (fwd != NULL)
1841    {
1842       if (url_match(fwd->url, http))
1843       {
1844          return fwd;
1845       }
1846       fwd = fwd->next;
1847    }
1848
1849    return fwd_default;
1850 }
1851
1852
1853 /*********************************************************************
1854  *
1855  * Function    :  direct_response 
1856  *
1857  * Description :  Check if Max-Forwards == 0 for an OPTIONS or TRACE
1858  *                request and if so, return a HTTP 501 to the client.
1859  *
1860  *                FIXME: I have a stupid name and I should handle the
1861  *                requests properly. Still, what we do here is rfc-
1862  *                compliant, whereas ignoring or forwarding are not.
1863  *
1864  * Parameters  :  
1865  *          1  :  csp = Current client state (buffers, headers, etc...)
1866  *
1867  * Returns     :  http_response if , NULL if nonmatch or handler fail
1868  *
1869  *********************************************************************/
1870 struct http_response *direct_response(struct client_state *csp)
1871 {
1872    struct http_response *rsp;
1873    struct list_entry *p;
1874
1875    if ((0 == strcmpic(csp->http->gpc, "trace"))
1876       || (0 == strcmpic(csp->http->gpc, "options")))
1877    {
1878       for (p = csp->headers->first; (p != NULL) ; p = p->next)
1879       {
1880          if (!strncmp("Max-Forwards:", p->str, 13)
1881              && (*(p->str+13) != '\0') && (atoi(p->str+13) == 0))
1882          {
1883             /* FIXME: We could handle at least TRACE here,
1884                but that would require a verbatim copy of
1885                the request which we don't have anymore */
1886
1887             log_error(LOG_LEVEL_HEADER, "Found Max-Forwards:0 in OPTIONS or TRACE request -- Returning 501");
1888
1889             /* Get mem for response or fail*/
1890             if (NULL == (rsp = alloc_http_response()))
1891             {
1892                return cgi_error_memory();
1893             }
1894             
1895             if (NULL == (rsp->status = strdup("501 Not Implemented")))
1896             {
1897                free_http_response(rsp);
1898                return cgi_error_memory();
1899             }
1900
1901             rsp->is_static = 1;
1902             return(finish_http_response(rsp));
1903          }
1904       }
1905    }
1906    return NULL;
1907 }
1908
1909
1910 /*
1911   Local Variables:
1912   tab-width: 3
1913   end:
1914 */