Display warning if show-url-info CGI page
[privoxy.git] / jcc.c
1 const char jcc_rcs[] = "$Id: jcc.c,v 1.117 2006/12/31 17:56:37 fabiankeil Exp $";
2 /*********************************************************************
3  *
4  * File        :  $Source: /cvsroot/ijbswa/current/jcc.c,v $
5  *
6  * Purpose     :  Main file.  Contains main() method, main loop, and
7  *                the main connection-handling function.
8  *
9  * Copyright   :  Written by and Copyright (C) 2001 the SourceForge
10  *                Privoxy team. http://www.privoxy.org/
11  *
12  *                Based on the Internet Junkbuster originally written
13  *                by and Copyright (C) 1997 Anonymous Coders and
14  *                Junkbusters Corporation.  http://www.junkbusters.com
15  *
16  *                This program is free software; you can redistribute it
17  *                and/or modify it under the terms of the GNU General
18  *                Public License as published by the Free Software
19  *                Foundation; either version 2 of the License, or (at
20  *                your option) any later version.
21  *
22  *                This program is distributed in the hope that it will
23  *                be useful, but WITHOUT ANY WARRANTY; without even the
24  *                implied warranty of MERCHANTABILITY or FITNESS FOR A
25  *                PARTICULAR PURPOSE.  See the GNU General Public
26  *                License for more details.
27  *
28  *                The GNU General Public License should be included with
29  *                this file.  If not, you can view it at
30  *                http://www.gnu.org/copyleft/gpl.html
31  *                or write to the Free Software Foundation, Inc., 59
32  *                Temple Place - Suite 330, Boston, MA  02111-1307, USA.
33  *
34  * Revisions   :
35  *    $Log: jcc.c,v $
36  *    Revision 1.117  2006/12/31 17:56:37  fabiankeil
37  *    Added config option accept-intercepted-requests
38  *    and disabled it by default.
39  *
40  *    Revision 1.116  2006/12/29 19:08:22  fabiankeil
41  *    Reverted parts of my last commit
42  *    to keep error handling working.
43  *
44  *    Revision 1.115  2006/12/29 17:38:57  fabiankeil
45  *    Fixed gcc43 conversion warnings.
46  *
47  *    Revision 1.114  2006/12/27 18:52:02  fabiankeil
48  *    Fix -pedantic ISO C warning about converting
49  *    from function pointer to object pointer.
50  *
51  *    Revision 1.113  2006/12/26 17:38:50  fabiankeil
52  *    Silence compiler warning I introduced with my last commit.
53  *
54  *    Revision 1.112  2006/12/26 17:31:41  fabiankeil
55  *    Mutex protect rand() if POSIX threading
56  *    is used, warn the user if that's not possible
57  *    and stop using it on _WIN32 where it could
58  *    cause crashes.
59  *
60  *    Revision 1.111  2006/12/23 16:15:06  fabiankeil
61  *    Don't prevent core dumps by catching SIGABRT.
62  *    It's rude and makes debugging unreasonable painful.
63  *
64  *    Revision 1.110  2006/12/13 14:52:53  etresoft
65  *    Fix build failure on MacOS X. Global symbols can be either static or extern, but not both.
66  *
67  *    Revision 1.109  2006/12/06 19:41:40  fabiankeil
68  *    Privoxy is now able to run as intercepting
69  *    proxy in combination with any packet filter
70  *    that does the port redirection. The destination
71  *    is extracted from the "Host:" header which
72  *    should be available for nearly all requests.
73  *
74  *    Moved HTTP snipplets into jcc.c.
75  *    Added error message for gopher proxy requests.
76  *
77  *    Revision 1.108  2006/11/28 15:38:51  fabiankeil
78  *    Only unlink the pidfile if it's actually used.
79  *
80  *    Change order of interception checks to make
81  *    it possible to block or redirect requests for
82  *    the cgi pages.
83  *
84  *    Revision 1.107  2006/11/13 19:05:51  fabiankeil
85  *    Make pthread mutex locking more generic. Instead of
86  *    checking for OSX and OpenBSD, check for FEATURE_PTHREAD
87  *    and use mutex locking unless there is an _r function
88  *    available. Better safe than sorry.
89  *
90  *    Fixes "./configure --disable-pthread" and should result
91  *    in less threading-related problems on pthread-using platforms,
92  *    but it still doesn't fix BR#1122404.
93  *
94  *    Revision 1.106  2006/11/06 19:58:23  fabiankeil
95  *    Move pthread.h inclusion from jcc.c to jcc.h.
96  *    Fixes build on x86-freebsd1 (FreeBSD 5.4-RELEASE).
97  *
98  *    Revision 1.105  2006/11/06 14:26:02  fabiankeil
99  *    Don't exit after receiving the second SIGHUP on Solaris.
100  *
101  *    Fixes BR 1052235, but the same problem may exist on other
102  *    systems. Once 3.0.6 is out we should use sigset()
103  *    where available and see if it breaks anything.
104  *
105  *    Revision 1.104  2006/09/23 13:26:38  roro
106  *    Replace TABs by spaces in source code.
107  *
108  *    Revision 1.103  2006/09/21 12:54:43  fabiankeil
109  *    Fix +redirect{}. Didn't work with -fast-redirects.
110  *
111  *    Revision 1.102  2006/09/06 13:03:04  fabiankeil
112  *    Respond with 400 and a short text message
113  *    if the client tries to use Privoxy as FTP proxy.
114  *
115  *    Revision 1.101  2006/09/06 09:23:37  fabiankeil
116  *    Make number of retries in case of forwarded-connect problems
117  *    a config file option (forwarded-connect-retries) and use 0 as
118  *    default.
119  *
120  *    Revision 1.100  2006/09/03 19:42:59  fabiankeil
121  *    Set random(3) seed.
122  *
123  *    Revision 1.99  2006/09/02 15:36:42  fabiankeil
124  *    Follow the OpenBSD port's lead and protect the resolve
125  *    functions on OpenBSD as well.
126  *
127  *    Revision 1.98  2006/08/24 11:01:34  fabiankeil
128  *    --user fix. Only use the user as group if no group is specified.
129  *    Solves BR 1492612. Thanks to Spinor S. and David Laight.
130  *
131  *    Revision 1.97  2006/08/18 15:23:17  david__schmidt
132  *    Windows service (re-)integration
133  *
134  *    The new args are:
135  *
136  *    --install[:service_name]
137  *    --uninstall[:service_name]
138  *    --service
139  *
140  *    They work as follows:
141  *    --install will create a service for you and then terminate.
142  *    By default the service name will be "privoxy" (without the quotes).
143  *    However you can run multiple services if you wish, just by adding
144  *    a colon and then a name (no spaces).
145  *
146  *    --uninstall follows the exact same rules a --install.
147  *
148  *    --service is used when the program is executed by the service
149  *    control manager, and in normal circumstances would never be
150  *    used as a command line argument.
151  *
152  *    Revision 1.96  2006/08/15 20:12:36  david__schmidt
153  *    Windows service integration
154  *
155  *    Revision 1.95  2006/08/03 02:46:41  david__schmidt
156  *    Incorporate Fabian Keil's patch work:
157 http://www.fabiankeil.de/sourcecode/privoxy/
158  *
159  *    Revision 1.94  2006/07/18 14:48:46  david__schmidt
160  *    Reorganizing the repository: swapping out what was HEAD (the old 3.1 branch)
161  *    with what was really the latest development (the v_3_0_branch branch)
162  *
163  *    Revision 1.92.2.16  2005/04/03 20:10:50  david__schmidt
164  *    Thanks to Jindrich Makovicka for a race condition fix for the log
165  *    file.  The race condition remains for non-pthread implementations.
166  *    Reference patch #1175720.
167  *
168  *    Revision 1.92.2.15  2004/10/03 12:53:32  david__schmidt
169  *    Add the ability to check jpeg images for invalid
170  *    lengths of comment blocks.  Defensive strategy
171  *    against the exploit:
172  *       Microsoft Security Bulletin MS04-028
173  *       Buffer Overrun in JPEG Processing (GDI+) Could
174  *       Allow Code Execution (833987)
175  *    Enabled with +inspect-jpegs in actions files.
176  *
177  *    Revision 1.92.2.14  2003/12/12 12:52:53  oes
178  *    - Fixed usage info for non-unix platforms
179  *    - Fixed small cmdline parsing bug
180  *
181  *    Revision 1.92.2.13  2003/11/27 19:20:27  oes
182  *    Diagnostics: Now preserve the returncode of pthread_create
183  *    in errno. Closes BR #775721. Thanks to Geoffrey Hausheer.
184  *
185  *    Revision 1.92.2.12  2003/07/11 11:34:19  oes
186  *    No longer ignore SIGCHLD. Fixes bug #769381
187  *
188  *    Revision 1.92.2.11  2003/05/14 12:32:02  oes
189  *    Close jarfile on graceful exit, remove stray line
190  *
191  *    Revision 1.92.2.10  2003/05/08 15:13:46  oes
192  *    Cosmetics: Killed a warning, a typo and an allocation left at exit
193  *
194  *    Revision 1.92.2.9  2003/04/03 15:08:42  oes
195  *    No longer rely on non-POSIX.1 extensions of getcwd().
196  *    Fixes bug #711001
197  *
198  *    Revision 1.92.2.8  2003/03/31 13:12:32  oes
199  *    Replaced setenv() by posix-compliant putenv()
200  *    Thanks to Neil McCalden (nmcc AT users.sf.net).
201  *
202  *    Revision 1.92.2.7  2003/03/17 16:48:59  oes
203  *    Added chroot ability, thanks to patch by Sviatoslav Sviridov
204  *
205  *    Revision 1.92.2.6  2003/03/11 11:55:00  oes
206  *    Clean-up and extension of improvements for forked mode:
207  *     - Child's return code now consists of flags RC_FLAG_*
208  *     - Reporting toggle to parent now properly #ifdef'ed
209  *     - Children now report blocking to parent. This enables
210  *       statistics in forked mode
211  *
212  *    Revision 1.92.2.5  2003/03/10 23:45:32  oes
213  *    Fixed bug #700381: Non-Threaded version now capable of being toggled.
214  *    Children now report having been toggled through _exit(17), parents
215  *    watch for that code and toggle themselves if found.
216  *
217  *    Revision 1.92.2.4  2003/03/07 03:41:04  david__schmidt
218  *    Wrapping all *_r functions (the non-_r versions of them) with 
219  *    mutex semaphores for OSX.  Hopefully this will take care of all 
220  *    of those pesky crash reports.
221  *
222  *    Revision 1.92.2.3  2003/02/28 12:53:06  oes
223  *    Fixed two mostly harmless mem leaks
224  *
225  *    Revision 1.92.2.2  2002/11/20 14:37:47  oes
226  *    Fix: Head of global clients list now initialized to NULL
227  *
228  *    Revision 1.92.2.1  2002/09/25 14:52:24  oes
229  *    Added basic support for OPTIONS and TRACE HTTP methods:
230  *     - New interceptor direct_response() added in chat().
231  *     - sed() moved to earlier in the process, so that the
232  *       Host: header is evaluated before actions and forwarding
233  *       are decided on.
234  *
235  *    Revision 1.92  2002/05/08 16:00:46  oes
236  *    Chat's buffer handling:
237  *     - Fixed bug with unchecked out-of-mem conditions
238  *       while reading client request & server headers
239  *     - No longer predict if the buffer limit will be exceeded
240  *       in the next read -- check add_to_iob's new
241  *       return code. If buffer couldn't be extended
242  *       (policy or out-of-mem) while
243  *       - reading from client: abort
244  *       - reading server headers: send error page
245  *       - buffering server body for filter: flush,
246  *         and if that fails: send error page
247  *
248  *    Revision 1.91  2002/04/08 20:35:58  swa
249  *    fixed JB spelling
250  *
251  *    Revision 1.90  2002/04/02 14:57:28  oes
252  *    Made sending wafers independent of FEATURE_COOKIE_JAR
253  *
254  *    Revision 1.89  2002/03/31 17:18:59  jongfoster
255  *    Win32 only: Enabling STRICT to fix a VC++ compile warning.
256  *
257  *    Revision 1.88  2002/03/27 14:32:43  david__schmidt
258  *    More compiler warning message maintenance
259  *
260  *    Revision 1.87  2002/03/26 22:29:54  swa
261  *    we have a new homepage!
262  *
263  *    Revision 1.86  2002/03/25 17:04:55  david__schmidt
264  *    Workaround for closing the jarfile before load_config() comes around again
265  *
266  *    Revision 1.85  2002/03/24 15:23:33  jongfoster
267  *    Name changes
268  *
269  *    Revision 1.84  2002/03/24 13:25:43  swa
270  *    name change related issues
271  *
272  *    Revision 1.83  2002/03/16 23:54:06  jongfoster
273  *    Adding graceful termination feature, to help look for memory leaks.
274  *    If you enable this (which, by design, has to be done by hand
275  *    editing config.h) and then go to http://i.j.b/die, then the program
276  *    will exit cleanly after the *next* request.  It should free all the
277  *    memory that was used.
278  *
279  *    Revision 1.82  2002/03/13 00:27:05  jongfoster
280  *    Killing warnings
281  *
282  *    Revision 1.81  2002/03/12 01:42:50  oes
283  *    Introduced modular filters
284  *
285  *    Revision 1.80  2002/03/11 22:07:05  david__schmidt
286  *    OS/2 port maintenance:
287  *    - Fixed EMX build - it had decayed a little
288  *    - Fixed inexplicable crash during FD_ZERO - must be due to a bad macro.
289  *      substituted a memset for now.
290  *
291  *    Revision 1.79  2002/03/09 20:03:52  jongfoster
292  *    - Making various functions return int rather than size_t.
293  *      (Undoing a recent change).  Since size_t is unsigned on
294  *      Windows, functions like read_socket that return -1 on
295  *      error cannot return a size_t.
296  *
297  *      THIS WAS A MAJOR BUG - it caused frequent, unpredictable
298  *      crashes, and also frequently caused JB to jump to 100%
299  *      CPU and stay there.  (Because it thought it had just
300  *      read ((unsigned)-1) == 4Gb of data...)
301  *
302  *    - The signature of write_socket has changed, it now simply
303  *      returns success=0/failure=nonzero.
304  *
305  *    - Trying to get rid of a few warnings --with-debug on
306  *      Windows, I've introduced a new type "jb_socket".  This is
307  *      used for the socket file descriptors.  On Windows, this
308  *      is SOCKET (a typedef for unsigned).  Everywhere else, it's
309  *      an int.  The error value can't be -1 any more, so it's
310  *      now JB_INVALID_SOCKET (which is -1 on UNIX, and in
311  *      Windows it maps to the #define INVALID_SOCKET.)
312  *
313  *    - The signature of bind_port has changed.
314  *
315  *    Revision 1.78  2002/03/08 21:35:04  oes
316  *    Added optional group supplement to --user option. Will now use default group of user if no group given
317  *
318  *    Revision 1.77  2002/03/07 03:52:06  oes
319  *     - Fixed compiler warnings etc
320  *     - Improved handling of failed DNS lookups
321  *
322  *    Revision 1.76  2002/03/06 22:54:35  jongfoster
323  *    Automated function-comment nitpicking.
324  *
325  *    Revision 1.75  2002/03/06 10:02:19  oes
326  *    Fixed stupid bug when --user was not given
327  *
328  *    Revision 1.74  2002/03/06 00:49:31  jongfoster
329  *    Fixing warning on Windows
330  *    Making #ifdefs that refer to the same variable consistently
331  *    use #ifdef unix rather than mixing #ifdef unix & #ifndef OS2
332  *
333  *    Revision 1.73  2002/03/05 23:57:30  hal9
334  *    Stray character 's' on line 1618 was breaking build.
335  *
336  *    Revision 1.72  2002/03/05 21:33:45  david__schmidt
337  *    - Re-enable OS/2 building after new parms were added
338  *    - Fix false out of memory report when resolving CGI templates when no IP
339  *      address is available of failed attempt (a la no such domain)
340  *
341  *    Revision 1.71  2002/03/05 18:13:56  oes
342  *    Added --user option
343  *
344  *    Revision 1.70  2002/03/05 04:52:42  oes
345  *    Deleted non-errlog debugging code
346  *
347  *    Revision 1.69  2002/03/04 23:50:00  jongfoster
348  *    Splitting off bind_port() call into bind_port_helper(), with
349  *    improved logging.
350  *
351  *    Revision 1.68  2002/03/04 20:17:32  oes
352  *    Fixed usage info
353  *
354  *    Revision 1.67  2002/03/04 18:18:57  oes
355  *    - Removed _DEBUG mode
356  *    - Cleand up cmdline parsing
357  *    - Introduced --no-daemon, --pidfile options
358  *    - Cleaned up signal handling:
359  *      - Terminate cleanly on INT, TERM and ABRT
360  *      - Schedule logfile for re-opening on HUP
361  *      - Ignore CHLD and PIPE
362  *      - Leave the rest with their default handlers
363  *      - Uniform handler registration
364  *    - Added usage() function
365  *    - Played styleguide police
366  *
367  *    Revision 1.66  2002/03/03 15:06:55  oes
368  *    Re-enabled automatic config reloading
369  *
370  *    Revision 1.65  2002/03/03 14:49:11  oes
371  *    Fixed CLF logging: Now uses client's original HTTP request
372  *
373  *    Revision 1.64  2002/03/03 09:18:03  joergs
374  *    Made jumbjuster work on AmigaOS again.
375  *
376  *    Revision 1.63  2002/03/02 04:14:50  david__schmidt
377  *    Clean up a little CRLF unpleasantness that suddenly appeared
378  *
379  *    Revision 1.62  2002/02/20 23:17:23  jongfoster
380  *    Detecting some out-of memory conditions and exiting with a log message.
381  *
382  *    Revision 1.61  2002/01/17 21:01:52  jongfoster
383  *    Moving all our URL and URL pattern parsing code to urlmatch.c.
384  *
385  *    Revision 1.60  2001/12/30 14:07:32  steudten
386  *    - Add signal handling (unix)
387  *    - Add SIGHUP handler (unix)
388  *    - Add creation of pidfile (unix)
389  *    - Add action 'top' in rc file (RH)
390  *    - Add entry 'SIGNALS' to manpage
391  *    - Add exit message to logfile (unix)
392  *
393  *    Revision 1.59  2001/12/13 14:07:18  oes
394  *    Fixed Bug: 503 error page now sent OK
395  *
396  *    Revision 1.58  2001/11/30 23:37:24  jongfoster
397  *    Renaming the Win32 config file to config.txt - this is almost the
398  *    same as the corresponding UNIX name "config"
399  *
400  *    Revision 1.57  2001/11/16 00:47:43  jongfoster
401  *    Changing the tty-disconnection code to use setsid().
402  *
403  *    Revision 1.56  2001/11/13 20:20:54  jongfoster
404  *    Tabs->spaces, fixing a bug with missing {} around an if()
405  *
406  *    Revision 1.55  2001/11/13 20:14:53  jongfoster
407  *    Patch for FreeBSD setpgrp() as suggested by Alexander Lazic
408  *
409  *    Revision 1.54  2001/11/07 00:03:14  steudten
410  *    Give reliable return value if an error
411  *    occurs not just 0 with new daemon mode.
412  *
413  *    Revision 1.53  2001/11/05 21:41:43  steudten
414  *    Add changes to be a real daemon just for unix os.
415  *    (change cwd to /, detach from controlling tty, set
416  *    process group and session leader to the own process.
417  *    Add DBG() Macro.
418  *    Add some fatal-error log message for failed malloc().
419  *    Add '-d' if compiled with 'configure --with-debug' to
420  *    enable debug output.
421  *
422  *    Revision 1.52  2001/10/26 20:11:20  jongfoster
423  *    Fixing type mismatch
424  *
425  *    Revision 1.51  2001/10/26 17:38:28  oes
426  *    Cosmetics
427  *
428  *    Revision 1.50  2001/10/25 03:40:48  david__schmidt
429  *    Change in porting tactics: OS/2's EMX porting layer doesn't allow multiple
430  *    threads to call select() simultaneously.  So, it's time to do a real, live,
431  *    native OS/2 port.  See defines for __EMX__ (the porting layer) vs. __OS2__
432  *    (native). Both versions will work, but using __OS2__ offers multi-threading.
433  *
434  *    Revision 1.49  2001/10/23 21:41:35  jongfoster
435  *    Added call to initialize the (statically-allocated of course)
436  *    "out of memory" CGI response.
437  *
438  *    Revision 1.48  2001/10/10 19:56:46  jongfoster
439  *    Moving some code that wasn't cookie-related out of an #ifdef
440  *    FEATURE_COOKIE_JAR
441  *
442  *    Revision 1.47  2001/10/10 16:44:36  oes
443  *    Added CONNECT destination port limitation check
444  *
445  *    Revision 1.46  2001/10/08 15:17:41  oes
446  *    Re-enabled SSL forwarding
447  *
448  *    Revision 1.45  2001/10/07 15:42:11  oes
449  *    Replaced 6 boolean members of csp with one bitmap (csp->flags)
450  *
451  *    Moved downgrading of the HTTP version from parse_http_request to
452  *      chat(), since we can't decide if it is necessary before we have
453  *      determined the actions for the URL. The HTTP command is now
454  *      *always* re-built so the repairs need no longer be special-cased.
455  *
456  *    filter_popups now gets a csp pointer so it can raise the new
457  *      CSP_FLAG_MODIFIED flag.
458  *
459  *    Bugfix
460  *
461  *    Added configurable size limit for the IOB. If the IOB grows so
462  *      large that the next read would exceed the limit, the header
463  *      is generated, and the header & unfiltered buffer are flushed
464  *      to the client. Chat then continues in non-buffering,
465  *      non-filtering body mode.
466  *
467  *    Revision 1.44  2001/10/02 18:13:57  oes
468  *    Ooops
469  *
470  *    Revision 1.43  2001/10/02 15:32:13  oes
471  *    Moved generation of hdr
472  *
473  *    Revision 1.42  2001/09/21 23:02:02  david__schmidt
474  *    Cleaning up 2 compiler warnings on OS/2.
475  *
476  *    Revision 1.41  2001/09/16 17:05:14  jongfoster
477  *    Removing unused #include showarg.h
478  *
479  *    Revision 1.40  2001/09/16 15:41:45  jongfoster
480  *    Fixing signed/unsigned comparison warning.
481  *
482  *    Revision 1.39  2001/09/16 13:21:27  jongfoster
483  *    Changes to use new list functions.
484  *
485  *    Revision 1.38  2001/09/16 13:01:46  jongfoster
486  *    Removing redundant function call that zeroed zalloc()'d memory.
487  *
488  *    Revision 1.37  2001/09/10 11:12:24  oes
489  *    Deleted unused variable
490  *
491  *    Revision 1.36  2001/09/10 10:56:15  oes
492  *    Silenced compiler warnings
493  *
494  *    Revision 1.35  2001/07/31 14:44:22  oes
495  *    Deleted unused size parameter from filter_popups()
496  *
497  *    Revision 1.34  2001/07/30 22:08:36  jongfoster
498  *    Tidying up #defines:
499  *    - All feature #defines are now of the form FEATURE_xxx
500  *    - Permanently turned off WIN_GUI_EDIT
501  *    - Permanently turned on WEBDAV and SPLIT_PROXY_ARGS
502  *
503  *    Revision 1.33  2001/07/29 19:32:00  jongfoster
504  *    Renaming _main() [mingw32 only] to real_main(), for ANSI compliance.
505  *
506  *    Revision 1.32  2001/07/29 18:47:05  jongfoster
507  *    Adding missing #include "loadcfg.h"
508  *
509  *    Revision 1.31  2001/07/29 12:17:48  oes
510  *    Applied pthread fix by Paul Lieverse
511  *
512  *    Revision 1.30  2001/07/25 22:57:13  jongfoster
513  *    __BEOS__ no longer overrides FEATURE_PTHREAD.
514  *    This is because FEATURE_PTHREAD will soon be widely used, so I
515  *    want to keep it simple.
516  *
517  *    Revision 1.29  2001/07/24 12:47:06  oes
518  *    Applied BeOS support update by Eugenia
519  *
520  *    Revision 1.28  2001/07/23 13:26:12  oes
521  *    Fixed bug in popup-killing for the first read that caused binary garbage to be sent between headers and body
522  *
523  *    Revision 1.27  2001/07/19 19:09:47  haroon
524  *    - Added code to take care of the situation where while processing the first
525  *      server response (which includes the server header), after finding the end
526  *      of the headers we were not looking past the end of the headers for
527  *      content modification. I enabled it for filter_popups.
528  *      Someone else should look to see if other similar operations should be
529  *      done to the discarded portion of the buffer.
530  *
531  *      Note 2001/07/20: No, the other content modification mechanisms will process
532  *                       the whole iob later anyway. --oes
533  *
534  *    Revision 1.26  2001/07/18 12:31:36  oes
535  *    cosmetics
536  *
537  *    Revision 1.25  2001/07/15 19:43:49  jongfoster
538  *    Supports POSIX threads.
539  *    Also removed some unused #includes.
540  *
541  *    Revision 1.24  2001/07/13 14:00:40  oes
542  *     - Generic content modification scheme:
543  *       Each feature has its own applicability flag that is set
544  *       from csp->action->flags.
545  *       Replaced the "filtering" int flag , by a function pointer
546  *       "content_filter" to the function that will do the content
547  *       modification. If it is != NULL, the document will be buffered
548  *       and processed through *content_filter, which must set
549  *       csp->content_length and return a modified copy of the body
550  *       or return NULL (on failiure).
551  *     - Changed csp->is_text to the more generic bitmap csp->content_type
552  *       which can currently take the valued CT_TEXT or CT_GIF
553  *     - Reformatting etc
554  *     - Removed all #ifdef PCRS
555  *
556  *    Revision 1.23  2001/07/02 02:28:25  iwanttokeepanon
557  *    Added "#ifdef ACL_FILES" conditional compilation to line 1291 to exclude
558  *    the `block_acl' call.  This prevents a compilation error when the user
559  *    does not wish to use the "ACL" feature.
560  *
561  *    Revision 1.22  2001/06/29 21:45:41  oes
562  *    Indentation, CRLF->LF, Tab-> Space
563  *
564  *    Revision 1.21  2001/06/29 13:29:36  oes
565  *    - Cleaned up, improved comments
566  *    - Unified all possible interceptors (CGI,
567  *      block, trust, fast_redirect) in one
568  *      place, with one (CGI) answer generation
569  *      mechansim. Much clearer now.
570  *    - Removed the GIF image generation, which
571  *      is now done in filters.c:block_url()
572  *    - Made error conditions like domain lookup
573  *      failiure or (various) problems while talking
574  *      to the server use cgi.c:error_response()
575  *      instead of generating HTML/HTTP in chat() (yuck!)
576  *    - Removed logentry from cancelled commit
577  *
578  *    Revision 1.20  2001/06/09 10:55:28  jongfoster
579  *    Changing BUFSIZ ==> BUFFER_SIZE
580  *
581  *    Revision 1.19  2001/06/07 23:12:52  jongfoster
582  *    Replacing function pointer in struct gateway with a directly
583  *    called function forwarded_connect().
584  *    Replacing struct gateway with struct forward_spec
585  *
586  *    Revision 1.18  2001/06/03 19:12:16  oes
587  *    introduced new cgi handling
588  *
589  *    Revision 1.17  2001/06/01 20:07:23  jongfoster
590  *    Now uses action +image-blocker{} rather than config->tinygif
591  *
592  *    Revision 1.16  2001/06/01 18:49:17  jongfoster
593  *    Replaced "list_share" with "list" - the tiny memory gain was not
594  *    worth the extra complexity.
595  *
596  *    Revision 1.15  2001/05/31 21:24:47  jongfoster
597  *    Changed "permission" to "action" throughout.
598  *    Removed DEFAULT_USER_AGENT - it must now be specified manually.
599  *    Moved vanilla wafer check into chat(), since we must now
600  *    decide whether or not to add it based on the URL.
601  *
602  *    Revision 1.14  2001/05/29 20:14:01  joergs
603  *    AmigaOS bugfix: PCRS needs a lot of stack, stacksize for child threads
604  *    increased.
605  *
606  *    Revision 1.13  2001/05/29 09:50:24  jongfoster
607  *    Unified blocklist/imagelist/permissionslist.
608  *    File format is still under discussion, but the internal changes
609  *    are (mostly) done.
610  *
611  *    Also modified interceptor behaviour:
612  *    - We now intercept all URLs beginning with one of the following
613  *      prefixes (and *only* these prefixes):
614  *        * http://i.j.b/
615  *        * http://ijbswa.sf.net/config/
616  *        * http://ijbswa.sourceforge.net/config/
617  *    - New interceptors "home page" - go to http://i.j.b/ to see it.
618  *    - Internal changes so that intercepted and fast redirect pages
619  *      are not replaced with an image.
620  *    - Interceptors now have the option to send a binary page direct
621  *      to the client. (i.e. ijb-send-banner uses this)
622  *    - Implemented show-url-info interceptor.  (Which is why I needed
623  *      the above interceptors changes - a typical URL is
624  *      "http://i.j.b/show-url-info?url=www.somesite.com/banner.gif".
625  *      The previous mechanism would not have intercepted that, and
626  *      if it had been intercepted then it then it would have replaced
627  *      it with an image.)
628  *
629  *    Revision 1.12  2001/05/27 22:17:04  oes
630  *
631  *    - re_process_buffer no longer writes the modified buffer
632  *      to the client, which was very ugly. It now returns the
633  *      buffer, which it is then written by chat.
634  *
635  *    - content_length now adjusts the Content-Length: header
636  *      for modified documents rather than crunch()ing it.
637  *      (Length info in csp->content_length, which is 0 for
638  *      unmodified documents)
639  *
640  *    - For this to work, sed() is called twice when filtering.
641  *
642  *    Revision 1.11  2001/05/26 17:27:53  jongfoster
643  *    Added support for CLF and fixed LOG_LEVEL_LOG.
644  *    Also did CRLF->LF fix of my previous patch.
645  *
646  *    Revision 1.10  2001/05/26 15:26:15  jongfoster
647  *    ACL feature now provides more security by immediately dropping
648  *    connections from untrusted hosts.
649  *
650  *    Revision 1.9  2001/05/26 00:28:36  jongfoster
651  *    Automatic reloading of config file.
652  *    Removed obsolete SIGHUP support (Unix) and Reload menu option (Win32).
653  *    Most of the global variables have been moved to a new
654  *    struct configuration_spec, accessed through csp->config->globalname
655  *    Most of the globals remaining are used by the Win32 GUI.
656  *
657  *    Revision 1.8  2001/05/25 22:43:18  jongfoster
658  *    Fixing minor memory leak and buffer overflow.
659  *
660  *    Revision 1.7  2001/05/25 22:34:30  jongfoster
661  *    Hard tabs->Spaces
662  *
663  *    Revision 1.6  2001/05/23 00:13:58  joergs
664  *    AmigaOS support fixed.
665  *
666  *    Revision 1.5  2001/05/22 18:46:04  oes
667  *
668  *    - Enabled filtering banners by size rather than URL
669  *      by adding patterns that replace all standard banner
670  *      sizes with the "Junkbuster" gif to the re_filterfile
671  *
672  *    - Enabled filtering WebBugs by providing a pattern
673  *      which kills all 1x1 images
674  *
675  *    - Added support for PCRE_UNGREEDY behaviour to pcrs,
676  *      which is selected by the (nonstandard and therefore
677  *      capital) letter 'U' in the option string.
678  *      It causes the quantifiers to be ungreedy by default.
679  *      Appending a ? turns back to greedy (!).
680  *
681  *    - Added a new interceptor ijb-send-banner, which
682  *      sends back the "Junkbuster" gif. Without imagelist or
683  *      MSIE detection support, or if tinygif = 1, or the
684  *      URL isn't recognized as an imageurl, a lame HTML
685  *      explanation is sent instead.
686  *
687  *    - Added new feature, which permits blocking remote
688  *      script redirects and firing back a local redirect
689  *      to the browser.
690  *      The feature is conditionally compiled, i.e. it
691  *      can be disabled with --disable-fast-redirects,
692  *      plus it must be activated by a "fast-redirects"
693  *      line in the config file, has its own log level
694  *      and of course wants to be displayed by show-proxy-args
695  *      Note: Boy, all the #ifdefs in 1001 locations and
696  *      all the fumbling with configure.in and acconfig.h
697  *      were *way* more work than the feature itself :-(
698  *
699  *    - Because a generic redirect template was needed for
700  *      this, tinygif = 3 now uses the same.
701  *
702  *    - Moved GIFs, and other static HTTP response templates
703  *      to project.h
704  *
705  *    - Some minor fixes
706  *
707  *    - Removed some >400 CRs again (Jon, you really worked
708  *      a lot! ;-)
709  *
710  *    Revision 1.4  2001/05/21 19:34:01  jongfoster
711  *    Made failure to bind() a fatal error.
712  *
713  *    Revision 1.3  2001/05/20 01:21:20  jongfoster
714  *    Version 2.9.4 checkin.
715  *    - Merged popupfile and cookiefile, and added control over PCRS
716  *      filtering, in new "permissionsfile".
717  *    - Implemented LOG_LEVEL_FATAL, so that if there is a configuration
718  *      file error you now get a message box (in the Win32 GUI) rather
719  *      than the program exiting with no explanation.
720  *    - Made killpopup use the PCRS MIME-type checking and HTTP-header
721  *      skipping.
722  *    - Removed tabs from "config"
723  *    - Moved duplicated url parsing code in "loaders.c" to a new funcition.
724  *    - Bumped up version number.
725  *
726  *    Revision 1.2  2001/05/17 22:34:44  oes
727  *     - Added hint on GIF char array generation to jcc.c
728  *     - Cleaned CRLF's from the sources and related files
729  *     - Repaired logging for REF and FRC
730  *
731  *    Revision 1.1.1.1  2001/05/15 13:58:56  oes
732  *    Initial import of version 2.9.3 source tree
733  *
734  *
735  *********************************************************************/
736 \f
737
738 #include "config.h"
739
740 #include <stdio.h>
741 #include <sys/types.h>
742 #include <stdlib.h>
743 #include <string.h>
744 #include <signal.h>
745 #include <fcntl.h>
746 #include <errno.h>
747
748 #ifdef _WIN32
749 # ifndef FEATURE_PTHREAD
750 #  ifndef STRICT
751 #   define STRICT
752 #  endif
753 #  include <windows.h>
754 #  include <process.h>
755 # endif /* ndef FEATURE_PTHREAD */
756
757 # include "win32.h"
758 # ifndef _WIN_CONSOLE
759 #  include "w32log.h"
760 # endif /* ndef _WIN_CONSOLE */
761 # include "w32svrapi.h"
762
763 #else /* ifndef _WIN32 */
764
765 # if !defined (__OS2__)
766 # include <unistd.h>
767 # include <sys/wait.h>
768 # endif /* ndef __OS2__ */
769 # include <sys/time.h>
770 # include <sys/stat.h>
771 # include <sys/ioctl.h>
772
773 #ifdef sun
774 #include <sys/termios.h>
775 #endif /* sun */
776
777 #ifdef unix
778 #include <pwd.h>
779 #include <grp.h>
780 #endif
781
782 # include <signal.h>
783
784 # ifdef __BEOS__
785 #  include <socket.h>  /* BeOS has select() for sockets only. */
786 #  include <OS.h>      /* declarations for threads and stuff. */
787 # endif
788
789 # if defined(__EMX__) || defined(__OS2__)
790 #  include <sys/select.h>  /* OS/2/EMX needs a little help with select */
791 # endif
792 # ifdef __OS2__
793 #define INCL_DOS
794 # include <os2.h>
795 #define bzero(B,N) memset(B,0x00,n)
796 # endif
797
798 # ifndef FD_ZERO
799 #  include <select.h>
800 # endif
801
802 #endif
803
804 #include "project.h"
805 #include "list.h"
806 #include "jcc.h"
807 #include "filters.h"
808 #include "loaders.h"
809 #include "parsers.h"
810 #include "killpopup.h"
811 #include "miscutil.h"
812 #include "errlog.h"
813 #include "jbsockets.h"
814 #include "gateway.h"
815 #include "actions.h"
816 #include "cgi.h"
817 #include "loadcfg.h"
818 #include "urlmatch.h"
819
820 const char jcc_h_rcs[] = JCC_H_VERSION;
821 const char project_h_rcs[] = PROJECT_H_VERSION;
822
823 int no_daemon = 0;
824 struct client_state  clients[1];
825 struct file_list     files[1];
826
827 #ifdef FEATURE_STATISTICS
828 int urls_read     = 0;     /* total nr of urls read inc rejected */
829 int urls_rejected = 0;     /* total nr of urls rejected */
830 #endif /* def FEATURE_STATISTICS */
831
832 #ifdef FEATURE_GRACEFUL_TERMINATION
833 int g_terminate = 0;
834 #endif
835
836 static void listen_loop(void);
837 static void chat(struct client_state *csp);
838 #ifdef AMIGA
839 void serve(struct client_state *csp);
840 #else /* ifndef AMIGA */
841 static void serve(struct client_state *csp);
842 #endif /* def AMIGA */
843
844 #ifdef __BEOS__
845 static int32 server_thread(void *data);
846 #endif /* def __BEOS__ */
847
848 #ifdef _WIN32
849 #define sleep(N)  Sleep(((N) * 1000))
850 #endif
851
852 #ifdef __OS2__
853 #define sleep(N)  DosSleep(((N) * 100))
854 #endif
855
856 #ifdef FEATURE_PTHREAD
857 pthread_mutex_t log_mutex;
858 pthread_mutex_t log_init_mutex;
859
860 #ifndef HAVE_GMTIME_R
861 pthread_mutex_t gmtime_mutex;
862 #endif /* ndef HAVE_GMTIME_R */
863
864 #ifndef HAVE_LOCALTIME_R
865 pthread_mutex_t localtime_mutex;
866 #endif /* ndef HAVE_GMTIME_R */
867
868 #ifndef HAVE_GETHOSTBYADDR_R
869 pthread_mutex_t gethostbyaddr_mutex;
870 #endif /* ndef HAVE_GETHOSTBYADDR_R */
871
872 #ifndef HAVE_GETHOSTBYNAME_R
873 pthread_mutex_t gethostbyname_mutex;
874 #endif /* ndef HAVE_GETHOSTBYNAME_R */
875
876 #ifndef HAVE_RANDOM
877 pthread_mutex_t rand_mutex;
878 #endif /* ndef HAVE_RANDOM */
879
880 #endif /* FEATURE_PTHREAD */
881
882 #if defined(unix) || defined(__EMX__)
883 const char *basedir = NULL;
884 const char *pidfile = NULL;
885 int received_hup_signal = 0;
886 #endif /* defined unix */
887
888 /* The vanilla wafer. */
889 static const char VANILLA_WAFER[] =
890    "NOTICE=TO_WHOM_IT_MAY_CONCERN_"
891    "Do_not_send_me_any_copyrighted_information_other_than_the_"
892    "document_that_I_am_requesting_or_any_of_its_necessary_components._"
893    "In_particular_do_not_send_me_any_cookies_that_"
894    "are_subject_to_a_claim_of_copyright_by_anybody._"
895    "Take_notice_that_I_refuse_to_be_bound_by_any_license_condition_"
896    "(copyright_or_otherwise)_applying_to_any_cookie._";
897
898 /* HTTP snipplets. */
899 const char CSUCCEED[] =
900    "HTTP/1.0 200 Connection established\n"
901    "Proxy-Agent: Privoxy/" VERSION "\r\n\r\n";
902
903 const char CHEADER[] =
904    "HTTP/1.0 400 Invalid header received from browser\r\n"
905    "Connection: close\r\n\r\n"
906    "Invalid header received from browser.";
907
908 const char CFORBIDDEN[] =
909    "HTTP/1.0 403 Connection not allowable\r\n"
910    "X-Hint: If you read this message interactively, then you know why this happens ,-)\r\n"
911    "Connection: close\r\n\r\n";
912
913 const char FTP_RESPONSE[] =
914    "HTTP/1.0 400 Invalid request received from browser\r\n"
915    "Connection: close\r\n\r\n"
916    "Invalid request. Privoxy doesn't support FTP.\r\n";
917
918 const char GOPHER_RESPONSE[] =
919    "HTTP/1.0 400 Invalid request received from browser\r\n"
920    "Connection: close\r\n\r\n"
921    "Invalid request. Privoxy doesn't support gopher.\r\n";
922
923 const char MISSING_DESTINATION_RESPONSE[] =
924    "HTTP/1.0 400 Bad request received from browser\r\n"
925    "Connection: close\r\n\r\n"
926    "Bad request. Privoxy was unable to extract the destination.\r\n";
927
928
929 #if !defined(_WIN32) && !defined(__OS2__) && !defined(AMIGA)
930 /*********************************************************************
931  *
932  * Function    :  sig_handler 
933  *
934  * Description :  Signal handler for different signals.
935  *                Exit gracefully on TERM and INT
936  *                or set a flag that will cause the errlog
937  *                to be reopened by the main thread on HUP.
938  *
939  * Parameters  :
940  *          1  :  the_signal = the signal cause this function to call
941  *
942  * Returns     :  - 
943  *
944  *********************************************************************/
945 static void sig_handler(int the_signal)
946 {
947    switch(the_signal)
948    {
949       case SIGTERM:
950       case SIGINT:
951          log_error(LOG_LEVEL_INFO, "exiting by signal %d .. bye", the_signal);
952 #if defined(unix)
953          if(pidfile)
954          {
955             unlink(pidfile);
956          }
957 #endif /* unix */
958          exit(the_signal);
959          break;
960
961       case SIGHUP:
962          received_hup_signal = 1;
963          break;         
964
965       default:
966          /* 
967           * We shouldn't be here, unless we catch signals
968           * in main() that we can't handle here!
969           */
970          log_error(LOG_LEVEL_FATAL, "sig_handler: exiting on unexpected signal %d", the_signal);
971    }
972    return;
973
974 }
975 #endif
976
977
978 /*********************************************************************
979  *
980  * Function    :  chat
981  *
982  * Description :  Once a connection to the client has been accepted,
983  *                this function is called (via serve()) to handle the
984  *                main business of the communication.  When this
985  *                function returns, the caller must close the client
986  *                socket handle.
987  *
988  * Parameters  :
989  *          1  :  csp = Current client state (buffers, headers, etc...)
990  *
991  * Returns     :  On success, the number of bytes written are returned (zero
992  *                indicates nothing was written).  On error, -1 is returned,
993  *                and errno is set appropriately.  If count is zero and the
994  *                file descriptor refers to a regular file, 0 will be
995  *                returned without causing any other effect.  For a special
996  *                file, the results are not portable.
997  *
998  *********************************************************************/
999 static void chat(struct client_state *csp)
1000 {
1001 /*
1002  * This next lines are a little ugly, but they simplifies the if statements
1003  * below.  Basically if TOGGLE, then we want the if to test if the
1004  * CSP_FLAG_TOGGLED_ON flag ist set, else we don't.  And if FEATURE_FORCE_LOAD,
1005  * then we want the if to test for CSP_FLAG_FORCED , else we don't
1006  */
1007 #ifdef FEATURE_TOGGLE
1008 #   define IS_TOGGLED_ON_AND (csp->flags & CSP_FLAG_TOGGLED_ON) &&
1009 #else /* ifndef FEATURE_TOGGLE */
1010 #   define IS_TOGGLED_ON_AND
1011 #endif /* ndef FEATURE_TOGGLE */
1012 #ifdef FEATURE_FORCE_LOAD
1013 #   define IS_NOT_FORCED_AND !(csp->flags & CSP_FLAG_FORCED) &&
1014 #else /* ifndef FEATURE_FORCE_LOAD */
1015 #   define IS_NOT_FORCED_AND
1016 #endif /* def FEATURE_FORCE_LOAD */
1017
1018 #define IS_ENABLED_AND   IS_TOGGLED_ON_AND IS_NOT_FORCED_AND
1019
1020    char buf[BUFFER_SIZE];
1021    char *hdr;
1022    char *p;
1023    char *req;
1024    fd_set rfds;
1025    int n;
1026    jb_socket maxfd;
1027    int server_body;
1028    int ms_iis5_hack = 0;
1029    size_t byte_count = 0;
1030    int forwarded_connect_retries = 0;
1031    int max_forwarded_connect_retries = csp->config->forwarded_connect_retries;
1032    const struct forward_spec * fwd;
1033    struct http_request *http;
1034    int len; /* for buffer sizes (and negative error codes) */
1035 #ifdef FEATURE_KILL_POPUPS
1036    int block_popups;         /* bool, 1==will block popups */
1037    int block_popups_now = 0; /* bool, 1==currently blocking popups */
1038 #endif /* def FEATURE_KILL_POPUPS */
1039
1040    int pcrs_filter;        /* bool, 1==will filter through pcrs */
1041    int gif_deanimate;      /* bool, 1==will deanimate gifs */
1042    int jpeg_inspect;       /* bool, 1==will inspect jpegs */
1043
1044    /* Function that does the content filtering for the current request */
1045    char *(*content_filter)() = NULL;
1046
1047    /* Skeleton for HTTP response, if we should intercept the request */
1048    struct http_response *rsp;
1049
1050    /* Temporary copy of the client's headers before they get enlisted in csp->headers */
1051    struct list header_list;
1052    struct list *headers = &header_list;
1053
1054    http = csp->http;
1055
1056    /*
1057     * Read the client's request.  Note that since we're not using select() we
1058     * could get blocked here if a client connected, then didn't say anything!
1059     */
1060
1061    for (;;)
1062    {
1063       len = read_socket(csp->cfd, buf, sizeof(buf));
1064
1065       if (len <= 0) break;      /* error! */
1066       
1067       /*
1068        * If there is no memory left for buffering the
1069        * request, there is nothing we can do but hang up
1070        */
1071       if (add_to_iob(csp, buf, len))
1072       {
1073          return;
1074       }
1075
1076       req = get_header(csp);
1077
1078       if (req == NULL)
1079       {
1080          break;    /* no HTTP request! */
1081       }
1082
1083       if (*req == '\0')
1084       {
1085          continue;   /* more to come! */
1086       }
1087
1088       /*
1089        * If it's a FTP or gopher request, we don't support it.
1090        *
1091        * These checks are better than nothing, but they might
1092        * not work in all configurations and some clients might
1093        * have problems digesting the answer.
1094        *
1095        * They should, however, never cause more problems than
1096        * Privoxy's old behaviour (returning the misleading HTML error message:
1097        * "Could not resolve http://(ftp|gopher)://example.org").
1098        */
1099       if (!strncmpic(req, "GET ftp://", 10) || !strncmpic(req, "GET gopher://", 13))
1100       {
1101          if (!strncmpic(req, "GET ftp://", 10))
1102          {
1103             strcpy(buf, FTP_RESPONSE);
1104             log_error(LOG_LEVEL_ERROR, "%s tried to use Privoxy as FTP proxy: %s",
1105                csp->ip_addr_str, req);
1106          }
1107          else
1108          {
1109             strcpy(buf, GOPHER_RESPONSE);
1110             log_error(LOG_LEVEL_ERROR, "%s tried to use Privoxy as gopher proxy: %s",
1111                csp->ip_addr_str, req);
1112          }
1113          log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 400 0", csp->ip_addr_str, req);
1114          freez(req);
1115          write_socket(csp->cfd, buf, strlen(buf));
1116          free_http_request(http);
1117          return;
1118       }
1119
1120 #ifdef FEATURE_FORCE_LOAD
1121       /* If this request contains the FORCE_PREFIX,
1122        * better get rid of it now and set the force flag --oes
1123        */
1124
1125       if (strstr(req, FORCE_PREFIX))
1126       {
1127          strclean(req, FORCE_PREFIX);
1128          log_error(LOG_LEVEL_FORCE, "Enforcing request \"%s\".\n", req);
1129          csp->flags |= CSP_FLAG_FORCED;
1130       }
1131
1132 #endif /* def FEATURE_FORCE_LOAD */
1133
1134       switch( parse_http_request(req, http, csp) )
1135       {
1136          case JB_ERR_MEMORY:
1137            log_error(LOG_LEVEL_ERROR, "Out of memory while parsing request.");
1138            break;
1139          case JB_ERR_PARSE:
1140            log_error(LOG_LEVEL_ERROR, "Couldn't parse request: %s.", req);
1141            break;
1142       }
1143
1144       freez(req);
1145       break;
1146    }
1147
1148    if (http->cmd == NULL)
1149    {
1150       strcpy(buf, CHEADER);
1151       write_socket(csp->cfd, buf, strlen(buf));
1152
1153       log_error(LOG_LEVEL_CLF, "%s - - [%T] \" \" 400 0", csp->ip_addr_str);
1154
1155       free_http_request(http);
1156       return;
1157    }
1158
1159    /* grab the rest of the client's headers */
1160    init_list(headers);
1161    for (;;)
1162    {
1163       if ( ( ( p = get_header(csp) ) != NULL) && ( *p == '\0' ) )
1164       {
1165          len = read_socket(csp->cfd, buf, sizeof(buf));
1166          if (len <= 0)
1167          {
1168             log_error(LOG_LEVEL_ERROR, "read from client failed: %E");
1169             return;
1170          }
1171          
1172          /*
1173           * If there is no memory left for buffering the
1174           * request, there is nothing we can do but hang up
1175           */
1176          if (add_to_iob(csp, buf, len))
1177          {
1178             return;
1179          }
1180          continue;
1181       }
1182
1183       if (p == NULL) break;
1184
1185       enlist(headers, p);
1186       freez(p);
1187
1188    }
1189
1190    if (http->host == NULL)
1191    {
1192       /*
1193        * Intercepted or invalid request without domain 
1194        * inside the request line. Try to get it another way,
1195        * unless accept-intercepted-requests is disabled.
1196        */
1197       if (!(csp->config->feature_flags & RUNTIME_FEATURE_ACCEPT_INTERCEPTED_REQUESTS))
1198       {
1199          log_error(LOG_LEVEL_ERROR, "%s's request: \'%s\' is invalid."
1200             " Privoxy isn't configured to accept intercepted requests.",
1201             csp->ip_addr_str, http->cmd);
1202          log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 400 0", csp->ip_addr_str, http->cmd);
1203
1204          strcpy(buf, CHEADER);
1205          write_socket(csp->cfd, buf, strlen(buf));
1206          free_http_request(http);
1207          destroy_list(headers);
1208          return;
1209       }
1210       else if (JB_ERR_OK == get_destination_from_headers(headers, http))
1211       {
1212          /* Split the domain we just got for pattern matching */
1213          init_domain_components(http);
1214       }
1215       else
1216       {
1217          /* We can't work without destination. Go spread the news.*/
1218
1219          req = list_to_text(headers);
1220          chomp(req);
1221          log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 400 0", csp->ip_addr_str, http->cmd);
1222          log_error(LOG_LEVEL_ERROR,
1223            "Privoxy was unable to get the destination for %s's request:\n%s\n%s",
1224             csp->ip_addr_str, http->cmd, req);
1225          freez(req);
1226
1227          strcpy(buf, MISSING_DESTINATION_RESPONSE);
1228          write_socket(csp->cfd, buf, strlen(buf));
1229          free_http_request(http);
1230          destroy_list(headers);
1231          return;
1232       }
1233       /*
1234        * TODO: If available, use PF's ioctl DIOCNATLOOK as last resort
1235        * to get the destination IP address, use it as host directly
1236        * or do a reverse DNS lookup first.
1237        */
1238    }
1239
1240    /* decide how to route the HTTP request */
1241
1242    if ((fwd = forward_url(http, csp)) == NULL)
1243    {
1244       log_error(LOG_LEVEL_FATAL, "gateway spec is NULL!?!?  This can't happen!");
1245       /* Never get here - LOG_LEVEL_FATAL causes program exit */
1246    }
1247
1248    /* build the http request to send to the server
1249     * we have to do one of the following:
1250     *
1251     * create = use the original HTTP request to create a new
1252     *          HTTP request that has either the path component
1253     *          without the http://domainspec (w/path) or the
1254     *          full orininal URL (w/url)
1255     *          Note that the path and/or the HTTP version may
1256     *          have been altered by now.
1257     *
1258     * connect = Open a socket to the host:port of the server
1259     *           and short-circuit server and client socket.
1260     *
1261     * pass =  Pass the request unchanged if forwarding a CONNECT
1262     *         request to a parent proxy. Note that we'll be sending
1263     *         the CFAIL message ourselves if connecting to the parent
1264     *         fails, but we won't send a CSUCCEED message if it works,
1265     *         since that would result in a double message (ours and the
1266     *         parent's). After sending the request to the parent, we simply
1267     *         tunnel.
1268     *
1269     * here's the matrix:
1270     *                        SSL
1271     *                    0        1
1272     *                +--------+--------+
1273     *                |        |        |
1274     *             0  | create | connect|
1275     *                | w/path |        |
1276     *  Forwarding    +--------+--------+
1277     *                |        |        |
1278     *             1  | create | pass   |
1279     *                | w/url  |        |
1280     *                +--------+--------+
1281     *
1282     */
1283
1284    /*
1285     * Determine the actions for this URL
1286     */
1287 #ifdef FEATURE_TOGGLE
1288    if (!(csp->flags & CSP_FLAG_TOGGLED_ON))
1289    {
1290       /* Most compatible set of actions (i.e. none) */
1291       init_current_action(csp->action);
1292    }
1293    else
1294 #endif /* ndef FEATURE_TOGGLE */
1295    {
1296       url_actions(http, csp);
1297    }
1298
1299
1300    /*
1301     * Check if a CONNECT request is allowable:
1302     * In the absence of a +limit-connect action, allow only port 443.
1303     * If there is an action, allow whatever matches the specificaton.
1304     */
1305    if(http->ssl)
1306    {
1307       if(  ( !(csp->action->flags & ACTION_LIMIT_CONNECT) && csp->http->port != 443)
1308            || (csp->action->flags & ACTION_LIMIT_CONNECT
1309               && !match_portlist(csp->action->string[ACTION_STRING_LIMIT_CONNECT], csp->http->port)) )
1310       {
1311          if (csp->action->flags & ACTION_TREAT_FORBIDDEN_CONNECTS_LIKE_BLOCKS)
1312          {
1313             /* The response will violate the specs, but makes unblocking easier. */
1314             log_error(LOG_LEVEL_ERROR, "Marking suspicious CONNECT request from %s for blocking.",
1315                csp->ip_addr_str);
1316             csp->action->flags |= ACTION_BLOCK;
1317             http->ssl = 0;
1318          }
1319          else
1320          {
1321             strcpy(buf, CFORBIDDEN);
1322             write_socket(csp->cfd, buf, strlen(buf));
1323             log_error(LOG_LEVEL_CONNECT, "Denying suspicious CONNECT request from %s", csp->ip_addr_str);
1324             log_error(LOG_LEVEL_CLF, "%s - - [%T] \" \" 403 0", csp->ip_addr_str);
1325             return;
1326          }
1327       }
1328    }
1329
1330
1331    /*
1332     * Downgrade http version from 1.1 to 1.0 if +downgrade
1333     * action applies
1334     */
1335    if ( (http->ssl == 0)
1336      && (!strcmpic(http->ver, "HTTP/1.1"))
1337      && (csp->action->flags & ACTION_DOWNGRADE))
1338    {
1339       freez(http->ver);
1340       http->ver = strdup("HTTP/1.0");
1341
1342       if (http->ver == NULL)
1343       {
1344          log_error(LOG_LEVEL_FATAL, "Out of memory downgrading HTTP version");
1345       }
1346    }
1347
1348    /* 
1349     * Save a copy of the original request for logging
1350     */
1351    http->ocmd = strdup(http->cmd);
1352
1353    if (http->ocmd == NULL)
1354    {
1355       log_error(LOG_LEVEL_FATAL, "Out of memory copying HTTP request line");
1356    }
1357
1358    /*
1359     * (Re)build the HTTP request for non-SSL requests.
1360     * If forwarding, use the whole URL, else, use only the path.
1361     */
1362    if (http->ssl == 0)
1363    {
1364       freez(http->cmd);
1365
1366       http->cmd = strdup(http->gpc);
1367       string_append(&http->cmd, " ");
1368
1369       if (fwd->forward_host)
1370       {
1371          string_append(&http->cmd, http->url);
1372       }
1373       else
1374       {
1375          string_append(&http->cmd, http->path);
1376       }
1377       string_append(&http->cmd, " ");
1378       string_append(&http->cmd, http->ver);
1379
1380       if (http->cmd == NULL)
1381       {
1382          log_error(LOG_LEVEL_FATAL, "Out of memory writing HTTP command");
1383       }
1384       log_error(LOG_LEVEL_HEADER, "New HTTP Request-Line: %s", http->cmd);
1385    }
1386    enlist(csp->headers, http->cmd);
1387
1388    /* Append the previously read headers */
1389    list_append_list_unique(csp->headers, headers);
1390    destroy_list(headers);
1391
1392    /*
1393     * If the user has not supplied any wafers, and the user has not
1394     * told us to suppress the vanilla wafer, then send the vanilla wafer.
1395     */
1396    if (list_is_empty(csp->action->multi[ACTION_MULTI_WAFER])
1397        && ((csp->action->flags & ACTION_VANILLA_WAFER) != 0))
1398    {
1399       enlist(csp->action->multi[ACTION_MULTI_WAFER], VANILLA_WAFER);
1400    }
1401
1402
1403 #ifdef FEATURE_KILL_POPUPS
1404    block_popups               = ((csp->action->flags & ACTION_NO_POPUPS) != 0);
1405 #endif /* def FEATURE_KILL_POPUPS */
1406
1407    pcrs_filter                = (csp->rlist != NULL) &&  /* There are expressions to be used */
1408                                 (!list_is_empty(csp->action->multi[ACTION_MULTI_FILTER]));
1409
1410    gif_deanimate              = ((csp->action->flags & ACTION_DEANIMATE) != 0);
1411
1412    jpeg_inspect               = ((csp->action->flags & ACTION_JPEG_INSPECT) != 0);
1413
1414    /*
1415     * We have a request. Now, check to see if we need to
1416     * intercept it, i.e. If ..
1417     */
1418
1419    if (
1420        /* We may not forward the request by rfc2616 sect 14.31 */
1421        (NULL != (rsp = direct_response(csp)))
1422
1423        /* or we are enabled and... */
1424        || (IS_ENABLED_AND (
1425
1426             /* ..the request was blocked */
1427           ( NULL != (rsp = block_url(csp)))
1428
1429           /* ..or untrusted */
1430 #ifdef FEATURE_TRUST
1431           || ( NULL != (rsp = trust_url(csp)))
1432 #endif /* def FEATURE_TRUST */
1433
1434           /* ..or a redirect kicked in */
1435           || ( NULL != (rsp = redirect_url(csp)))
1436           ))
1437
1438        /*
1439         * .. or a CGI call was detected and answered.
1440         *
1441         * This check comes last to give the user the power
1442         * to deny acces to some (or all) of the cgi pages.
1443         */
1444        || (NULL != (rsp = dispatch_cgi(csp)))
1445
1446                  )
1447    {
1448       /* Write the answer to the client */
1449       if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1450        || write_socket(csp->cfd, rsp->body, rsp->content_length))
1451       {
1452          log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1453       }
1454
1455 #ifdef FEATURE_STATISTICS
1456       /* Count as a rejected request */
1457       csp->flags |= CSP_FLAG_REJECTED;
1458 #endif /* def FEATURE_STATISTICS */
1459
1460       /* Log (FIXME: All intercept reasons appear as "crunch" with Status 200) */
1461       log_error(LOG_LEVEL_GPC, "%s%s crunch!", http->hostport, http->path);
1462       log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 200 3", csp->ip_addr_str, http->ocmd);
1463
1464       /* Clean up and return */
1465       free_http_response(rsp);
1466       return;
1467    }
1468
1469    hdr = sed(client_patterns, add_client_headers, csp);
1470    if (hdr == NULL)
1471    {
1472       /* FIXME Should handle error properly */
1473       log_error(LOG_LEVEL_FATAL, "Out of memory parsing client header");
1474    }
1475
1476    list_remove_all(csp->headers);
1477
1478    log_error(LOG_LEVEL_GPC, "%s%s", http->hostport, http->path);
1479
1480    if (fwd->forward_host)
1481    {
1482       log_error(LOG_LEVEL_CONNECT, "via %s:%d to: %s",
1483                fwd->forward_host, fwd->forward_port, http->hostport);
1484    }
1485    else
1486    {
1487       log_error(LOG_LEVEL_CONNECT, "to %s", http->hostport);
1488    }
1489
1490    /* here we connect to the server, gateway, or the forwarder */
1491
1492    while ( (csp->sfd = forwarded_connect(fwd, http, csp))
1493          && (errno == EINVAL) && (forwarded_connect_retries++ < max_forwarded_connect_retries))
1494    {
1495       log_error(LOG_LEVEL_ERROR, "failed request #%u to connect to %s. Trying again.",
1496                 forwarded_connect_retries, http->hostport);
1497    }
1498
1499    if (csp->sfd == JB_INVALID_SOCKET)
1500    {
1501       log_error(LOG_LEVEL_CONNECT, "connect to: %s failed: %E",
1502                 http->hostport);
1503
1504       if (errno == EINVAL)
1505       {
1506          rsp = error_response(csp, "no-such-domain", errno);
1507
1508          log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 404 0",
1509                    csp->ip_addr_str, http->ocmd);
1510       }
1511       else
1512       {
1513          rsp = error_response(csp, "connect-failed", errno);
1514
1515          log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 503 0",
1516                    csp->ip_addr_str, http->ocmd);
1517       }
1518
1519
1520       /* Write the answer to the client */
1521       if(rsp)
1522       {
1523          if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1524           || write_socket(csp->cfd, rsp->body, rsp->content_length))
1525          {
1526             log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1527          }
1528       }
1529
1530       free_http_response(rsp);
1531       freez(hdr);
1532       return;
1533    }
1534
1535    log_error(LOG_LEVEL_CONNECT, "OK");
1536
1537    if (fwd->forward_host || (http->ssl == 0))
1538    {
1539       /* write the client's (modified) header to the server
1540        * (along with anything else that may be in the buffer)
1541        */
1542
1543       if (write_socket(csp->sfd, hdr, strlen(hdr))
1544        || (flush_socket(csp->sfd, csp) <  0))
1545       {
1546          log_error(LOG_LEVEL_CONNECT, "write header to: %s failed: %E",
1547                     http->hostport);
1548
1549          log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 503 0",
1550                    csp->ip_addr_str, http->ocmd);
1551
1552          rsp = error_response(csp, "connect-failed", errno);
1553
1554          if(rsp)
1555          {
1556             if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1557              || write_socket(csp->cfd, rsp->body, rsp->content_length))
1558             {
1559                log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1560             }
1561          }
1562
1563          free_http_response(rsp);
1564          freez(hdr);
1565          return;
1566       }
1567    }
1568    else
1569    {
1570       /*
1571        * We're running an SSL tunnel and we're not forwarding,
1572        * so just send the "connect succeeded" message to the
1573        * client, flush the rest, and get out of the way.
1574        */
1575       log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 200 2\n",
1576                 csp->ip_addr_str, http->ocmd);
1577
1578       if (write_socket(csp->cfd, CSUCCEED, sizeof(CSUCCEED)-1))
1579       {
1580          freez(hdr);
1581          return;
1582       }
1583       IOB_RESET(csp);
1584    }
1585
1586    /* we're finished with the client's header */
1587    freez(hdr);
1588
1589    maxfd = ( csp->cfd > csp->sfd ) ? csp->cfd : csp->sfd;
1590
1591    /* pass data between the client and server
1592     * until one or the other shuts down the connection.
1593     */
1594
1595    server_body = 0;
1596
1597    for (;;)
1598    {
1599 #ifdef __OS2__
1600       /*
1601        * FD_ZERO here seems to point to an errant macro which crashes.
1602        * So do this by hand for now...
1603        */
1604       memset(&rfds,0x00,sizeof(fd_set));
1605 #else
1606       FD_ZERO(&rfds);
1607 #endif
1608       FD_SET(csp->cfd, &rfds);
1609       FD_SET(csp->sfd, &rfds);
1610
1611       n = select((int)maxfd+1, &rfds, NULL, NULL, NULL);
1612
1613       if (n < 0)
1614       {
1615          log_error(LOG_LEVEL_ERROR, "select() failed!: %E");
1616          return;
1617       }
1618
1619       /* this is the body of the browser's request
1620        * just read it and write it.
1621        */
1622
1623       if (FD_ISSET(csp->cfd, &rfds))
1624       {
1625          len = read_socket(csp->cfd, buf, sizeof(buf));
1626
1627          if (len <= 0)
1628          {
1629             break; /* "game over, man" */
1630          }
1631
1632          if (write_socket(csp->sfd, buf, (size_t)len))
1633          {
1634             log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1635             return;
1636          }
1637          continue;
1638       }
1639
1640       /*
1641        * The server wants to talk.  It could be the header or the body.
1642        * If `hdr' is null, then it's the header otherwise it's the body.
1643        * FIXME: Does `hdr' really mean `host'? No.
1644        */
1645
1646
1647       if (FD_ISSET(csp->sfd, &rfds))
1648       {
1649          fflush( 0 );
1650          len = read_socket(csp->sfd, buf, sizeof(buf) - 1);
1651
1652          if (len < 0)
1653          {
1654             log_error(LOG_LEVEL_ERROR, "read from: %s failed: %E", http->host);
1655
1656             log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 503 0",
1657                       csp->ip_addr_str, http->ocmd);
1658
1659             rsp = error_response(csp, "connect-failed", errno);
1660
1661             if(rsp)
1662             {
1663                if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1664                 || write_socket(csp->cfd, rsp->body, rsp->content_length))
1665                {
1666                   log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1667                }
1668             }
1669
1670             free_http_response(rsp);
1671             return;
1672          }
1673
1674          /* Add a trailing zero.  This lets filter_popups
1675           * use string operations.
1676           */
1677          buf[len] = '\0';
1678
1679 #ifdef FEATURE_KILL_POPUPS
1680          /* Filter the popups on this read. */
1681          if (block_popups_now)
1682          {
1683             filter_popups(buf, csp);
1684          }
1685 #endif /* def FEATURE_KILL_POPUPS */
1686
1687          /* Normally, this would indicate that we've read
1688           * as much as the server has sent us and we can
1689           * close the client connection.  However, Microsoft
1690           * in its wisdom has released IIS/5 with a bug that
1691           * prevents it from sending the trailing \r\n in
1692           * a 302 redirect header (and possibly other headers).
1693           * To work around this if we've haven't parsed
1694           * a full header we'll append a trailing \r\n
1695           * and see if this now generates a valid one.
1696           *
1697           * This hack shouldn't have any impacts.  If we've
1698           * already transmitted the header or if this is a
1699           * SSL connection, then we won't bother with this
1700           * hack.  So we only work on partially received
1701           * headers.  If we append a \r\n and this still
1702           * doesn't generate a valid header, then we won't
1703           * transmit anything to the client.
1704           */
1705          if (len == 0)
1706          {
1707
1708             if (server_body || http->ssl)
1709             {
1710                /*
1711                 * If we have been buffering up the document,
1712                 * now is the time to apply content modification
1713                 * and send the result to the client.
1714                 */
1715                if (content_filter)
1716                {
1717                   /*
1718                    * If the content filter fails, use the original
1719                    * buffer and length.
1720                    * (see p != NULL ? p : csp->iob->cur below)
1721                    */
1722                   if (NULL == (p = (*content_filter)(csp)))
1723                   {
1724                      csp->content_length = (size_t)(csp->iob->eod - csp->iob->cur);
1725                   }
1726
1727                   hdr = sed(server_patterns_light, NULL, csp);
1728
1729                   if (hdr == NULL)
1730                   {
1731                      /* FIXME Should handle error properly */
1732                      log_error(LOG_LEVEL_FATAL, "Out of memory parsing server header");
1733                   }
1734
1735                   if (write_socket(csp->cfd, hdr, strlen(hdr))
1736                    || write_socket(csp->cfd, p != NULL ? p : csp->iob->cur, csp->content_length))
1737                   {
1738                      log_error(LOG_LEVEL_ERROR, "write modified content to client failed: %E");
1739                      freez(hdr);
1740                      freez(p);
1741                      return;
1742                   }
1743
1744                   freez(hdr);
1745                   freez(p);
1746                }
1747
1748                break; /* "game over, man" */
1749             }
1750
1751             /*
1752              * This is NOT the body, so
1753              * Let's pretend the server just sent us a blank line.
1754              */
1755             snprintf(buf, sizeof(buf), "\r\n");
1756             len = (int)strlen(buf);
1757
1758             /*
1759              * Now, let the normal header parsing algorithm below do its
1760              * job.  If it fails, we'll exit instead of continuing.
1761              */
1762
1763             ms_iis5_hack = 1;
1764          }
1765
1766          /*
1767           * If this is an SSL connection or we're in the body
1768           * of the server document, just write it to the client,
1769           * unless we need to buffer the body for later content-filtering
1770           */
1771
1772          if (server_body || http->ssl)
1773          {
1774             if (content_filter)
1775             {
1776                /*
1777                 * If there is no memory left for buffering the content, or the buffer limit
1778                 * has been reached, switch to non-filtering mode, i.e. make & write the
1779                 * header, flush the iob and buf, and get out of the way.
1780                 */
1781                if (add_to_iob(csp, buf, len))
1782                {
1783                   size_t hdrlen;
1784                   int flushed;
1785
1786                   log_error(LOG_LEVEL_ERROR, "Flushing header and buffers. Stepping back from filtering.");
1787
1788                   hdr = sed(server_patterns, add_server_headers, csp);
1789                   if (hdr == NULL)
1790                   {
1791                      /* 
1792                       * Memory is too tight to even generate the header.
1793                       * Send our static "Out-of-memory" page.
1794                       */
1795                      log_error(LOG_LEVEL_ERROR, "Out of memory while trying to flush.");
1796                      rsp = cgi_error_memory();
1797
1798                      if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1799                          || write_socket(csp->cfd, rsp->body, rsp->content_length))
1800                      {
1801                         log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1802                      }
1803                      return;
1804                   }
1805
1806                   hdrlen = strlen(hdr);
1807
1808                   if (write_socket(csp->cfd, hdr, hdrlen)
1809                    || ((flushed = flush_socket(csp->cfd, csp)) < 0)
1810                    || (write_socket(csp->cfd, buf, (size_t)len)))
1811                   {
1812                      log_error(LOG_LEVEL_CONNECT, "Flush header and buffers to client failed: %E");
1813
1814                      freez(hdr);
1815                      return;
1816                   }
1817
1818                   byte_count += hdrlen + (size_t)(flushed + len);
1819                   freez(hdr);
1820                   content_filter = NULL;
1821                   server_body = 1;
1822
1823                }
1824             }
1825             else
1826             {
1827                if (write_socket(csp->cfd, buf, (size_t)len))
1828                {
1829                   log_error(LOG_LEVEL_ERROR, "write to client failed: %E");
1830                   return;
1831                }
1832             }
1833             byte_count += (size_t)len;
1834             continue;
1835          }
1836          else
1837          {
1838             /* we're still looking for the end of the
1839              * server's header ... (does that make header
1840              * parsing an "out of body experience" ?
1841              */
1842
1843             /* 
1844              * buffer up the data we just read.  If that fails, 
1845              * there's little we can do but send our static
1846              * out-of-memory page.
1847              */
1848             if (add_to_iob(csp, buf, len))
1849             {
1850                log_error(LOG_LEVEL_ERROR, "Out of memory while looking for end of server headers.");
1851                rsp = cgi_error_memory();
1852                
1853                if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1854                    || write_socket(csp->cfd, rsp->body, rsp->content_length))
1855                {
1856                   log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1857                }
1858                return;
1859             }
1860
1861             /* get header lines from the iob */
1862
1863             while ((p = get_header(csp)) != NULL)
1864             {
1865                if (*p == '\0')
1866                {
1867                   /* see following note */
1868                   break;
1869                }
1870                enlist(csp->headers, p);
1871                freez(p);
1872             }
1873
1874             /* NOTE: there are no "empty" headers so
1875              * if the pointer `p' is not NULL we must
1876              * assume that we reached the end of the
1877              * buffer before we hit the end of the header.
1878              */
1879
1880             if (p)
1881             {
1882                if (ms_iis5_hack)
1883                {
1884                   /* Well, we tried our MS IIS/5
1885                    * hack and it didn't work.
1886                    * The header is incomplete
1887                    * and there isn't anything
1888                    * we can do about it.
1889                    */
1890                   break;
1891                }
1892                else
1893                {
1894                   /* Since we have to wait for
1895                    * more from the server before
1896                    * we can parse the headers
1897                    * we just continue here.
1898                    */
1899                   continue;
1900                }
1901             }
1902
1903             /* we have now received the entire header.
1904              * filter it and send the result to the client
1905              */
1906
1907             hdr = sed(server_patterns, add_server_headers, csp);
1908             if (hdr == NULL)
1909             {
1910                /* FIXME Should handle error properly */
1911                log_error(LOG_LEVEL_FATAL, "Out of memory parsing server header");
1912             }
1913
1914 #ifdef FEATURE_KILL_POPUPS
1915             /* Start blocking popups if appropriate. */
1916
1917             if ((csp->content_type & CT_TEXT) &&  /* It's a text / * MIME-Type */
1918                 !http->ssl    &&                  /* We talk plaintext */
1919                 block_popups)                     /* Policy allows */
1920             {
1921                block_popups_now = 1;
1922                /*
1923                 * Filter the part of the body that came in the same read
1924                 * as the last headers:
1925                 */
1926                filter_popups(csp->iob->cur, csp);
1927             }
1928
1929 #endif /* def FEATURE_KILL_POPUPS */
1930
1931             /* Buffer and pcrs filter this if appropriate. */
1932
1933             if ((csp->content_type & CT_TEXT) &&  /* It's a text / * MIME-Type */
1934                 !http->ssl    &&                  /* We talk plaintext */
1935                 pcrs_filter)                      /* Policy allows */
1936             {
1937                content_filter = pcrs_filter_response;
1938             }
1939
1940             /* Buffer and gif_deanimate this if appropriate. */
1941
1942             if ((csp->content_type & CT_GIF)  &&  /* It's an image/gif MIME-Type */
1943                 !http->ssl    &&                  /* We talk plaintext */
1944                 gif_deanimate)                    /* Policy allows */
1945             {
1946                content_filter = gif_deanimate_response;
1947             }
1948
1949             /* Buffer and jpg_inspect this if appropriate. */
1950
1951             if ((csp->content_type & CT_JPEG)  &&  /* It's an image/jpeg MIME-Type */
1952                 !http->ssl    &&                   /* We talk plaintext */
1953                 jpeg_inspect)                      /* Policy allows */
1954             {
1955                content_filter = jpeg_inspect_response;
1956             }
1957
1958             /*
1959              * Only write if we're not buffering for content modification
1960              */
1961             if (!content_filter)
1962             {
1963                /* write the server's (modified) header to
1964                 * the client (along with anything else that
1965                 * may be in the buffer)
1966                 */
1967
1968                if (write_socket(csp->cfd, hdr, strlen(hdr))
1969                 || ((len = flush_socket(csp->cfd, csp)) < 0))
1970                {
1971                   log_error(LOG_LEVEL_CONNECT, "write header to client failed: %E");
1972
1973                   /* the write failed, so don't bother
1974                    * mentioning it to the client...
1975                    * it probably can't hear us anyway.
1976                    */
1977                   freez(hdr);
1978                   return;
1979                }
1980
1981                byte_count += (size_t)len;
1982             }
1983
1984             /* we're finished with the server's header */
1985
1986             freez(hdr);
1987             server_body = 1;
1988
1989             /* If this was a MS IIS/5 hack then it means
1990              * the server has already closed the
1991              * connection.  Nothing more to read.  Time
1992              * to bail.
1993              */
1994             if (ms_iis5_hack)
1995             {
1996                break;
1997             }
1998          }
1999          continue;
2000       }
2001
2002       return; /* huh? we should never get here */
2003    }
2004
2005    log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 200 %d",
2006              csp->ip_addr_str, http->ocmd, byte_count);
2007 }
2008
2009
2010 /*********************************************************************
2011  *
2012  * Function    :  serve
2013  *
2014  * Description :  This is little more than chat.  We only "serve" to
2015  *                to close any socket that chat may have opened.
2016  *
2017  * Parameters  :
2018  *          1  :  csp = Current client state (buffers, headers, etc...)
2019  *
2020  * Returns     :  N/A
2021  *
2022  *********************************************************************/
2023 #ifdef AMIGA
2024 void serve(struct client_state *csp)
2025 #else /* ifndef AMIGA */
2026 static void serve(struct client_state *csp)
2027 #endif /* def AMIGA */
2028 {
2029    chat(csp);
2030    close_socket(csp->cfd);
2031
2032    if (csp->sfd != JB_INVALID_SOCKET)
2033    {
2034       close_socket(csp->sfd);
2035    }
2036
2037    csp->flags &= ~CSP_FLAG_ACTIVE;
2038
2039 }
2040
2041
2042 #ifdef __BEOS__
2043 /*********************************************************************
2044  *
2045  * Function    :  server_thread
2046  *
2047  * Description :  We only exist to call `serve' in a threaded environment.
2048  *
2049  * Parameters  :
2050  *          1  :  data = Current client state (buffers, headers, etc...)
2051  *
2052  * Returns     :  Always 0.
2053  *
2054  *********************************************************************/
2055 static int32 server_thread(void *data)
2056 {
2057    serve((struct client_state *) data);
2058    return 0;
2059
2060 }
2061 #endif
2062
2063
2064 /*********************************************************************
2065  *
2066  * Function    :  usage
2067  *
2068  * Description :  Print usage info & exit.
2069  *
2070  * Parameters  :  Pointer to argv[0] for identifying ourselves
2071  *
2072  * Returns     :  No. ,-)
2073  *
2074  *********************************************************************/
2075 void usage(const char *myname)
2076 {
2077    printf("Privoxy version " VERSION " (" HOME_PAGE_URL ")\n"
2078 #if !defined(unix)
2079            "Usage: %s [--help] [--version] [configfile]\n"
2080 #else
2081            "Usage: %s [--help] [--version] [--no-daemon] [--pidfile pidfile] [--user user[.group]] [configfile]\n"
2082 #endif
2083            "Aborting.\n", myname);
2084  
2085    exit(2);
2086
2087 }
2088
2089
2090 /*********************************************************************
2091  *
2092  * Function    :  main
2093  *
2094  * Description :  Load the config file and start the listen loop.
2095  *                This function is a lot more *sane* with the `load_config'
2096  *                and `listen_loop' functions; although it stills does
2097  *                a *little* too much for my taste.
2098  *
2099  * Parameters  :
2100  *          1  :  argc = Number of parameters (including $0).
2101  *          2  :  argv = Array of (char *)'s to the parameters.
2102  *
2103  * Returns     :  1 if : can't open config file, unrecognized directive,
2104  *                stats requested in multi-thread mode, can't open the
2105  *                log file, can't open the jar file, listen port is invalid,
2106  *                any load fails, and can't bind port.
2107  *
2108  *                Else main never returns, the process must be signaled
2109  *                to terminate execution.  Or, on Windows, use the
2110  *                "File", "Exit" menu option.
2111  *
2112  *********************************************************************/
2113 #ifdef __MINGW32__
2114 int real_main(int argc, const char *argv[])
2115 #else
2116 int main(int argc, const char *argv[])
2117 #endif
2118 {
2119    int argc_pos = 0;
2120    unsigned int random_seed;
2121 #ifdef unix
2122    struct passwd *pw = NULL;
2123    struct group *grp = NULL;
2124    char *p;
2125    int do_chroot = 0;
2126 #endif
2127
2128    Argc = argc;
2129    Argv = argv;
2130
2131    configfile =
2132 #if !defined(_WIN32)
2133    "config"
2134 #else
2135    "config.txt"
2136 #endif
2137       ;
2138
2139    /*
2140     * Parse the command line arguments
2141     */
2142    while (++argc_pos < argc)
2143    {
2144 #ifdef _WIN32
2145       /* Check to see if the service must be installed or uninstalled */
2146       if (strncmp(argv[argc_pos], "--install", 9) == 0)
2147       {
2148          const char *pName = argv[argc_pos] + 9;
2149          if (*pName == ':')
2150             pName++;
2151          exit( (install_service(pName)) ? 0 : 1 );
2152       }
2153       else if (strncmp(argv[argc_pos], "--uninstall", + 11) == 0)
2154       {
2155          const char *pName = argv[argc_pos] + 11;
2156          if (*pName == ':')
2157             pName++;
2158          exit((uninstall_service(pName)) ? 0 : 1);
2159       }
2160       else if (strcmp(argv[argc_pos], "--service" ) == 0)
2161       {
2162          bRunAsService = TRUE;
2163          w32_set_service_cwd();
2164          atexit(w32_service_exit_notify);
2165       }
2166       else
2167 #endif /* defined(_WIN32) */
2168
2169
2170 #if !defined(_WIN32) || defined(_WIN_CONSOLE)
2171
2172       if (strcmp(argv[argc_pos], "--help") == 0)
2173       {
2174          usage(argv[0]);
2175       }
2176
2177       else if(strcmp(argv[argc_pos], "--version") == 0)
2178       {
2179          printf("Privoxy version " VERSION " (" HOME_PAGE_URL ")\n");
2180          exit(0);
2181       }
2182
2183 #if defined(unix)
2184
2185       else if (strcmp(argv[argc_pos], "--no-daemon" ) == 0)
2186       {
2187          no_daemon = 1;
2188       }
2189
2190       else if (strcmp(argv[argc_pos], "--pidfile" ) == 0)
2191       {
2192          if (++argc_pos == argc) usage(argv[0]);
2193          pidfile = strdup(argv[argc_pos]);
2194       }
2195
2196       else if (strcmp(argv[argc_pos], "--user" ) == 0)
2197       {
2198          if (++argc_pos == argc) usage(argv[argc_pos]);
2199
2200          if ((NULL != (p = strchr(argv[argc_pos], '.'))) && *(p + 1) != '0')
2201          {
2202             *p++ = '\0';
2203             if (NULL == (grp = getgrnam(p)))
2204             {
2205                log_error(LOG_LEVEL_FATAL, "Group %s not found.", p);
2206             }
2207          }
2208
2209          if (NULL == (pw = getpwnam(argv[argc_pos])))
2210          {
2211             log_error(LOG_LEVEL_FATAL, "User %s not found.", argv[argc_pos]);
2212          }
2213
2214          if (p != NULL) *--p = '\0';
2215       }
2216
2217       else if (strcmp(argv[argc_pos], "--chroot" ) == 0)
2218       {
2219          do_chroot = 1;
2220       }
2221
2222 #endif /* defined(unix) */
2223 #endif /* defined(_WIN32) && !defined(_WIN_CONSOLE) */
2224       {
2225          configfile = argv[argc_pos];
2226       }
2227
2228    } /* -END- while (more arguments) */
2229
2230 #if defined(unix)
2231    if ( *configfile != '/' )
2232    {
2233       char *abs_file, cwd[1024];
2234
2235       /* make config-filename absolute here */
2236       if ( !(getcwd(cwd, sizeof(cwd))))
2237       {
2238          perror("get working dir failed");
2239          exit( 1 );
2240       }
2241
2242       if (!(basedir = strdup(cwd))
2243       || (!(abs_file = malloc( strlen( basedir ) + strlen( configfile ) + 5 ))))
2244       {
2245          perror("malloc failed");
2246          exit( 1 );
2247       }
2248       strcpy( abs_file, basedir );
2249       strcat( abs_file, "/" );
2250       strcat( abs_file, configfile );
2251       configfile = abs_file;
2252    }
2253 #endif /* defined unix */
2254
2255
2256    files->next = NULL;
2257    clients->next = NULL;
2258
2259 #ifdef AMIGA
2260    InitAmiga();
2261 #elif defined(_WIN32)
2262    InitWin32();
2263 #endif
2264
2265 #ifdef FEATURE_PTHREAD
2266    /*
2267     * Prepare global mutex semaphores
2268     */
2269    pthread_mutex_init(&log_mutex,0);
2270    pthread_mutex_init(&log_init_mutex,0);
2271
2272 #ifndef HAVE_GMTIME_R
2273    pthread_mutex_init(&gmtime_mutex,0);
2274 #endif /* ndef HAVE_GMTIME_R */
2275
2276 #ifndef HAVE_LOCALTIME_R
2277    pthread_mutex_init(&localtime_mutex,0);
2278 #endif /* ndef HAVE_GMTIME_R */
2279
2280 #ifndef HAVE_GETHOSTBYADDR_R
2281    pthread_mutex_init(&gethostbyaddr_mutex,0);
2282 #endif /* ndef HAVE_GETHOSTBYADDR_R */
2283
2284 #ifndef HAVE_GETHOSTBYNAME_R
2285    pthread_mutex_init(&gethostbyname_mutex,0);
2286 #endif /* ndef HAVE_GETHOSTBYNAME_R */
2287
2288 #ifndef HAVE_RANDOM
2289    pthread_mutex_init(&rand_mutex,0);
2290 #endif /* ndef HAVE_RANDOM */
2291
2292 #endif /* FEATURE_PTHREAD */
2293
2294    random_seed = (unsigned int)time(NULL);
2295 #ifdef HAVE_RANDOM
2296    srandom(random_seed);
2297 #else
2298    srand(random_seed);
2299 #endif /* ifdef HAVE_RANDOM */
2300
2301    /*
2302     * Unix signal handling
2303     *
2304     * Catch the abort, interrupt and terminate signals for a graceful exit
2305     * Catch the hangup signal so the errlog can be reopened.
2306     * Ignore the broken pipe signals (FIXME: Why?)
2307     */
2308 #if !defined(_WIN32) && !defined(__OS2__) && !defined(AMIGA)
2309 {
2310    int idx;
2311    const int catched_signals[] = { SIGTERM, SIGINT, SIGHUP, 0 };
2312    const int ignored_signals[] = { SIGPIPE, 0 };
2313
2314    for (idx = 0; catched_signals[idx] != 0; idx++)
2315    {
2316 #ifdef sun /* FIXME: Is it safe to check for HAVE_SIGSET instead? */ 
2317       if (sigset(catched_signals[idx], sig_handler) == SIG_ERR)
2318 #else
2319       if (signal(catched_signals[idx], sig_handler) == SIG_ERR)
2320 #endif /* ifdef sun */
2321       {
2322          log_error(LOG_LEVEL_FATAL, "Can't set signal-handler for signal %d: %E", catched_signals[idx]);
2323       }
2324    }
2325
2326    for (idx = 0; ignored_signals[idx] != 0; idx++)
2327    {
2328       if (signal(ignored_signals[idx], SIG_IGN) == SIG_ERR)
2329       {
2330          log_error(LOG_LEVEL_FATAL, "Can't set ignore-handler for signal %d: %E", ignored_signals[idx]);
2331       }
2332    }
2333
2334 }
2335 #else /* ifdef _WIN32 */
2336 # ifdef _WIN_CONSOLE
2337    /*
2338     * We *are* in a windows console app.
2339     * Print a verbose messages about FAQ's and such
2340     */
2341    printf("%s", win32_blurb);
2342 # endif /* def _WIN_CONSOLE */
2343 #endif /* def _WIN32 */
2344
2345
2346    /* Initialize the CGI subsystem */
2347    cgi_init_error_messages();
2348
2349    /*
2350     * If runnig on unix and without the --nodaemon
2351     * option, become a daemon. I.e. fork, detach
2352     * from tty and get process group leadership
2353     */
2354 #if defined(unix)
2355 {
2356    pid_t pid = 0;
2357 #if 0
2358    int   fd;
2359 #endif
2360
2361    if (!no_daemon)
2362    {
2363       pid  = fork();
2364
2365       if ( pid < 0 ) /* error */
2366       {
2367          perror("fork");
2368          exit( 3 );
2369       }
2370       else if ( pid != 0 ) /* parent */
2371       {
2372          int status;
2373          pid_t wpid;
2374          /*
2375           * must check for errors
2376           * child died due to missing files aso
2377           */
2378          sleep( 1 );
2379          wpid = waitpid( pid, &status, WNOHANG );
2380          if ( wpid != 0 )
2381          {
2382             exit( 1 );
2383          }
2384          exit( 0 );
2385       }
2386       /* child */
2387 #if 1
2388       /* Should be more portable, but not as well tested */
2389       setsid();
2390 #else /* !1 */
2391 #ifdef __FreeBSD__
2392       setpgrp(0,0);
2393 #else /* ndef __FreeBSD__ */
2394       setpgrp();
2395 #endif /* ndef __FreeBSD__ */
2396       fd = open("/dev/tty", O_RDONLY);
2397       if ( fd )
2398       {
2399          /* no error check here */
2400          ioctl( fd, TIOCNOTTY,0 );
2401          close ( fd );
2402       }
2403 #endif /* 1 */
2404       /* FIXME: should close stderr (fd 2) here too, but the test
2405        * for existence
2406        * and load config file is done in listen_loop() and puts
2407        * some messages on stderr there.
2408        */
2409
2410       close( 0 );
2411       close( 1 );
2412       chdir("/");
2413
2414    } /* -END- if (!no_daemon) */
2415
2416    /*
2417     * As soon as we have written the PID file, we can switch
2418     * to the user and group ID indicated by the --user option
2419     */
2420    write_pid_file();
2421
2422    if (NULL != pw)
2423    {
2424       if (setgid((NULL != grp) ? grp->gr_gid : pw->pw_gid))
2425       {
2426          log_error(LOG_LEVEL_FATAL, "Cannot setgid(): Insufficient permissions.");
2427       }
2428       if (do_chroot)
2429       {
2430          if (!pw->pw_dir)
2431          {
2432             log_error(LOG_LEVEL_FATAL, "Home directory for %s undefined", pw->pw_name);
2433          }
2434          if (chroot(pw->pw_dir) < 0)
2435          {
2436             log_error(LOG_LEVEL_FATAL, "Cannot chroot to %s", pw->pw_dir);
2437          }
2438          if (chdir ("/"))
2439          {
2440             log_error(LOG_LEVEL_FATAL, "Cannot chdir /");
2441          }
2442       }
2443       if (setuid(pw->pw_uid))
2444       {
2445          log_error(LOG_LEVEL_FATAL, "Cannot setuid(): Insufficient permissions.");
2446       }
2447       if (do_chroot)
2448       {
2449          char putenv_dummy[64];
2450
2451          strcpy(putenv_dummy, "HOME=/");
2452          if (putenv(putenv_dummy) != 0)
2453          {
2454             log_error(LOG_LEVEL_FATAL, "Cannot putenv(): HOME");
2455          }                
2456
2457          snprintf(putenv_dummy, 64, "USER=%s", pw->pw_name);
2458          if (putenv(putenv_dummy) != 0)
2459          {
2460             log_error(LOG_LEVEL_FATAL, "Cannot putenv(): USER");
2461          }
2462       }
2463    }
2464    else if (do_chroot)
2465    {
2466       log_error(LOG_LEVEL_FATAL, "Cannot chroot without --user argument.");
2467    }
2468 }
2469 #endif /* defined unix */
2470
2471 #ifdef _WIN32
2472    /* This will be FALSE unless the command line specified --service
2473     */
2474    if (bRunAsService)
2475    {
2476       /* Yup, so now we must attempt to establish a connection 
2477        * with the service dispatcher. This will only work if this
2478        * process was launched by the service control manager to
2479        * actually run as a service. If this isn't the case, i've
2480        * known it take around 30 seconds or so for the call to return.
2481        */
2482
2483       /* The StartServiceCtrlDispatcher won't return until the service is stopping */
2484       if (w32_start_service_ctrl_dispatcher(w32ServiceDispatchTable))
2485       {
2486          /* Service has run, and at this point is now being stopped, so just return */
2487          return 0;
2488       }
2489
2490 #ifdef _WIN_CONSOLE
2491       printf("Warning: Failed to connect to Service Control Dispatcher\nwhen starting as a service!\n");
2492 #endif
2493       /* An error occurred. Usually it's because --service was wrongly specified
2494        * and we were unable to connect to the Service Control Dispatcher because
2495        * it wasn't expecting us and is therefore not listening.
2496        *
2497        * For now, just continue below to call the listen_loop function.
2498        */
2499    }
2500 #endif /* def _WIN32 */
2501
2502    listen_loop();
2503
2504    /* NOTREACHED */
2505    return(-1);
2506
2507 }
2508
2509
2510 /*********************************************************************
2511  *
2512  * Function    :  bind_port_helper
2513  *
2514  * Description :  Bind the listen port.  Handles logging, and aborts
2515  *                on failure.
2516  *
2517  * Parameters  :
2518  *          1  :  config = Privoxy configuration.  Specifies port
2519  *                         to bind to.
2520  *
2521  * Returns     :  Port that was opened.
2522  *
2523  *********************************************************************/
2524 static jb_socket bind_port_helper(struct configuration_spec * config)
2525 {
2526    int result;
2527    jb_socket bfd;
2528
2529    if ( (config->haddr != NULL)
2530      && (config->haddr[0] == '1')
2531      && (config->haddr[1] == '2')
2532      && (config->haddr[2] == '7')
2533      && (config->haddr[3] == '.') )
2534    {
2535       log_error(LOG_LEVEL_INFO, "Listening on port %d for local connections only",
2536                 config->hport);
2537    }
2538    else if (config->haddr == NULL)
2539    {
2540       log_error(LOG_LEVEL_INFO, "Listening on port %d on all IP addresses",
2541                 config->hport);
2542    }
2543    else
2544    {
2545       log_error(LOG_LEVEL_INFO, "Listening on port %d on IP address %s",
2546                 config->hport, config->haddr);
2547    }
2548
2549    result = bind_port(config->haddr, config->hport, &bfd);
2550
2551    if (result < 0)
2552    {
2553       switch(result)
2554       {
2555          case -3 :
2556             log_error(LOG_LEVEL_FATAL, "can't bind to %s:%d: "
2557                "There may be another Privoxy or some other "
2558                "proxy running on port %d",
2559                (NULL != config->haddr) ? config->haddr : "INADDR_ANY",
2560                       config->hport, config->hport);
2561
2562          case -2 :
2563             log_error(LOG_LEVEL_FATAL, "can't bind to %s:%d: " 
2564                "The hostname is not resolvable",
2565                (NULL != config->haddr) ? config->haddr : "INADDR_ANY", config->hport);
2566
2567          default :
2568             log_error(LOG_LEVEL_FATAL, "can't bind to %s:%d: because %E",
2569                (NULL != config->haddr) ? config->haddr : "INADDR_ANY", config->hport);
2570       }
2571
2572       /* shouldn't get here */
2573       return JB_INVALID_SOCKET;
2574    }
2575
2576    config->need_bind = 0;
2577
2578    return bfd;
2579 }
2580
2581
2582 #ifdef _WIN32
2583 /* Without this simple workaround we get this compiler warning from _beginthread
2584  *     warning C4028: formal parameter 1 different from declaration
2585  */
2586 void w32_service_listen_loop(void *p)
2587 {
2588    listen_loop();
2589 }
2590 #endif /* def _WIN32 */
2591
2592
2593 /*********************************************************************
2594  *
2595  * Function    :  listen_loop
2596  *
2597  * Description :  bind the listen port and enter a "FOREVER" listening loop.
2598  *
2599  * Parameters  :  N/A
2600  *
2601  * Returns     :  Never.
2602  *
2603  *********************************************************************/
2604 static void listen_loop(void)
2605 {
2606    struct client_state *csp = NULL;
2607    jb_socket bfd;
2608    struct configuration_spec * config;
2609
2610    config = load_config();
2611
2612    bfd = bind_port_helper(config);
2613
2614 #ifdef FEATURE_GRACEFUL_TERMINATION
2615    while (!g_terminate)
2616 #else
2617    for (;;)
2618 #endif
2619    {
2620 #if !defined(FEATURE_PTHREAD) && !defined(_WIN32) && !defined(__BEOS__) && !defined(AMIGA) && !defined(__OS2__)
2621       while (waitpid(-1, NULL, WNOHANG) > 0)
2622       {
2623          /* zombie children */
2624       }
2625 #endif /* !defined(FEATURE_PTHREAD) && !defined(_WIN32) && !defined(__BEOS__) && !defined(AMIGA) */
2626
2627       /*
2628        * Free data that was used by died threads
2629        */
2630       sweep();
2631
2632 #if defined(unix)
2633       /*
2634        * Re-open the errlog after HUP signal
2635        */
2636       if (received_hup_signal)
2637       {
2638          init_error_log(Argv[0], config->logfile, config->debug);
2639          received_hup_signal = 0;
2640       }
2641 #endif
2642
2643 #ifdef __OS2__
2644 #ifdef FEATURE_COOKIE_JAR
2645       /*
2646        * Need a workaround here: we have to fclose() the jarfile, or we die because it's
2647        * already open.  I think unload_configfile() is not being run, which should do
2648        * this work.  Until that can get resolved, we'll use this workaround.
2649        */
2650        if (csp)
2651          if(csp->config)
2652            if (csp->config->jar)
2653            {
2654              fclose(csp->config->jar);
2655              csp->config->jar = NULL;
2656            }
2657 #endif /* FEATURE_COOKIE_JAR */
2658 #endif /* __OS2__ */
2659
2660       if ( NULL == (csp = (struct client_state *) zalloc(sizeof(*csp))) )
2661       {
2662          log_error(LOG_LEVEL_FATAL, "malloc(%d) for csp failed: %E", sizeof(*csp));
2663          continue;
2664       }
2665
2666       csp->flags |= CSP_FLAG_ACTIVE;
2667       csp->sfd    = JB_INVALID_SOCKET;
2668
2669       csp->config = config = load_config();
2670
2671       if ( config->need_bind )
2672       {
2673          /*
2674           * Since we were listening to the "old port", we will not see
2675           * a "listen" param change until the next IJB request.  So, at
2676           * least 1 more request must be made for us to find the new
2677           * setting.  I am simply closing the old socket and binding the
2678           * new one.
2679           *
2680           * Which-ever is correct, we will serve 1 more page via the
2681           * old settings.  This should probably be a "show-proxy-args"
2682           * request.  This should not be a so common of an operation
2683           * that this will hurt people's feelings.
2684           */
2685
2686          close_socket(bfd);
2687
2688          bfd = bind_port_helper(config);
2689       }
2690
2691       log_error(LOG_LEVEL_CONNECT, "accept connection ... ");
2692
2693       if (!accept_connection(csp, bfd))
2694       {
2695          log_error(LOG_LEVEL_CONNECT, "accept failed: %E");
2696
2697 #ifdef AMIGA
2698          if(!childs)
2699          {
2700             exit(1);
2701          }
2702 #endif
2703          freez(csp);
2704          continue;
2705       }
2706       else
2707       {
2708          log_error(LOG_LEVEL_CONNECT, "OK");
2709       }
2710
2711 #ifdef FEATURE_TOGGLE
2712       if (global_toggle_state)
2713       {
2714          csp->flags |= CSP_FLAG_TOGGLED_ON;
2715       }
2716 #endif /* def FEATURE_TOGGLE */
2717
2718       if (run_loader(csp))
2719       {
2720          log_error(LOG_LEVEL_FATAL, "a loader failed - must exit");
2721          /* Never get here - LOG_LEVEL_FATAL causes program exit */
2722       }
2723
2724 #ifdef FEATURE_ACL
2725       if (block_acl(NULL,csp))
2726       {
2727          log_error(LOG_LEVEL_CONNECT, "Connection dropped due to ACL");
2728          close_socket(csp->cfd);
2729          freez(csp);
2730          continue;
2731       }
2732 #endif /* def FEATURE_ACL */
2733
2734       /* add it to the list of clients */
2735       csp->next = clients->next;
2736       clients->next = csp;
2737
2738       if (config->multi_threaded)
2739       {
2740          int child_id;
2741
2742 /* this is a switch () statment in the C preprocessor - ugh */
2743 #undef SELECTED_ONE_OPTION
2744
2745 /* Use Pthreads in preference to native code */
2746 #if defined(FEATURE_PTHREAD) && !defined(SELECTED_ONE_OPTION)
2747 #define SELECTED_ONE_OPTION
2748          {
2749             pthread_t the_thread;
2750             pthread_attr_t attrs;
2751
2752             pthread_attr_init(&attrs);
2753             pthread_attr_setdetachstate(&attrs, PTHREAD_CREATE_DETACHED);
2754             errno = pthread_create(&the_thread, &attrs,
2755                (void * (*)(void *))serve, csp);
2756             child_id = errno ? -1 : 0;
2757             pthread_attr_destroy(&attrs);
2758          }
2759 #endif
2760
2761 #if defined(_WIN32) && !defined(_CYGWIN) && !defined(SELECTED_ONE_OPTION)
2762 #define SELECTED_ONE_OPTION
2763          child_id = _beginthread(
2764             (void (*)(void *))serve,
2765             64 * 1024,
2766             csp);
2767 #endif
2768
2769 #if defined(__OS2__) && !defined(SELECTED_ONE_OPTION)
2770 #define SELECTED_ONE_OPTION
2771          child_id = _beginthread(
2772             (void(* _Optlink)(void*))serve,
2773             NULL,
2774             64 * 1024,
2775             csp);
2776 #endif
2777
2778 #if defined(__BEOS__) && !defined(SELECTED_ONE_OPTION)
2779 #define SELECTED_ONE_OPTION
2780          {
2781             thread_id tid = spawn_thread
2782                (server_thread, "server", B_NORMAL_PRIORITY, csp);
2783
2784             if ((tid >= 0) && (resume_thread(tid) == B_OK))
2785             {
2786                child_id = (int) tid;
2787             }
2788             else
2789             {
2790                child_id = -1;
2791             }
2792          }
2793 #endif
2794
2795 #if defined(AMIGA) && !defined(SELECTED_ONE_OPTION)
2796 #define SELECTED_ONE_OPTION
2797          csp->cfd = ReleaseSocket(csp->cfd, -1);
2798          
2799 #ifdef __amigaos4__
2800          child_id = (int)CreateNewProcTags(NP_Entry, (ULONG)server_thread,
2801                                            NP_Output, Output(),
2802                                            NP_CloseOutput, FALSE,
2803                                            NP_Name, (ULONG)"privoxy child",
2804                                            NP_Child, TRUE,
2805                                            TAG_DONE);
2806 #else
2807          child_id = (int)CreateNewProcTags(NP_Entry, (ULONG)server_thread,
2808                                            NP_Output, Output(),
2809                                            NP_CloseOutput, FALSE,
2810                                            NP_Name, (ULONG)"privoxy child",
2811                                            NP_StackSize, 200*1024,
2812                                            TAG_DONE);
2813 #endif
2814          if(0 != child_id)
2815          {
2816             childs++;
2817             ((struct Task *)child_id)->tc_UserData = csp;
2818             Signal((struct Task *)child_id, SIGF_SINGLE);
2819             Wait(SIGF_SINGLE);
2820          }
2821 #endif
2822
2823 #if !defined(SELECTED_ONE_OPTION)
2824          child_id = fork();
2825
2826          /* This block is only needed when using fork().
2827           * When using threads, the server thread was
2828           * created and run by the call to _beginthread().
2829           */
2830          if (child_id == 0)   /* child */
2831          {
2832             int rc = 0;
2833 #ifdef FEATURE_TOGGLE
2834             int inherited_toggle_state = global_toggle_state;
2835 #endif /* def FEATURE_TOGGLE */
2836
2837             serve(csp);
2838
2839             /* 
2840              * If we've been toggled or we've blocked the request, tell Mom
2841              */
2842
2843 #ifdef FEATURE_TOGGLE
2844             if (inherited_toggle_state != global_toggle_state)
2845             {
2846                rc |= RC_FLAG_TOGGLED;
2847             }
2848 #endif /* def FEATURE_TOGGLE */
2849
2850 #ifdef FEATURE_STATISTICS  
2851             if (csp->flags & CSP_FLAG_REJECTED)
2852             {
2853                rc |= RC_FLAG_BLOCKED;
2854             }
2855 #endif /* ndef FEATURE_STATISTICS */
2856
2857             _exit(rc);
2858          }
2859          else if (child_id > 0) /* parent */
2860          {
2861             /* in a fork()'d environment, the parent's
2862              * copy of the client socket and the CSP
2863              * are not used.
2864              */
2865             int child_status;
2866 #if !defined(_WIN32) && !defined(__CYGWIN__)
2867
2868             wait( &child_status );
2869
2870             /* 
2871              * Evaluate child's return code: If the child has
2872              *  - been toggled, toggle ourselves
2873              *  - blocked its request, bump up the stats counter
2874              */
2875
2876 #ifdef FEATURE_TOGGLE
2877             if (WIFEXITED(child_status) && (WEXITSTATUS(child_status) & RC_FLAG_TOGGLED))
2878             {
2879                global_toggle_state = !global_toggle_state;
2880             }
2881 #endif /* def FEATURE_TOGGLE */
2882
2883 #ifdef FEATURE_STATISTICS
2884             urls_read++;
2885             if (WIFEXITED(child_status) && (WEXITSTATUS(child_status) & RC_FLAG_BLOCKED))
2886             {
2887                urls_rejected++;
2888             }
2889 #endif /* def FEATURE_STATISTICS */ 
2890
2891 #endif /* !defined(_WIN32) && defined(__CYGWIN__) */
2892             close_socket(csp->cfd);
2893             csp->flags &= ~CSP_FLAG_ACTIVE;
2894          }
2895 #endif
2896
2897 #undef SELECTED_ONE_OPTION
2898 /* end of cpp switch () */
2899
2900          if (child_id < 0) /* failed */
2901          {
2902             char buf[BUFFER_SIZE];
2903
2904             log_error(LOG_LEVEL_ERROR, "can't fork: %E");
2905
2906             snprintf(buf , sizeof(buf), "Privoxy: can't fork: errno = %d", errno);
2907
2908             write_socket(csp->cfd, buf, strlen(buf));
2909             close_socket(csp->cfd);
2910             csp->flags &= ~CSP_FLAG_ACTIVE;
2911             sleep(5);
2912             continue;
2913          }
2914       }
2915       else
2916       {
2917          serve(csp);
2918       }
2919    }
2920
2921    /* NOTREACHED unless FEATURE_GRACEFUL_TERMINATION is defined */
2922
2923    /* Clean up.  Aim: free all memory (no leaks) */
2924 #ifdef FEATURE_GRACEFUL_TERMINATION
2925
2926    log_error(LOG_LEVEL_ERROR, "Graceful termination requested");
2927
2928    unload_current_config_file();
2929    unload_current_actions_file();
2930    unload_current_re_filterfile();
2931 #ifdef FEATURE_TRUST
2932    unload_current_trust_file();
2933 #endif
2934
2935    if (config->multi_threaded)
2936    {
2937       int i = 60;
2938       do
2939       {
2940          sleep(1);
2941          sweep();
2942       } while ((clients->next != NULL) && (--i > 0));
2943
2944       if (i <= 0)
2945       {
2946          log_error(LOG_LEVEL_ERROR, "Graceful termination failed - still some live clients after 1 minute wait.");
2947       }
2948    }
2949    sweep();
2950    sweep();
2951
2952 #if defined(unix)
2953    freez(basedir);
2954 #endif
2955    freez(configfile);
2956
2957 #ifdef FEATURE_COOKIE_JAR
2958    if (NULL != config->jar)
2959    {
2960       fclose(config->jar);
2961    }
2962 #endif
2963
2964 #if defined(_WIN32) && !defined(_WIN_CONSOLE)
2965    /* Cleanup - remove taskbar icon etc. */
2966    TermLogWindow();
2967 #endif
2968
2969    exit(0);
2970 #endif /* FEATURE_GRACEFUL_TERMINATION */
2971
2972 }
2973
2974
2975 /*
2976   Local Variables:
2977   tab-width: 3
2978   end:
2979 */