Various updates, including 7 or 8 new FAQs, and updates/changes to various
[privoxy.git] / jcc.c
1 const char jcc_rcs[] = "$Id: jcc.c,v 1.98 2006/08/24 11:01:34 fabiankeil Exp $";
2 /*********************************************************************
3  *
4  * File        :  $Source: /cvsroot/ijbswa/current/jcc.c,v $
5  *
6  * Purpose     :  Main file.  Contains main() method, main loop, and
7  *                the main connection-handling function.
8  *
9  * Copyright   :  Written by and Copyright (C) 2001 the SourceForge
10  *                Privoxy team. http://www.privoxy.org/
11  *
12  *                Based on the Internet Junkbuster originally written
13  *                by and Copyright (C) 1997 Anonymous Coders and
14  *                Junkbusters Corporation.  http://www.junkbusters.com
15  *
16  *                This program is free software; you can redistribute it
17  *                and/or modify it under the terms of the GNU General
18  *                Public License as published by the Free Software
19  *                Foundation; either version 2 of the License, or (at
20  *                your option) any later version.
21  *
22  *                This program is distributed in the hope that it will
23  *                be useful, but WITHOUT ANY WARRANTY; without even the
24  *                implied warranty of MERCHANTABILITY or FITNESS FOR A
25  *                PARTICULAR PURPOSE.  See the GNU General Public
26  *                License for more details.
27  *
28  *                The GNU General Public License should be included with
29  *                this file.  If not, you can view it at
30  *                http://www.gnu.org/copyleft/gpl.html
31  *                or write to the Free Software Foundation, Inc., 59
32  *                Temple Place - Suite 330, Boston, MA  02111-1307, USA.
33  *
34  * Revisions   :
35  *    $Log: jcc.c,v $
36  *    Revision 1.98  2006/08/24 11:01:34  fabiankeil
37  *    --user fix. Only use the user as group if no group is specified.
38  *    Solves BR 1492612. Thanks to Spinor S. and David Laight.
39  *
40  *    Revision 1.97  2006/08/18 15:23:17  david__schmidt
41  *    Windows service (re-)integration
42  *
43  *    The new args are:
44  *
45  *    --install[:service_name]
46  *    --uninstall[:service_name]
47  *    --service
48  *
49  *    They work as follows:
50  *    --install will create a service for you and then terminate.
51  *    By default the service name will be "privoxy" (without the quotes).
52  *    However you can run multiple services if you wish, just by adding
53  *    a colon and then a name (no spaces).
54  *
55  *    --uninstall follows the exact same rules a --install.
56  *
57  *    --service is used when the program is executed by the service
58  *    control manager, and in normal circumstances would never be
59  *    used as a command line argument.
60  *
61  *    Revision 1.96  2006/08/15 20:12:36  david__schmidt
62  *    Windows service integration
63  *
64  *    Revision 1.95  2006/08/03 02:46:41  david__schmidt
65  *    Incorporate Fabian Keil's patch work:\rhttp://www.fabiankeil.de/sourcecode/privoxy/
66  *
67  *    Revision 1.94  2006/07/18 14:48:46  david__schmidt
68  *    Reorganizing the repository: swapping out what was HEAD (the old 3.1 branch)
69  *    with what was really the latest development (the v_3_0_branch branch)
70  *
71  *    Revision 1.92.2.16  2005/04/03 20:10:50  david__schmidt
72  *    Thanks to Jindrich Makovicka for a race condition fix for the log
73  *    file.  The race condition remains for non-pthread implementations.
74  *    Reference patch #1175720.
75  *
76  *    Revision 1.92.2.15  2004/10/03 12:53:32  david__schmidt
77  *    Add the ability to check jpeg images for invalid
78  *    lengths of comment blocks.  Defensive strategy
79  *    against the exploit:
80  *       Microsoft Security Bulletin MS04-028
81  *       Buffer Overrun in JPEG Processing (GDI+) Could
82  *       Allow Code Execution (833987)
83  *    Enabled with +inspect-jpegs in actions files.
84  *
85  *    Revision 1.92.2.14  2003/12/12 12:52:53  oes
86  *    - Fixed usage info for non-unix platforms
87  *    - Fixed small cmdline parsing bug
88  *
89  *    Revision 1.92.2.13  2003/11/27 19:20:27  oes
90  *    Diagnostics: Now preserve the returncode of pthread_create
91  *    in errno. Closes BR #775721. Thanks to Geoffrey Hausheer.
92  *
93  *    Revision 1.92.2.12  2003/07/11 11:34:19  oes
94  *    No longer ignore SIGCHLD. Fixes bug #769381
95  *
96  *    Revision 1.92.2.11  2003/05/14 12:32:02  oes
97  *    Close jarfile on graceful exit, remove stray line
98  *
99  *    Revision 1.92.2.10  2003/05/08 15:13:46  oes
100  *    Cosmetics: Killed a warning, a typo and an allocation left at exit
101  *
102  *    Revision 1.92.2.9  2003/04/03 15:08:42  oes
103  *    No longer rely on non-POSIX.1 extensions of getcwd().
104  *    Fixes bug #711001
105  *
106  *    Revision 1.92.2.8  2003/03/31 13:12:32  oes
107  *    Replaced setenv() by posix-compliant putenv()
108  *    Thanks to Neil McCalden (nmcc AT users.sf.net).
109  *
110  *    Revision 1.92.2.7  2003/03/17 16:48:59  oes
111  *    Added chroot ability, thanks to patch by Sviatoslav Sviridov
112  *
113  *    Revision 1.92.2.6  2003/03/11 11:55:00  oes
114  *    Clean-up and extension of improvements for forked mode:
115  *     - Child's return code now consists of flags RC_FLAG_*
116  *     - Reporting toggle to parent now properly #ifdef'ed
117  *     - Children now report blocking to parent. This enables
118  *       statistics in forked mode
119  *
120  *    Revision 1.92.2.5  2003/03/10 23:45:32  oes
121  *    Fixed bug #700381: Non-Threaded version now capable of being toggled.
122  *    Children now report having been toggled through _exit(17), parents
123  *    watch for that code and toggle themselves if found.
124  *
125  *    Revision 1.92.2.4  2003/03/07 03:41:04  david__schmidt
126  *    Wrapping all *_r functions (the non-_r versions of them) with 
127  *    mutex semaphores for OSX.  Hopefully this will take care of all 
128  *    of those pesky crash reports.
129  *
130  *    Revision 1.92.2.3  2003/02/28 12:53:06  oes
131  *    Fixed two mostly harmless mem leaks
132  *
133  *    Revision 1.92.2.2  2002/11/20 14:37:47  oes
134  *    Fix: Head of global clients list now initialized to NULL
135  *
136  *    Revision 1.92.2.1  2002/09/25 14:52:24  oes
137  *    Added basic support for OPTIONS and TRACE HTTP methods:
138  *     - New interceptor direct_response() added in chat().
139  *     - sed() moved to earlier in the process, so that the
140  *       Host: header is evaluated before actions and forwarding
141  *       are decided on.
142  *
143  *    Revision 1.92  2002/05/08 16:00:46  oes
144  *    Chat's buffer handling:
145  *     - Fixed bug with unchecked out-of-mem conditions
146  *       while reading client request & server headers
147  *     - No longer predict if the buffer limit will be exceeded
148  *       in the next read -- check add_to_iob's new
149  *       return code. If buffer couldn't be extended
150  *       (policy or out-of-mem) while
151  *       - reading from client: abort
152  *       - reading server headers: send error page
153  *       - buffering server body for filter: flush,
154  *         and if that fails: send error page
155  *
156  *    Revision 1.91  2002/04/08 20:35:58  swa
157  *    fixed JB spelling
158  *
159  *    Revision 1.90  2002/04/02 14:57:28  oes
160  *    Made sending wafers independent of FEATURE_COOKIE_JAR
161  *
162  *    Revision 1.89  2002/03/31 17:18:59  jongfoster
163  *    Win32 only: Enabling STRICT to fix a VC++ compile warning.
164  *
165  *    Revision 1.88  2002/03/27 14:32:43  david__schmidt
166  *    More compiler warning message maintenance
167  *
168  *    Revision 1.87  2002/03/26 22:29:54  swa
169  *    we have a new homepage!
170  *
171  *    Revision 1.86  2002/03/25 17:04:55  david__schmidt
172  *    Workaround for closing the jarfile before load_config() comes around again
173  *
174  *    Revision 1.85  2002/03/24 15:23:33  jongfoster
175  *    Name changes
176  *
177  *    Revision 1.84  2002/03/24 13:25:43  swa
178  *    name change related issues
179  *
180  *    Revision 1.83  2002/03/16 23:54:06  jongfoster
181  *    Adding graceful termination feature, to help look for memory leaks.
182  *    If you enable this (which, by design, has to be done by hand
183  *    editing config.h) and then go to http://i.j.b/die, then the program
184  *    will exit cleanly after the *next* request.  It should free all the
185  *    memory that was used.
186  *
187  *    Revision 1.82  2002/03/13 00:27:05  jongfoster
188  *    Killing warnings
189  *
190  *    Revision 1.81  2002/03/12 01:42:50  oes
191  *    Introduced modular filters
192  *
193  *    Revision 1.80  2002/03/11 22:07:05  david__schmidt
194  *    OS/2 port maintenance:
195  *    - Fixed EMX build - it had decayed a little
196  *    - Fixed inexplicable crash during FD_ZERO - must be due to a bad macro.
197  *      substituted a memset for now.
198  *
199  *    Revision 1.79  2002/03/09 20:03:52  jongfoster
200  *    - Making various functions return int rather than size_t.
201  *      (Undoing a recent change).  Since size_t is unsigned on
202  *      Windows, functions like read_socket that return -1 on
203  *      error cannot return a size_t.
204  *
205  *      THIS WAS A MAJOR BUG - it caused frequent, unpredictable
206  *      crashes, and also frequently caused JB to jump to 100%
207  *      CPU and stay there.  (Because it thought it had just
208  *      read ((unsigned)-1) == 4Gb of data...)
209  *
210  *    - The signature of write_socket has changed, it now simply
211  *      returns success=0/failure=nonzero.
212  *
213  *    - Trying to get rid of a few warnings --with-debug on
214  *      Windows, I've introduced a new type "jb_socket".  This is
215  *      used for the socket file descriptors.  On Windows, this
216  *      is SOCKET (a typedef for unsigned).  Everywhere else, it's
217  *      an int.  The error value can't be -1 any more, so it's
218  *      now JB_INVALID_SOCKET (which is -1 on UNIX, and in
219  *      Windows it maps to the #define INVALID_SOCKET.)
220  *
221  *    - The signature of bind_port has changed.
222  *
223  *    Revision 1.78  2002/03/08 21:35:04  oes
224  *    Added optional group supplement to --user option. Will now use default group of user if no group given
225  *
226  *    Revision 1.77  2002/03/07 03:52:06  oes
227  *     - Fixed compiler warnings etc
228  *     - Improved handling of failed DNS lookups
229  *
230  *    Revision 1.76  2002/03/06 22:54:35  jongfoster
231  *    Automated function-comment nitpicking.
232  *
233  *    Revision 1.75  2002/03/06 10:02:19  oes
234  *    Fixed stupid bug when --user was not given
235  *
236  *    Revision 1.74  2002/03/06 00:49:31  jongfoster
237  *    Fixing warning on Windows
238  *    Making #ifdefs that refer to the same variable consistently
239  *    use #ifdef unix rather than mixing #ifdef unix & #ifndef OS2
240  *
241  *    Revision 1.73  2002/03/05 23:57:30  hal9
242  *    Stray character 's' on line 1618 was breaking build.
243  *
244  *    Revision 1.72  2002/03/05 21:33:45  david__schmidt
245  *    - Re-enable OS/2 building after new parms were added
246  *    - Fix false out of memory report when resolving CGI templates when no IP
247  *      address is available of failed attempt (a la no such domain)
248  *
249  *    Revision 1.71  2002/03/05 18:13:56  oes
250  *    Added --user option
251  *
252  *    Revision 1.70  2002/03/05 04:52:42  oes
253  *    Deleted non-errlog debugging code
254  *
255  *    Revision 1.69  2002/03/04 23:50:00  jongfoster
256  *    Splitting off bind_port() call into bind_port_helper(), with
257  *    improved logging.
258  *
259  *    Revision 1.68  2002/03/04 20:17:32  oes
260  *    Fixed usage info
261  *
262  *    Revision 1.67  2002/03/04 18:18:57  oes
263  *    - Removed _DEBUG mode
264  *    - Cleand up cmdline parsing
265  *    - Introduced --no-daemon, --pidfile options
266  *    - Cleaned up signal handling:
267  *      - Terminate cleanly on INT, TERM and ABRT
268  *      - Schedule logfile for re-opening on HUP
269  *      - Ignore CHLD and PIPE
270  *      - Leave the rest with their default handlers
271  *      - Uniform handler registration
272  *    - Added usage() function
273  *    - Played styleguide police
274  *
275  *    Revision 1.66  2002/03/03 15:06:55  oes
276  *    Re-enabled automatic config reloading
277  *
278  *    Revision 1.65  2002/03/03 14:49:11  oes
279  *    Fixed CLF logging: Now uses client's original HTTP request
280  *
281  *    Revision 1.64  2002/03/03 09:18:03  joergs
282  *    Made jumbjuster work on AmigaOS again.
283  *
284  *    Revision 1.63  2002/03/02 04:14:50  david__schmidt
285  *    Clean up a little CRLF unpleasantness that suddenly appeared
286  *
287  *    Revision 1.62  2002/02/20 23:17:23  jongfoster
288  *    Detecting some out-of memory conditions and exiting with a log message.
289  *
290  *    Revision 1.61  2002/01/17 21:01:52  jongfoster
291  *    Moving all our URL and URL pattern parsing code to urlmatch.c.
292  *
293  *    Revision 1.60  2001/12/30 14:07:32  steudten
294  *    - Add signal handling (unix)
295  *    - Add SIGHUP handler (unix)
296  *    - Add creation of pidfile (unix)
297  *    - Add action 'top' in rc file (RH)
298  *    - Add entry 'SIGNALS' to manpage
299  *    - Add exit message to logfile (unix)
300  *
301  *    Revision 1.59  2001/12/13 14:07:18  oes
302  *    Fixed Bug: 503 error page now sent OK
303  *
304  *    Revision 1.58  2001/11/30 23:37:24  jongfoster
305  *    Renaming the Win32 config file to config.txt - this is almost the
306  *    same as the corresponding UNIX name "config"
307  *
308  *    Revision 1.57  2001/11/16 00:47:43  jongfoster
309  *    Changing the tty-disconnection code to use setsid().
310  *
311  *    Revision 1.56  2001/11/13 20:20:54  jongfoster
312  *    Tabs->spaces, fixing a bug with missing {} around an if()
313  *
314  *    Revision 1.55  2001/11/13 20:14:53  jongfoster
315  *    Patch for FreeBSD setpgrp() as suggested by Alexander Lazic
316  *
317  *    Revision 1.54  2001/11/07 00:03:14  steudten
318  *    Give reliable return value if an error
319  *    occurs not just 0 with new daemon mode.
320  *
321  *    Revision 1.53  2001/11/05 21:41:43  steudten
322  *    Add changes to be a real daemon just for unix os.
323  *    (change cwd to /, detach from controlling tty, set
324  *    process group and session leader to the own process.
325  *    Add DBG() Macro.
326  *    Add some fatal-error log message for failed malloc().
327  *    Add '-d' if compiled with 'configure --with-debug' to
328  *    enable debug output.
329  *
330  *    Revision 1.52  2001/10/26 20:11:20  jongfoster
331  *    Fixing type mismatch
332  *
333  *    Revision 1.51  2001/10/26 17:38:28  oes
334  *    Cosmetics
335  *
336  *    Revision 1.50  2001/10/25 03:40:48  david__schmidt
337  *    Change in porting tactics: OS/2's EMX porting layer doesn't allow multiple
338  *    threads to call select() simultaneously.  So, it's time to do a real, live,
339  *    native OS/2 port.  See defines for __EMX__ (the porting layer) vs. __OS2__
340  *    (native). Both versions will work, but using __OS2__ offers multi-threading.
341  *
342  *    Revision 1.49  2001/10/23 21:41:35  jongfoster
343  *    Added call to initialize the (statically-allocated of course)
344  *    "out of memory" CGI response.
345  *
346  *    Revision 1.48  2001/10/10 19:56:46  jongfoster
347  *    Moving some code that wasn't cookie-related out of an #ifdef
348  *    FEATURE_COOKIE_JAR
349  *
350  *    Revision 1.47  2001/10/10 16:44:36  oes
351  *    Added CONNECT destination port limitation check
352  *
353  *    Revision 1.46  2001/10/08 15:17:41  oes
354  *    Re-enabled SSL forwarding
355  *
356  *    Revision 1.45  2001/10/07 15:42:11  oes
357  *    Replaced 6 boolean members of csp with one bitmap (csp->flags)
358  *
359  *    Moved downgrading of the HTTP version from parse_http_request to
360  *      chat(), since we can't decide if it is necessary before we have
361  *      determined the actions for the URL. The HTTP command is now
362  *      *always* re-built so the repairs need no longer be special-cased.
363  *
364  *    filter_popups now gets a csp pointer so it can raise the new
365  *      CSP_FLAG_MODIFIED flag.
366  *
367  *    Bugfix
368  *
369  *    Added configurable size limit for the IOB. If the IOB grows so
370  *      large that the next read would exceed the limit, the header
371  *      is generated, and the header & unfiltered buffer are flushed
372  *      to the client. Chat then continues in non-buffering,
373  *      non-filtering body mode.
374  *
375  *    Revision 1.44  2001/10/02 18:13:57  oes
376  *    Ooops
377  *
378  *    Revision 1.43  2001/10/02 15:32:13  oes
379  *    Moved generation of hdr
380  *
381  *    Revision 1.42  2001/09/21 23:02:02  david__schmidt
382  *    Cleaning up 2 compiler warnings on OS/2.
383  *
384  *    Revision 1.41  2001/09/16 17:05:14  jongfoster
385  *    Removing unused #include showarg.h
386  *
387  *    Revision 1.40  2001/09/16 15:41:45  jongfoster
388  *    Fixing signed/unsigned comparison warning.
389  *
390  *    Revision 1.39  2001/09/16 13:21:27  jongfoster
391  *    Changes to use new list functions.
392  *
393  *    Revision 1.38  2001/09/16 13:01:46  jongfoster
394  *    Removing redundant function call that zeroed zalloc()'d memory.
395  *
396  *    Revision 1.37  2001/09/10 11:12:24  oes
397  *    Deleted unused variable
398  *
399  *    Revision 1.36  2001/09/10 10:56:15  oes
400  *    Silenced compiler warnings
401  *
402  *    Revision 1.35  2001/07/31 14:44:22  oes
403  *    Deleted unused size parameter from filter_popups()
404  *
405  *    Revision 1.34  2001/07/30 22:08:36  jongfoster
406  *    Tidying up #defines:
407  *    - All feature #defines are now of the form FEATURE_xxx
408  *    - Permanently turned off WIN_GUI_EDIT
409  *    - Permanently turned on WEBDAV and SPLIT_PROXY_ARGS
410  *
411  *    Revision 1.33  2001/07/29 19:32:00  jongfoster
412  *    Renaming _main() [mingw32 only] to real_main(), for ANSI compliance.
413  *
414  *    Revision 1.32  2001/07/29 18:47:05  jongfoster
415  *    Adding missing #include "loadcfg.h"
416  *
417  *    Revision 1.31  2001/07/29 12:17:48  oes
418  *    Applied pthread fix by Paul Lieverse
419  *
420  *    Revision 1.30  2001/07/25 22:57:13  jongfoster
421  *    __BEOS__ no longer overrides FEATURE_PTHREAD.
422  *    This is because FEATURE_PTHREAD will soon be widely used, so I
423  *    want to keep it simple.
424  *
425  *    Revision 1.29  2001/07/24 12:47:06  oes
426  *    Applied BeOS support update by Eugenia
427  *
428  *    Revision 1.28  2001/07/23 13:26:12  oes
429  *    Fixed bug in popup-killing for the first read that caused binary garbage to be sent between headers and body
430  *
431  *    Revision 1.27  2001/07/19 19:09:47  haroon
432  *    - Added code to take care of the situation where while processing the first
433  *      server response (which includes the server header), after finding the end
434  *      of the headers we were not looking past the end of the headers for
435  *      content modification. I enabled it for filter_popups.
436  *      Someone else should look to see if other similar operations should be
437  *      done to the discarded portion of the buffer.
438  *
439  *      Note 2001/07/20: No, the other content modification mechanisms will process
440  *                       the whole iob later anyway. --oes
441  *
442  *    Revision 1.26  2001/07/18 12:31:36  oes
443  *    cosmetics
444  *
445  *    Revision 1.25  2001/07/15 19:43:49  jongfoster
446  *    Supports POSIX threads.
447  *    Also removed some unused #includes.
448  *
449  *    Revision 1.24  2001/07/13 14:00:40  oes
450  *     - Generic content modification scheme:
451  *       Each feature has its own applicability flag that is set
452  *       from csp->action->flags.
453  *       Replaced the "filtering" int flag , by a function pointer
454  *       "content_filter" to the function that will do the content
455  *       modification. If it is != NULL, the document will be buffered
456  *       and processed through *content_filter, which must set
457  *       csp->content_length and return a modified copy of the body
458  *       or return NULL (on failiure).
459  *     - Changed csp->is_text to the more generic bitmap csp->content_type
460  *       which can currently take the valued CT_TEXT or CT_GIF
461  *     - Reformatting etc
462  *     - Removed all #ifdef PCRS
463  *
464  *    Revision 1.23  2001/07/02 02:28:25  iwanttokeepanon
465  *    Added "#ifdef ACL_FILES" conditional compilation to line 1291 to exclude
466  *    the `block_acl' call.  This prevents a compilation error when the user
467  *    does not wish to use the "ACL" feature.
468  *
469  *    Revision 1.22  2001/06/29 21:45:41  oes
470  *    Indentation, CRLF->LF, Tab-> Space
471  *
472  *    Revision 1.21  2001/06/29 13:29:36  oes
473  *    - Cleaned up, improved comments
474  *    - Unified all possible interceptors (CGI,
475  *      block, trust, fast_redirect) in one
476  *      place, with one (CGI) answer generation
477  *      mechansim. Much clearer now.
478  *    - Removed the GIF image generation, which
479  *      is now done in filters.c:block_url()
480  *    - Made error conditions like domain lookup
481  *      failiure or (various) problems while talking
482  *      to the server use cgi.c:error_response()
483  *      instead of generating HTML/HTTP in chat() (yuck!)
484  *    - Removed logentry from cancelled commit
485  *
486  *    Revision 1.20  2001/06/09 10:55:28  jongfoster
487  *    Changing BUFSIZ ==> BUFFER_SIZE
488  *
489  *    Revision 1.19  2001/06/07 23:12:52  jongfoster
490  *    Replacing function pointer in struct gateway with a directly
491  *    called function forwarded_connect().
492  *    Replacing struct gateway with struct forward_spec
493  *
494  *    Revision 1.18  2001/06/03 19:12:16  oes
495  *    introduced new cgi handling
496  *
497  *    Revision 1.17  2001/06/01 20:07:23  jongfoster
498  *    Now uses action +image-blocker{} rather than config->tinygif
499  *
500  *    Revision 1.16  2001/06/01 18:49:17  jongfoster
501  *    Replaced "list_share" with "list" - the tiny memory gain was not
502  *    worth the extra complexity.
503  *
504  *    Revision 1.15  2001/05/31 21:24:47  jongfoster
505  *    Changed "permission" to "action" throughout.
506  *    Removed DEFAULT_USER_AGENT - it must now be specified manually.
507  *    Moved vanilla wafer check into chat(), since we must now
508  *    decide whether or not to add it based on the URL.
509  *
510  *    Revision 1.14  2001/05/29 20:14:01  joergs
511  *    AmigaOS bugfix: PCRS needs a lot of stack, stacksize for child threads
512  *    increased.
513  *
514  *    Revision 1.13  2001/05/29 09:50:24  jongfoster
515  *    Unified blocklist/imagelist/permissionslist.
516  *    File format is still under discussion, but the internal changes
517  *    are (mostly) done.
518  *
519  *    Also modified interceptor behaviour:
520  *    - We now intercept all URLs beginning with one of the following
521  *      prefixes (and *only* these prefixes):
522  *        * http://i.j.b/
523  *        * http://ijbswa.sf.net/config/
524  *        * http://ijbswa.sourceforge.net/config/
525  *    - New interceptors "home page" - go to http://i.j.b/ to see it.
526  *    - Internal changes so that intercepted and fast redirect pages
527  *      are not replaced with an image.
528  *    - Interceptors now have the option to send a binary page direct
529  *      to the client. (i.e. ijb-send-banner uses this)
530  *    - Implemented show-url-info interceptor.  (Which is why I needed
531  *      the above interceptors changes - a typical URL is
532  *      "http://i.j.b/show-url-info?url=www.somesite.com/banner.gif".
533  *      The previous mechanism would not have intercepted that, and
534  *      if it had been intercepted then it then it would have replaced
535  *      it with an image.)
536  *
537  *    Revision 1.12  2001/05/27 22:17:04  oes
538  *
539  *    - re_process_buffer no longer writes the modified buffer
540  *      to the client, which was very ugly. It now returns the
541  *      buffer, which it is then written by chat.
542  *
543  *    - content_length now adjusts the Content-Length: header
544  *      for modified documents rather than crunch()ing it.
545  *      (Length info in csp->content_length, which is 0 for
546  *      unmodified documents)
547  *
548  *    - For this to work, sed() is called twice when filtering.
549  *
550  *    Revision 1.11  2001/05/26 17:27:53  jongfoster
551  *    Added support for CLF and fixed LOG_LEVEL_LOG.
552  *    Also did CRLF->LF fix of my previous patch.
553  *
554  *    Revision 1.10  2001/05/26 15:26:15  jongfoster
555  *    ACL feature now provides more security by immediately dropping
556  *    connections from untrusted hosts.
557  *
558  *    Revision 1.9  2001/05/26 00:28:36  jongfoster
559  *    Automatic reloading of config file.
560  *    Removed obsolete SIGHUP support (Unix) and Reload menu option (Win32).
561  *    Most of the global variables have been moved to a new
562  *    struct configuration_spec, accessed through csp->config->globalname
563  *    Most of the globals remaining are used by the Win32 GUI.
564  *
565  *    Revision 1.8  2001/05/25 22:43:18  jongfoster
566  *    Fixing minor memory leak and buffer overflow.
567  *
568  *    Revision 1.7  2001/05/25 22:34:30  jongfoster
569  *    Hard tabs->Spaces
570  *
571  *    Revision 1.6  2001/05/23 00:13:58  joergs
572  *    AmigaOS support fixed.
573  *
574  *    Revision 1.5  2001/05/22 18:46:04  oes
575  *
576  *    - Enabled filtering banners by size rather than URL
577  *      by adding patterns that replace all standard banner
578  *      sizes with the "Junkbuster" gif to the re_filterfile
579  *
580  *    - Enabled filtering WebBugs by providing a pattern
581  *      which kills all 1x1 images
582  *
583  *    - Added support for PCRE_UNGREEDY behaviour to pcrs,
584  *      which is selected by the (nonstandard and therefore
585  *      capital) letter 'U' in the option string.
586  *      It causes the quantifiers to be ungreedy by default.
587  *      Appending a ? turns back to greedy (!).
588  *
589  *    - Added a new interceptor ijb-send-banner, which
590  *      sends back the "Junkbuster" gif. Without imagelist or
591  *      MSIE detection support, or if tinygif = 1, or the
592  *      URL isn't recognized as an imageurl, a lame HTML
593  *      explanation is sent instead.
594  *
595  *    - Added new feature, which permits blocking remote
596  *      script redirects and firing back a local redirect
597  *      to the browser.
598  *      The feature is conditionally compiled, i.e. it
599  *      can be disabled with --disable-fast-redirects,
600  *      plus it must be activated by a "fast-redirects"
601  *      line in the config file, has its own log level
602  *      and of course wants to be displayed by show-proxy-args
603  *      Note: Boy, all the #ifdefs in 1001 locations and
604  *      all the fumbling with configure.in and acconfig.h
605  *      were *way* more work than the feature itself :-(
606  *
607  *    - Because a generic redirect template was needed for
608  *      this, tinygif = 3 now uses the same.
609  *
610  *    - Moved GIFs, and other static HTTP response templates
611  *      to project.h
612  *
613  *    - Some minor fixes
614  *
615  *    - Removed some >400 CRs again (Jon, you really worked
616  *      a lot! ;-)
617  *
618  *    Revision 1.4  2001/05/21 19:34:01  jongfoster
619  *    Made failure to bind() a fatal error.
620  *
621  *    Revision 1.3  2001/05/20 01:21:20  jongfoster
622  *    Version 2.9.4 checkin.
623  *    - Merged popupfile and cookiefile, and added control over PCRS
624  *      filtering, in new "permissionsfile".
625  *    - Implemented LOG_LEVEL_FATAL, so that if there is a configuration
626  *      file error you now get a message box (in the Win32 GUI) rather
627  *      than the program exiting with no explanation.
628  *    - Made killpopup use the PCRS MIME-type checking and HTTP-header
629  *      skipping.
630  *    - Removed tabs from "config"
631  *    - Moved duplicated url parsing code in "loaders.c" to a new funcition.
632  *    - Bumped up version number.
633  *
634  *    Revision 1.2  2001/05/17 22:34:44  oes
635  *     - Added hint on GIF char array generation to jcc.c
636  *     - Cleaned CRLF's from the sources and related files
637  *     - Repaired logging for REF and FRC
638  *
639  *    Revision 1.1.1.1  2001/05/15 13:58:56  oes
640  *    Initial import of version 2.9.3 source tree
641  *
642  *
643  *********************************************************************/
644 \f
645
646 #include "config.h"
647
648 #include <stdio.h>
649 #include <sys/types.h>
650 #include <stdlib.h>
651 #include <string.h>
652 #include <signal.h>
653 #include <fcntl.h>
654 #include <errno.h>
655
656 #ifdef FEATURE_PTHREAD
657 #include <pthread.h>
658 #endif /* def FEATURE_PTHREAD */
659
660 #ifdef _WIN32
661 # ifndef FEATURE_PTHREAD
662 #  ifndef STRICT
663 #   define STRICT
664 #  endif
665 #  include <windows.h>
666 #  include <process.h>
667 # endif /* ndef FEATURE_PTHREAD */
668
669 # include "win32.h"
670 # ifndef _WIN_CONSOLE
671 #  include "w32log.h"
672 # endif /* ndef _WIN_CONSOLE */
673 # include "w32svrapi.h"
674
675 #else /* ifndef _WIN32 */
676
677 # if !defined (__OS2__)
678 # include <unistd.h>
679 # include <sys/wait.h>
680 # endif /* ndef __OS2__ */
681 # include <sys/time.h>
682 # include <sys/stat.h>
683 # include <sys/ioctl.h>
684
685 #ifdef sun
686 #include <sys/termios.h>
687 #endif /* sun */
688
689 #ifdef unix
690 #include <pwd.h>
691 #include <grp.h>
692 #endif
693
694 # include <signal.h>
695
696 # ifdef __BEOS__
697 #  include <socket.h>  /* BeOS has select() for sockets only. */
698 #  include <OS.h>      /* declarations for threads and stuff. */
699 # endif
700
701 # if defined(__EMX__) || defined(__OS2__)
702 #  include <sys/select.h>  /* OS/2/EMX needs a little help with select */
703 # endif
704 # ifdef __OS2__
705 #define INCL_DOS
706 # include <os2.h>
707 #define bzero(B,N) memset(B,0x00,n)
708 # endif
709
710 # ifndef FD_ZERO
711 #  include <select.h>
712 # endif
713
714 #endif
715
716 #include "project.h"
717 #include "list.h"
718 #include "jcc.h"
719 #include "filters.h"
720 #include "loaders.h"
721 #include "parsers.h"
722 #include "killpopup.h"
723 #include "miscutil.h"
724 #include "errlog.h"
725 #include "jbsockets.h"
726 #include "gateway.h"
727 #include "actions.h"
728 #include "cgi.h"
729 #include "loadcfg.h"
730 #include "urlmatch.h"
731
732 const char jcc_h_rcs[] = JCC_H_VERSION;
733 const char project_h_rcs[] = PROJECT_H_VERSION;
734
735 int no_daemon = 0;
736 struct client_state  clients[1];
737 struct file_list     files[1];
738
739 #ifdef FEATURE_STATISTICS
740 int urls_read     = 0;     /* total nr of urls read inc rejected */
741 int urls_rejected = 0;     /* total nr of urls rejected */
742 #endif /* def FEATURE_STATISTICS */
743
744 #ifdef FEATURE_GRACEFUL_TERMINATION
745 int g_terminate = 0;
746 #endif
747
748 static void listen_loop(void);
749 static void chat(struct client_state *csp);
750 #ifdef AMIGA
751 void serve(struct client_state *csp);
752 #else /* ifndef AMIGA */
753 static void serve(struct client_state *csp);
754 #endif /* def AMIGA */
755
756 #ifdef __BEOS__
757 static int32 server_thread(void *data);
758 #endif /* def __BEOS__ */
759
760 #ifdef _WIN32
761 #define sleep(N)  Sleep(((N) * 1000))
762 #endif
763
764 #ifdef __OS2__
765 #define sleep(N)  DosSleep(((N) * 100))
766 #endif
767
768 #if defined(OSX_DARWIN) || defined(__OpenBSD__)
769 #ifdef OSX_DARWIN
770 /*
771  * Hit OSX over the head with a hammer.  Protect all *_r functions.
772  */
773 pthread_mutex_t gmtime_mutex;
774 pthread_mutex_t localtime_mutex;
775 #endif /* def OSX_DARWIN */
776 /*
777  * Protect only the resolve functions for OpenBSD.
778  */ 
779 pthread_mutex_t gethostbyaddr_mutex;
780 pthread_mutex_t gethostbyname_mutex;
781 #endif /* defined(OSX_DARWIN) || defined(__OpenBSD__) */
782
783 #ifdef FEATURE_PTHREAD
784 pthread_mutex_t log_mutex;
785 pthread_mutex_t log_init_mutex;
786 #endif /* FEATURE_PTHREAD */
787
788 #if defined(unix) || defined(__EMX__)
789 const char *basedir = NULL;
790 const char *pidfile = NULL;
791 int received_hup_signal = 0;
792 #endif /* defined unix */
793
794 /* The vanilla wafer. */
795 static const char VANILLA_WAFER[] =
796    "NOTICE=TO_WHOM_IT_MAY_CONCERN_"
797    "Do_not_send_me_any_copyrighted_information_other_than_the_"
798    "document_that_I_am_requesting_or_any_of_its_necessary_components._"
799    "In_particular_do_not_send_me_any_cookies_that_"
800    "are_subject_to_a_claim_of_copyright_by_anybody._"
801    "Take_notice_that_I_refuse_to_be_bound_by_any_license_condition_"
802    "(copyright_or_otherwise)_applying_to_any_cookie._";
803
804
805 #if !defined(_WIN32) && !defined(__OS2__) && !defined(AMIGA)
806 /*********************************************************************
807  *
808  * Function    :  sig_handler 
809  *
810  * Description :  Signal handler for different signals.
811  *                Exit gracefully on ABRT, TERM and  INT
812  *                or set a flag that will cause the errlog
813  *                to be reopened by the main thread on HUP.
814  *
815  * Parameters  :
816  *          1  :  the_signal = the signal cause this function to call
817  *
818  * Returns     :  - 
819  *
820  *********************************************************************/
821 static void sig_handler(int the_signal)
822 {
823    switch(the_signal)
824    {
825       case SIGABRT:
826       case SIGTERM:
827       case SIGINT:
828          log_error(LOG_LEVEL_INFO, "exiting by signal %d .. bye", the_signal);
829 #if defined(unix)
830          unlink(pidfile);
831 #endif /* unix */
832          exit(the_signal);
833          break;
834
835       case SIGHUP:
836          received_hup_signal = 1;
837          break;         
838
839       default:
840          /* 
841           * We shouldn't be here, unless we catch signals
842           * in main() that we can't handle here!
843           */
844          log_error(LOG_LEVEL_FATAL, "sig_handler: exiting on unexpected signal %d", the_signal);
845    }
846    return;
847
848 }
849 #endif
850
851
852 /*********************************************************************
853  *
854  * Function    :  chat
855  *
856  * Description :  Once a connection to the client has been accepted,
857  *                this function is called (via serve()) to handle the
858  *                main business of the communication.  When this
859  *                function returns, the caller must close the client
860  *                socket handle.
861  *
862  * Parameters  :
863  *          1  :  csp = Current client state (buffers, headers, etc...)
864  *
865  * Returns     :  On success, the number of bytes written are returned (zero
866  *                indicates nothing was written).  On error, -1 is returned,
867  *                and errno is set appropriately.  If count is zero and the
868  *                file descriptor refers to a regular file, 0 will be
869  *                returned without causing any other effect.  For a special
870  *                file, the results are not portable.
871  *
872  *********************************************************************/
873 static void chat(struct client_state *csp)
874 {
875 /*
876  * This next lines are a little ugly, but they simplifies the if statements
877  * below.  Basically if TOGGLE, then we want the if to test if the
878  * CSP_FLAG_TOGGLED_ON flag ist set, else we don't.  And if FEATURE_FORCE_LOAD,
879  * then we want the if to test for CSP_FLAG_FORCED , else we don't
880  */
881 #ifdef FEATURE_TOGGLE
882 #   define IS_TOGGLED_ON_AND (csp->flags & CSP_FLAG_TOGGLED_ON) &&
883 #else /* ifndef FEATURE_TOGGLE */
884 #   define IS_TOGGLED_ON_AND
885 #endif /* ndef FEATURE_TOGGLE */
886 #ifdef FEATURE_FORCE_LOAD
887 #   define IS_NOT_FORCED_AND !(csp->flags & CSP_FLAG_FORCED) &&
888 #else /* ifndef FEATURE_FORCE_LOAD */
889 #   define IS_NOT_FORCED_AND
890 #endif /* def FEATURE_FORCE_LOAD */
891
892 #define IS_ENABLED_AND   IS_TOGGLED_ON_AND IS_NOT_FORCED_AND
893
894    char buf[BUFFER_SIZE];
895    char *hdr;
896    char *p;
897    char *req;
898    fd_set rfds;
899    int n;
900    jb_socket maxfd;
901    int server_body;
902    int ms_iis5_hack = 0;
903    int byte_count = 0;
904    unsigned int socks_retries = 0;
905    const struct forward_spec * fwd;
906    struct http_request *http;
907    int len; /* for buffer sizes */
908 #ifdef FEATURE_KILL_POPUPS
909    int block_popups;         /* bool, 1==will block popups */
910    int block_popups_now = 0; /* bool, 1==currently blocking popups */
911 #endif /* def FEATURE_KILL_POPUPS */
912
913    int pcrs_filter;        /* bool, 1==will filter through pcrs */
914    int gif_deanimate;      /* bool, 1==will deanimate gifs */
915    int jpeg_inspect;       /* bool, 1==will inspect jpegs */
916
917    /* Function that does the content filtering for the current request */
918    char *(*content_filter)() = NULL;
919
920    /* Skeleton for HTTP response, if we should intercept the request */
921    struct http_response *rsp;
922
923    http = csp->http;
924
925    /*
926     * Read the client's request.  Note that since we're not using select() we
927     * could get blocked here if a client connected, then didn't say anything!
928     */
929
930    for (;;)
931    {
932       len = read_socket(csp->cfd, buf, sizeof(buf));
933
934       if (len <= 0) break;      /* error! */
935       
936       /*
937        * If there is no memory left for buffering the
938        * request, there is nothing we can do but hang up
939        */
940       if (add_to_iob(csp, buf, len))
941       {
942          return;
943       }
944
945       req = get_header(csp);
946
947       if (req == NULL)
948       {
949          break;    /* no HTTP request! */
950       }
951
952       if (*req == '\0')
953       {
954          continue;   /* more to come! */
955       }
956
957 #ifdef FEATURE_FORCE_LOAD
958       /* If this request contains the FORCE_PREFIX,
959        * better get rid of it now and set the force flag --oes
960        */
961
962       if (strstr(req, FORCE_PREFIX))
963       {
964          strclean(req, FORCE_PREFIX);
965          log_error(LOG_LEVEL_FORCE, "Enforcing request \"%s\".\n", req);
966          csp->flags |= CSP_FLAG_FORCED;
967       }
968
969 #endif /* def FEATURE_FORCE_LOAD */
970
971       parse_http_request(req, http, csp);
972       freez(req);
973       break;
974    }
975
976    if (http->cmd == NULL)
977    {
978       strcpy(buf, CHEADER);
979       write_socket(csp->cfd, buf, strlen(buf));
980
981       log_error(LOG_LEVEL_CLF, "%s - - [%T] \" \" 400 0", csp->ip_addr_str);
982
983       free_http_request(http);
984       return;
985    }
986
987    /* decide how to route the HTTP request */
988
989    if ((fwd = forward_url(http, csp)) == NULL)
990    {
991       log_error(LOG_LEVEL_FATAL, "gateway spec is NULL!?!?  This can't happen!");
992       /* Never get here - LOG_LEVEL_FATAL causes program exit */
993    }
994
995    /* build the http request to send to the server
996     * we have to do one of the following:
997     *
998     * create = use the original HTTP request to create a new
999     *          HTTP request that has either the path component
1000     *          without the http://domainspec (w/path) or the
1001     *          full orininal URL (w/url)
1002     *          Note that the path and/or the HTTP version may
1003     *          have been altered by now.
1004     *
1005     * connect = Open a socket to the host:port of the server
1006     *           and short-circuit server and client socket.
1007     *
1008     * pass =  Pass the request unchanged if forwarding a CONNECT
1009     *         request to a parent proxy. Note that we'll be sending
1010     *         the CFAIL message ourselves if connecting to the parent
1011     *         fails, but we won't send a CSUCCEED message if it works,
1012     *         since that would result in a double message (ours and the
1013     *         parent's). After sending the request to the parent, we simply
1014     *         tunnel.
1015     *
1016     * here's the matrix:
1017     *                        SSL
1018     *                    0        1
1019     *                +--------+--------+
1020     *                |        |        |
1021     *             0  | create | connect|
1022     *                | w/path |        |
1023     *  Forwarding    +--------+--------+
1024     *                |        |        |
1025     *             1  | create | pass   |
1026     *                | w/url  |        |
1027     *                +--------+--------+
1028     *
1029     */
1030
1031    /*
1032     * Determine the actions for this URL
1033     */
1034 #ifdef FEATURE_TOGGLE
1035    if (!(csp->flags & CSP_FLAG_TOGGLED_ON))
1036    {
1037       /* Most compatible set of actions (i.e. none) */
1038       init_current_action(csp->action);
1039    }
1040    else
1041 #endif /* ndef FEATURE_TOGGLE */
1042    {
1043       url_actions(http, csp);
1044    }
1045
1046
1047    /*
1048     * Check if a CONNECT request is allowable:
1049     * In the absence of a +limit-connect action, allow only port 443.
1050     * If there is an action, allow whatever matches the specificaton.
1051     */
1052    if(http->ssl)
1053    {
1054       if(  ( !(csp->action->flags & ACTION_LIMIT_CONNECT) && csp->http->port != 443)
1055            || (csp->action->flags & ACTION_LIMIT_CONNECT
1056               && !match_portlist(csp->action->string[ACTION_STRING_LIMIT_CONNECT], csp->http->port)) )
1057       {
1058          if (csp->action->flags & ACTION_TREAT_FORBIDDEN_CONNECTS_LIKE_BLOCKS)
1059          {
1060             /* The response will violate the specs, but makes unblocking easier. */
1061             log_error(LOG_LEVEL_ERROR, "Marking suspicious CONNECT request from %s for blocking.",
1062                csp->ip_addr_str);
1063             csp->action->flags |= ACTION_BLOCK;
1064             http->ssl = 0;
1065          }
1066          else
1067          {
1068             strcpy(buf, CFORBIDDEN);
1069             write_socket(csp->cfd, buf, strlen(buf));
1070             log_error(LOG_LEVEL_CONNECT, "Denying suspicious CONNECT request from %s", csp->ip_addr_str);
1071             log_error(LOG_LEVEL_CLF, "%s - - [%T] \" \" 403 0", csp->ip_addr_str);
1072             return;
1073          }
1074       }
1075    }
1076
1077
1078    /*
1079     * Downgrade http version from 1.1 to 1.0 if +downgrade
1080     * action applies
1081     */
1082    if ( (http->ssl == 0)
1083      && (!strcmpic(http->ver, "HTTP/1.1"))
1084      && (csp->action->flags & ACTION_DOWNGRADE))
1085    {
1086       freez(http->ver);
1087       http->ver = strdup("HTTP/1.0");
1088
1089       if (http->ver == NULL)
1090       {
1091          log_error(LOG_LEVEL_FATAL, "Out of memory downgrading HTTP version");
1092       }
1093    }
1094
1095    /* 
1096     * Save a copy of the original request for logging
1097     */
1098    http->ocmd = strdup(http->cmd);
1099
1100    if (http->ocmd == NULL)
1101    {
1102       log_error(LOG_LEVEL_FATAL, "Out of memory copying HTTP request line");
1103    }
1104
1105    /*
1106     * (Re)build the HTTP request for non-SSL requests.
1107     * If forwarding, use the whole URL, else, use only the path.
1108     */
1109    if (http->ssl == 0)
1110    {
1111       freez(http->cmd);
1112
1113       http->cmd = strdup(http->gpc);
1114       string_append(&http->cmd, " ");
1115
1116       if (fwd->forward_host)
1117       {
1118          string_append(&http->cmd, http->url);
1119       }
1120       else
1121       {
1122          string_append(&http->cmd, http->path);
1123       }
1124       string_append(&http->cmd, " ");
1125       string_append(&http->cmd, http->ver);
1126
1127       if (http->cmd == NULL)
1128       {
1129          log_error(LOG_LEVEL_FATAL, "Out of memory writing HTTP command");
1130       }
1131       log_error(LOG_LEVEL_HEADER, "New HTTP Request-Line: %s", http->cmd);
1132    }
1133    enlist(csp->headers, http->cmd);
1134
1135
1136    /*
1137     * If the user has not supplied any wafers, and the user has not
1138     * told us to suppress the vanilla wafer, then send the vanilla wafer.
1139     */
1140    if (list_is_empty(csp->action->multi[ACTION_MULTI_WAFER])
1141        && ((csp->action->flags & ACTION_VANILLA_WAFER) != 0))
1142    {
1143       enlist(csp->action->multi[ACTION_MULTI_WAFER], VANILLA_WAFER);
1144    }
1145
1146
1147 #ifdef FEATURE_KILL_POPUPS
1148    block_popups               = ((csp->action->flags & ACTION_NO_POPUPS) != 0);
1149 #endif /* def FEATURE_KILL_POPUPS */
1150
1151    pcrs_filter                = (csp->rlist != NULL) &&  /* There are expressions to be used */
1152                                 (!list_is_empty(csp->action->multi[ACTION_MULTI_FILTER]));
1153
1154    gif_deanimate              = ((csp->action->flags & ACTION_DEANIMATE) != 0);
1155
1156    jpeg_inspect               = ((csp->action->flags & ACTION_JPEG_INSPECT) != 0);
1157
1158    /* grab the rest of the client's headers */
1159
1160    for (;;)
1161    {
1162       if ( ( ( p = get_header(csp) ) != NULL) && ( *p == '\0' ) )
1163       {
1164          len = read_socket(csp->cfd, buf, sizeof(buf));
1165          if (len <= 0)
1166          {
1167             log_error(LOG_LEVEL_ERROR, "read from client failed: %E");
1168             return;
1169          }
1170          
1171          /*
1172           * If there is no memory left for buffering the
1173           * request, there is nothing we can do but hang up
1174           */
1175          if (add_to_iob(csp, buf, len))
1176          {
1177             return;
1178          }
1179          continue;
1180       }
1181
1182       if (p == NULL) break;
1183
1184       enlist(csp->headers, p);
1185       freez(p);
1186    }
1187
1188    /*
1189     * We have a request. Now, check to see if we need to
1190     * intercept it, i.e. If ..
1191     */
1192
1193    if (
1194        /* We may not forward the request by rfc2616 sect 14.31 */
1195        (NULL != (rsp = direct_response(csp)))
1196
1197        /* or a CGI call was detected and answered */
1198        || (NULL != (rsp = dispatch_cgi(csp)))
1199
1200        /* or we are enabled and... */
1201        || (IS_ENABLED_AND (
1202
1203             /* ..the request was blocked */
1204           ( NULL != (rsp = block_url(csp)))
1205
1206           /* ..or untrusted */
1207 #ifdef FEATURE_TRUST
1208           || ( NULL != (rsp = trust_url(csp)))
1209 #endif /* def FEATURE_TRUST */
1210
1211           /* ..or a fast redirect kicked in */
1212 #ifdef FEATURE_FAST_REDIRECTS
1213           || (((csp->action->flags & ACTION_FAST_REDIRECTS) != 0) &&
1214                 (NULL != (rsp = redirect_url(csp))))
1215 #endif /* def FEATURE_FAST_REDIRECTS */
1216           ))
1217       )
1218    {
1219       /* Write the answer to the client */
1220       if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1221        || write_socket(csp->cfd, rsp->body, rsp->content_length))
1222       {
1223          log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1224       }
1225
1226 #ifdef FEATURE_STATISTICS
1227       /* Count as a rejected request */
1228       csp->flags |= CSP_FLAG_REJECTED;
1229 #endif /* def FEATURE_STATISTICS */
1230
1231       /* Log (FIXME: All intercept reasons appear as "crunch" with Status 200) */
1232       log_error(LOG_LEVEL_GPC, "%s%s crunch!", http->hostport, http->path);
1233       log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 200 3", csp->ip_addr_str, http->ocmd);
1234
1235       /* Clean up and return */
1236       free_http_response(rsp);
1237       return;
1238    }
1239
1240    hdr = sed(client_patterns, add_client_headers, csp);
1241    if (hdr == NULL)
1242    {
1243       /* FIXME Should handle error properly */
1244       log_error(LOG_LEVEL_FATAL, "Out of memory parsing client header");
1245    }
1246
1247    list_remove_all(csp->headers);
1248
1249    log_error(LOG_LEVEL_GPC, "%s%s", http->hostport, http->path);
1250
1251    if (fwd->forward_host)
1252    {
1253       log_error(LOG_LEVEL_CONNECT, "via %s:%d to: %s",
1254                fwd->forward_host, fwd->forward_port, http->hostport);
1255    }
1256    else
1257    {
1258       log_error(LOG_LEVEL_CONNECT, "to %s", http->hostport);
1259    }
1260
1261    /* here we connect to the server, gateway, or the forwarder */
1262
1263    while ( (csp->sfd = forwarded_connect(fwd, http, csp))
1264          && (errno == EINVAL) && (socks_retries++ < 3))
1265    {
1266                 log_error(LOG_LEVEL_ERROR, "failed request #%u to connect to %s. Trying again.",
1267                 socks_retries, http->hostport);
1268    }
1269
1270    if (csp->sfd == JB_INVALID_SOCKET)
1271    {
1272       log_error(LOG_LEVEL_CONNECT, "connect to: %s failed: %E",
1273                 http->hostport);
1274
1275       if (errno == EINVAL)
1276       {
1277          rsp = error_response(csp, "no-such-domain", errno);
1278
1279          log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 404 0",
1280                    csp->ip_addr_str, http->ocmd);
1281       }
1282       else
1283       {
1284          rsp = error_response(csp, "connect-failed", errno);
1285
1286          log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 503 0",
1287                    csp->ip_addr_str, http->ocmd);
1288       }
1289
1290
1291       /* Write the answer to the client */
1292       if(rsp)
1293       {
1294          if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1295           || write_socket(csp->cfd, rsp->body, rsp->content_length))
1296          {
1297             log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1298          }
1299       }
1300
1301       free_http_response(rsp);
1302       freez(hdr);
1303       return;
1304    }
1305
1306    log_error(LOG_LEVEL_CONNECT, "OK");
1307
1308    if (fwd->forward_host || (http->ssl == 0))
1309    {
1310       /* write the client's (modified) header to the server
1311        * (along with anything else that may be in the buffer)
1312        */
1313
1314       if (write_socket(csp->sfd, hdr, strlen(hdr))
1315        || (flush_socket(csp->sfd, csp) <  0))
1316       {
1317          log_error(LOG_LEVEL_CONNECT, "write header to: %s failed: %E",
1318                     http->hostport);
1319
1320          log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 503 0",
1321                    csp->ip_addr_str, http->ocmd);
1322
1323          rsp = error_response(csp, "connect-failed", errno);
1324
1325          if(rsp)
1326          {
1327             if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1328              || write_socket(csp->cfd, rsp->body, rsp->content_length))
1329             {
1330                log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1331             }
1332          }
1333
1334          free_http_response(rsp);
1335          freez(hdr);
1336          return;
1337       }
1338    }
1339    else
1340    {
1341       /*
1342        * We're running an SSL tunnel and we're not forwarding,
1343        * so just send the "connect succeeded" message to the
1344        * client, flush the rest, and get out of the way.
1345        */
1346       log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 200 2\n",
1347                 csp->ip_addr_str, http->ocmd);
1348
1349       if (write_socket(csp->cfd, CSUCCEED, sizeof(CSUCCEED)-1))
1350       {
1351          freez(hdr);
1352          return;
1353       }
1354       IOB_RESET(csp);
1355    }
1356
1357    /* we're finished with the client's header */
1358    freez(hdr);
1359
1360    maxfd = ( csp->cfd > csp->sfd ) ? csp->cfd : csp->sfd;
1361
1362    /* pass data between the client and server
1363     * until one or the other shuts down the connection.
1364     */
1365
1366    server_body = 0;
1367
1368    for (;;)
1369    {
1370 #ifdef __OS2__
1371       /*
1372        * FD_ZERO here seems to point to an errant macro which crashes.
1373        * So do this by hand for now...
1374        */
1375       memset(&rfds,0x00,sizeof(fd_set));
1376 #else
1377       FD_ZERO(&rfds);
1378 #endif
1379       FD_SET(csp->cfd, &rfds);
1380       FD_SET(csp->sfd, &rfds);
1381
1382       n = select((int)maxfd+1, &rfds, NULL, NULL, NULL);
1383
1384       if (n < 0)
1385       {
1386          log_error(LOG_LEVEL_ERROR, "select() failed!: %E");
1387          return;
1388       }
1389
1390       /* this is the body of the browser's request
1391        * just read it and write it.
1392        */
1393
1394       if (FD_ISSET(csp->cfd, &rfds))
1395       {
1396          len = read_socket(csp->cfd, buf, sizeof(buf));
1397
1398          if (len <= 0)
1399          {
1400             break; /* "game over, man" */
1401          }
1402
1403          if (write_socket(csp->sfd, buf, (size_t)len))
1404          {
1405             log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1406             return;
1407          }
1408          continue;
1409       }
1410
1411       /*
1412        * The server wants to talk.  It could be the header or the body.
1413        * If `hdr' is null, then it's the header otherwise it's the body.
1414        * FIXME: Does `hdr' really mean `host'? No.
1415        */
1416
1417
1418       if (FD_ISSET(csp->sfd, &rfds))
1419       {
1420          fflush( 0 );
1421          len = read_socket(csp->sfd, buf, sizeof(buf) - 1);
1422
1423          if (len < 0)
1424          {
1425             log_error(LOG_LEVEL_ERROR, "read from: %s failed: %E", http->host);
1426
1427             log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 503 0",
1428                       csp->ip_addr_str, http->ocmd);
1429
1430             rsp = error_response(csp, "connect-failed", errno);
1431
1432             if(rsp)
1433             {
1434                if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1435                 || write_socket(csp->cfd, rsp->body, rsp->content_length))
1436                {
1437                   log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1438                }
1439             }
1440
1441             free_http_response(rsp);
1442             return;
1443          }
1444
1445          /* Add a trailing zero.  This lets filter_popups
1446           * use string operations.
1447           */
1448          buf[len] = '\0';
1449
1450 #ifdef FEATURE_KILL_POPUPS
1451          /* Filter the popups on this read. */
1452          if (block_popups_now)
1453          {
1454             filter_popups(buf, csp);
1455          }
1456 #endif /* def FEATURE_KILL_POPUPS */
1457
1458          /* Normally, this would indicate that we've read
1459           * as much as the server has sent us and we can
1460           * close the client connection.  However, Microsoft
1461           * in its wisdom has released IIS/5 with a bug that
1462           * prevents it from sending the trailing \r\n in
1463           * a 302 redirect header (and possibly other headers).
1464           * To work around this if we've haven't parsed
1465           * a full header we'll append a trailing \r\n
1466           * and see if this now generates a valid one.
1467           *
1468           * This hack shouldn't have any impacts.  If we've
1469           * already transmitted the header or if this is a
1470           * SSL connection, then we won't bother with this
1471           * hack.  So we only work on partially received
1472           * headers.  If we append a \r\n and this still
1473           * doesn't generate a valid header, then we won't
1474           * transmit anything to the client.
1475           */
1476          if (len == 0)
1477          {
1478
1479             if (server_body || http->ssl)
1480             {
1481                /*
1482                 * If we have been buffering up the document,
1483                 * now is the time to apply content modification
1484                 * and send the result to the client.
1485                 */
1486                if (content_filter)
1487                {
1488                   /*
1489                    * If the content filter fails, use the original
1490                    * buffer and length.
1491                    * (see p != NULL ? p : csp->iob->cur below)
1492                    */
1493                   if (NULL == (p = (*content_filter)(csp)))
1494                   {
1495                      csp->content_length = csp->iob->eod - csp->iob->cur;
1496                   }
1497
1498                   hdr = sed(server_patterns_light, NULL, csp);
1499
1500                   if (hdr == NULL)
1501                   {
1502                      /* FIXME Should handle error properly */
1503                      log_error(LOG_LEVEL_FATAL, "Out of memory parsing server header");
1504                   }
1505
1506                   if (write_socket(csp->cfd, hdr, strlen(hdr))
1507                    || write_socket(csp->cfd, p != NULL ? p : csp->iob->cur, csp->content_length))
1508                   {
1509                      log_error(LOG_LEVEL_ERROR, "write modified content to client failed: %E");
1510                      freez(hdr);
1511                      freez(p);
1512                      return;
1513                   }
1514
1515                   freez(hdr);
1516                   freez(p);
1517                }
1518
1519                break; /* "game over, man" */
1520             }
1521
1522             /*
1523              * This is NOT the body, so
1524              * Let's pretend the server just sent us a blank line.
1525              */
1526             len = sprintf(buf, "\r\n");
1527
1528             /*
1529              * Now, let the normal header parsing algorithm below do its
1530              * job.  If it fails, we'll exit instead of continuing.
1531              */
1532
1533             ms_iis5_hack = 1;
1534          }
1535
1536          /*
1537           * If this is an SSL connection or we're in the body
1538           * of the server document, just write it to the client,
1539           * unless we need to buffer the body for later content-filtering
1540           */
1541
1542          if (server_body || http->ssl)
1543          {
1544             if (content_filter)
1545             {
1546                /*
1547                 * If there is no memory left for buffering the content, or the buffer limit
1548                 * has been reached, switch to non-filtering mode, i.e. make & write the
1549                 * header, flush the iob and buf, and get out of the way.
1550                 */
1551                if (add_to_iob(csp, buf, len))
1552                {
1553                   size_t hdrlen;
1554                   int flushed;
1555
1556                   log_error(LOG_LEVEL_ERROR, "Flushing header and buffers. Stepping back from filtering.");
1557
1558                   hdr = sed(server_patterns, add_server_headers, csp);
1559                   if (hdr == NULL)
1560                   {
1561                      /* 
1562                       * Memory is too tight to even generate the header.
1563                       * Send our static "Out-of-memory" page.
1564                       */
1565                      log_error(LOG_LEVEL_ERROR, "Out of memory while trying to flush.");
1566                      rsp = cgi_error_memory();
1567
1568                      if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1569                          || write_socket(csp->cfd, rsp->body, rsp->content_length))
1570                      {
1571                         log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1572                      }
1573                      return;
1574                   }
1575
1576                   hdrlen = strlen(hdr);
1577
1578                   if (write_socket(csp->cfd, hdr, hdrlen)
1579                    || ((flushed = flush_socket(csp->cfd, csp)) < 0)
1580                    || (write_socket(csp->cfd, buf, (size_t) len)))
1581                   {
1582                      log_error(LOG_LEVEL_CONNECT, "Flush header and buffers to client failed: %E");
1583
1584                      freez(hdr);
1585                      return;
1586                   }
1587
1588                   byte_count += hdrlen + flushed + len;
1589                   freez(hdr);
1590                   content_filter = NULL;
1591                   server_body = 1;
1592
1593                }
1594             }
1595             else
1596             {
1597                if (write_socket(csp->cfd, buf, (size_t)len))
1598                {
1599                   log_error(LOG_LEVEL_ERROR, "write to client failed: %E");
1600                   return;
1601                }
1602             }
1603             byte_count += len;
1604             continue;
1605          }
1606          else
1607          {
1608             /* we're still looking for the end of the
1609              * server's header ... (does that make header
1610              * parsing an "out of body experience" ?
1611              */
1612
1613             /* 
1614              * buffer up the data we just read.  If that fails, 
1615              * there's little we can do but send our static
1616              * out-of-memory page.
1617              */
1618             if (add_to_iob(csp, buf, len))
1619             {
1620                log_error(LOG_LEVEL_ERROR, "Out of memory while looking for end of server headers.");
1621                rsp = cgi_error_memory();
1622                
1623                if (write_socket(csp->cfd, rsp->head, rsp->head_length)
1624                    || write_socket(csp->cfd, rsp->body, rsp->content_length))
1625                {
1626                   log_error(LOG_LEVEL_ERROR, "write to: %s failed: %E", http->host);
1627                }
1628                return;
1629             }
1630
1631             /* get header lines from the iob */
1632
1633             while ((p = get_header(csp)) != NULL)
1634             {
1635                if (*p == '\0')
1636                {
1637                   /* see following note */
1638                   break;
1639                }
1640                enlist(csp->headers, p);
1641                freez(p);
1642             }
1643
1644             /* NOTE: there are no "empty" headers so
1645              * if the pointer `p' is not NULL we must
1646              * assume that we reached the end of the
1647              * buffer before we hit the end of the header.
1648              */
1649
1650             if (p)
1651             {
1652                if (ms_iis5_hack)
1653                {
1654                   /* Well, we tried our MS IIS/5
1655                    * hack and it didn't work.
1656                    * The header is incomplete
1657                    * and there isn't anything
1658                    * we can do about it.
1659                    */
1660                   break;
1661                }
1662                else
1663                {
1664                   /* Since we have to wait for
1665                    * more from the server before
1666                    * we can parse the headers
1667                    * we just continue here.
1668                    */
1669                   continue;
1670                }
1671             }
1672
1673             /* we have now received the entire header.
1674              * filter it and send the result to the client
1675              */
1676
1677             hdr = sed(server_patterns, add_server_headers, csp);
1678             if (hdr == NULL)
1679             {
1680                /* FIXME Should handle error properly */
1681                log_error(LOG_LEVEL_FATAL, "Out of memory parsing server header");
1682             }
1683
1684 #ifdef FEATURE_KILL_POPUPS
1685             /* Start blocking popups if appropriate. */
1686
1687             if ((csp->content_type & CT_TEXT) &&  /* It's a text / * MIME-Type */
1688                 !http->ssl    &&                  /* We talk plaintext */
1689                 block_popups)                     /* Policy allows */
1690             {
1691                block_popups_now = 1;
1692                /*
1693                 * Filter the part of the body that came in the same read
1694                 * as the last headers:
1695                 */
1696                filter_popups(csp->iob->cur, csp);
1697             }
1698
1699 #endif /* def FEATURE_KILL_POPUPS */
1700
1701             /* Buffer and pcrs filter this if appropriate. */
1702
1703             if ((csp->content_type & CT_TEXT) &&  /* It's a text / * MIME-Type */
1704                 !http->ssl    &&                  /* We talk plaintext */
1705                 pcrs_filter)                      /* Policy allows */
1706             {
1707                content_filter = pcrs_filter_response;
1708             }
1709
1710             /* Buffer and gif_deanimate this if appropriate. */
1711
1712             if ((csp->content_type & CT_GIF)  &&  /* It's an image/gif MIME-Type */
1713                 !http->ssl    &&                  /* We talk plaintext */
1714                 gif_deanimate)                    /* Policy allows */
1715             {
1716                content_filter = gif_deanimate_response;
1717             }
1718
1719             /* Buffer and jpg_inspect this if appropriate. */
1720
1721             if ((csp->content_type & CT_JPEG)  &&  /* It's an image/jpeg MIME-Type */
1722                 !http->ssl    &&                   /* We talk plaintext */
1723                 jpeg_inspect)                      /* Policy allows */
1724             {
1725                content_filter = jpeg_inspect_response;
1726             }
1727
1728             /*
1729              * Only write if we're not buffering for content modification
1730              */
1731             if (!content_filter)
1732             {
1733                /* write the server's (modified) header to
1734                 * the client (along with anything else that
1735                 * may be in the buffer)
1736                 */
1737
1738                if (write_socket(csp->cfd, hdr, strlen(hdr))
1739                 || ((len = flush_socket(csp->cfd, csp)) < 0))
1740                {
1741                   log_error(LOG_LEVEL_CONNECT, "write header to client failed: %E");
1742
1743                   /* the write failed, so don't bother
1744                    * mentioning it to the client...
1745                    * it probably can't hear us anyway.
1746                    */
1747                   freez(hdr);
1748                   return;
1749                }
1750
1751                byte_count += len;
1752             }
1753
1754             /* we're finished with the server's header */
1755
1756             freez(hdr);
1757             server_body = 1;
1758
1759             /* If this was a MS IIS/5 hack then it means
1760              * the server has already closed the
1761              * connection.  Nothing more to read.  Time
1762              * to bail.
1763              */
1764             if (ms_iis5_hack)
1765             {
1766                break;
1767             }
1768          }
1769          continue;
1770       }
1771
1772       return; /* huh? we should never get here */
1773    }
1774
1775    log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 200 %d",
1776              csp->ip_addr_str, http->ocmd, byte_count);
1777 }
1778
1779
1780 /*********************************************************************
1781  *
1782  * Function    :  serve
1783  *
1784  * Description :  This is little more than chat.  We only "serve" to
1785  *                to close any socket that chat may have opened.
1786  *
1787  * Parameters  :
1788  *          1  :  csp = Current client state (buffers, headers, etc...)
1789  *
1790  * Returns     :  N/A
1791  *
1792  *********************************************************************/
1793 #ifdef AMIGA
1794 void serve(struct client_state *csp)
1795 #else /* ifndef AMIGA */
1796 static void serve(struct client_state *csp)
1797 #endif /* def AMIGA */
1798 {
1799    chat(csp);
1800    close_socket(csp->cfd);
1801
1802    if (csp->sfd != JB_INVALID_SOCKET)
1803    {
1804       close_socket(csp->sfd);
1805    }
1806
1807    csp->flags &= ~CSP_FLAG_ACTIVE;
1808
1809 }
1810
1811
1812 #ifdef __BEOS__
1813 /*********************************************************************
1814  *
1815  * Function    :  server_thread
1816  *
1817  * Description :  We only exist to call `serve' in a threaded environment.
1818  *
1819  * Parameters  :
1820  *          1  :  data = Current client state (buffers, headers, etc...)
1821  *
1822  * Returns     :  Always 0.
1823  *
1824  *********************************************************************/
1825 static int32 server_thread(void *data)
1826 {
1827    serve((struct client_state *) data);
1828    return 0;
1829
1830 }
1831 #endif
1832
1833
1834 /*********************************************************************
1835  *
1836  * Function    :  usage
1837  *
1838  * Description :  Print usage info & exit.
1839  *
1840  * Parameters  :  Pointer to argv[0] for identifying ourselves
1841  *
1842  * Returns     :  No. ,-)
1843  *
1844  *********************************************************************/
1845 void usage(const char *myname)
1846 {
1847    printf("Privoxy version " VERSION " (" HOME_PAGE_URL ")\n"
1848 #if !defined(unix)
1849            "Usage: %s [--help] [--version] [configfile]\n"
1850 #else
1851            "Usage: %s [--help] [--version] [--no-daemon] [--pidfile pidfile] [--user user[.group]] [configfile]\n"
1852 #endif
1853            "Aborting.\n", myname);
1854  
1855    exit(2);
1856
1857 }
1858
1859
1860 /*********************************************************************
1861  *
1862  * Function    :  main
1863  *
1864  * Description :  Load the config file and start the listen loop.
1865  *                This function is a lot more *sane* with the `load_config'
1866  *                and `listen_loop' functions; although it stills does
1867  *                a *little* too much for my taste.
1868  *
1869  * Parameters  :
1870  *          1  :  argc = Number of parameters (including $0).
1871  *          2  :  argv = Array of (char *)'s to the parameters.
1872  *
1873  * Returns     :  1 if : can't open config file, unrecognized directive,
1874  *                stats requested in multi-thread mode, can't open the
1875  *                log file, can't open the jar file, listen port is invalid,
1876  *                any load fails, and can't bind port.
1877  *
1878  *                Else main never returns, the process must be signaled
1879  *                to terminate execution.  Or, on Windows, use the
1880  *                "File", "Exit" menu option.
1881  *
1882  *********************************************************************/
1883 #ifdef __MINGW32__
1884 int real_main(int argc, const char *argv[])
1885 #else
1886 int main(int argc, const char *argv[])
1887 #endif
1888 {
1889    int argc_pos = 0;
1890 #ifdef unix
1891    struct passwd *pw = NULL;
1892    struct group *grp = NULL;
1893    char *p;
1894    int do_chroot = 0;
1895 #endif
1896
1897    Argc = argc;
1898    Argv = argv;
1899
1900    configfile =
1901 #if !defined(_WIN32)
1902    "config"
1903 #else
1904    "config.txt"
1905 #endif
1906       ;
1907
1908    /*
1909     * Parse the command line arguments
1910     */
1911    while (++argc_pos < argc)
1912    {
1913 #ifdef _WIN32
1914       /* Check to see if the service must be installed or uninstalled */
1915       if (strncmp(argv[argc_pos], "--install", 9) == 0)
1916       {
1917          const char *pName = argv[argc_pos] + 9;
1918          if (*pName == ':')
1919             pName++;
1920          exit( (install_service(pName)) ? 0 : 1 );
1921       }
1922       else if (strncmp(argv[argc_pos], "--uninstall", + 11) == 0)
1923       {
1924          const char *pName = argv[argc_pos] + 11;
1925          if (*pName == ':')
1926             pName++;
1927          exit((uninstall_service(pName)) ? 0 : 1);
1928       }
1929       else if (strcmp(argv[argc_pos], "--service" ) == 0)
1930       {
1931          bRunAsService = TRUE;
1932          w32_set_service_cwd();
1933          atexit(w32_service_exit_notify);
1934       }
1935       else
1936 #endif /* defined(_WIN32) */
1937
1938
1939 #if !defined(_WIN32) || defined(_WIN_CONSOLE)
1940
1941       if (strcmp(argv[argc_pos], "--help") == 0)
1942       {
1943          usage(argv[0]);
1944       }
1945
1946       else if(strcmp(argv[argc_pos], "--version") == 0)
1947       {
1948          printf("Privoxy version " VERSION " (" HOME_PAGE_URL ")\n");
1949          exit(0);
1950       }
1951
1952 #if defined(unix)
1953
1954      else if (strcmp(argv[argc_pos], "--no-daemon" ) == 0)
1955       {
1956          no_daemon = 1;
1957       }
1958
1959       else if (strcmp(argv[argc_pos], "--pidfile" ) == 0)
1960       {
1961          if (++argc_pos == argc) usage(argv[0]);
1962          pidfile = strdup(argv[argc_pos]);
1963       }
1964
1965       else if (strcmp(argv[argc_pos], "--user" ) == 0)
1966       {
1967          if (++argc_pos == argc) usage(argv[argc_pos]);
1968
1969          if ((NULL != (p = strchr(argv[argc_pos], '.'))) && *(p + 1) != '0')
1970          {
1971             *p++ = '\0';
1972             if (NULL == (grp = getgrnam(p)))
1973             {
1974                log_error(LOG_LEVEL_FATAL, "Group %s not found.", p);
1975             }
1976          }
1977
1978          if (NULL == (pw = getpwnam(argv[argc_pos])))
1979          {
1980             log_error(LOG_LEVEL_FATAL, "User %s not found.", argv[argc_pos]);
1981          }
1982
1983          if (p != NULL) *--p = '\0';
1984       }
1985
1986       else if (strcmp(argv[argc_pos], "--chroot" ) == 0)
1987       {
1988          do_chroot = 1;
1989       }
1990
1991 #endif /* defined(unix) */
1992 #endif /* defined(_WIN32) && !defined(_WIN_CONSOLE) */
1993       {
1994          configfile = argv[argc_pos];
1995       }
1996
1997    } /* -END- while (more arguments) */
1998
1999 #if defined(unix)
2000    if ( *configfile != '/' )
2001    {
2002       char *abs_file, cwd[1024];
2003
2004       /* make config-filename absolute here */
2005       if ( !(getcwd(cwd, sizeof(cwd))))
2006       {
2007          perror("get working dir failed");
2008          exit( 1 );
2009       }
2010
2011       if (!(basedir = strdup(cwd))
2012       || (!(abs_file = malloc( strlen( basedir ) + strlen( configfile ) + 5 ))))
2013       {
2014          perror("malloc failed");
2015          exit( 1 );
2016       }
2017       strcpy( abs_file, basedir );
2018       strcat( abs_file, "/" );
2019       strcat( abs_file, configfile );
2020       configfile = abs_file;
2021    }
2022 #endif /* defined unix */
2023
2024
2025    files->next = NULL;
2026    clients->next = NULL;
2027
2028 #ifdef AMIGA
2029    InitAmiga();
2030 #elif defined(_WIN32)
2031    InitWin32();
2032 #endif
2033
2034 #if defined(OSX_DARWIN) || defined(__OpenBSD__)
2035    /*
2036     * Prepare global mutex semaphores
2037     */
2038 #ifdef OSX_DARWIN
2039    pthread_mutex_init(&gmtime_mutex,0);
2040    pthread_mutex_init(&localtime_mutex,0);
2041 #endif /* def OSX_DARWIN */
2042    pthread_mutex_init(&gethostbyaddr_mutex,0);
2043    pthread_mutex_init(&gethostbyname_mutex,0);
2044 #endif /* defined(OSX_DARWIN) || defined(__OpenBSD__) */
2045
2046 #ifdef FEATURE_PTHREAD
2047    pthread_mutex_init(&log_mutex,0);
2048    pthread_mutex_init(&log_init_mutex,0);
2049 #endif /* FEATURE_PTHREAD */
2050
2051    /*
2052     * Unix signal handling
2053     *
2054     * Catch the abort, interrupt and terminate signals for a graceful exit
2055     * Catch the hangup signal so the errlog can be reopened.
2056     * Ignore the broken pipe signals (FIXME: Why?)
2057     */
2058 #if !defined(_WIN32) && !defined(__OS2__) && !defined(AMIGA)
2059 {
2060    int idx;
2061    const int catched_signals[] = { SIGABRT, SIGTERM, SIGINT, SIGHUP, 0 };
2062    const int ignored_signals[] = { SIGPIPE, 0 };
2063
2064    for (idx = 0; catched_signals[idx] != 0; idx++)
2065    {
2066       if (signal(catched_signals[idx], sig_handler) == SIG_ERR)
2067       {
2068          log_error(LOG_LEVEL_FATAL, "Can't set signal-handler for signal %d: %E", catched_signals[idx]);
2069       }
2070    }
2071
2072    for (idx = 0; ignored_signals[idx] != 0; idx++)
2073    {
2074       if (signal(ignored_signals[idx], SIG_IGN) == SIG_ERR)
2075       {
2076          log_error(LOG_LEVEL_FATAL, "Can't set ignore-handler for signal %d: %E", ignored_signals[idx]);
2077       }
2078    }
2079
2080 }
2081 #else /* ifdef _WIN32 */
2082 # ifdef _WIN_CONSOLE
2083    /*
2084     * We *are* in a windows console app.
2085     * Print a verbose messages about FAQ's and such
2086     */
2087    printf(win32_blurb);
2088 # endif /* def _WIN_CONSOLE */
2089 #endif /* def _WIN32 */
2090
2091
2092    /* Initialize the CGI subsystem */
2093    cgi_init_error_messages();
2094
2095    /*
2096     * If runnig on unix and without the --nodaemon
2097     * option, become a daemon. I.e. fork, detach
2098     * from tty and get process group leadership
2099     */
2100 #if defined(unix)
2101 {
2102    pid_t pid = 0;
2103 #if 0
2104    int   fd;
2105 #endif
2106
2107    if (!no_daemon)
2108    {
2109       pid  = fork();
2110
2111       if ( pid < 0 ) /* error */
2112       {
2113          perror("fork");
2114          exit( 3 );
2115       }
2116       else if ( pid != 0 ) /* parent */
2117       {
2118          int status;
2119          pid_t wpid;
2120          /*
2121           * must check for errors
2122           * child died due to missing files aso
2123           */
2124          sleep( 1 );
2125          wpid = waitpid( pid, &status, WNOHANG );
2126          if ( wpid != 0 )
2127          {
2128             exit( 1 );
2129          }
2130          exit( 0 );
2131       }
2132       /* child */
2133 #if 1
2134       /* Should be more portable, but not as well tested */
2135       setsid();
2136 #else /* !1 */
2137 #ifdef __FreeBSD__
2138       setpgrp(0,0);
2139 #else /* ndef __FreeBSD__ */
2140       setpgrp();
2141 #endif /* ndef __FreeBSD__ */
2142       fd = open("/dev/tty", O_RDONLY);
2143       if ( fd )
2144       {
2145          /* no error check here */
2146          ioctl( fd, TIOCNOTTY,0 );
2147          close ( fd );
2148       }
2149 #endif /* 1 */
2150       /* FIXME: should close stderr (fd 2) here too, but the test
2151        * for existence
2152        * and load config file is done in listen_loop() and puts
2153        * some messages on stderr there.
2154        */
2155
2156       close( 0 );
2157       close( 1 );
2158       chdir("/");
2159
2160    } /* -END- if (!no_daemon) */
2161
2162    /*
2163     * As soon as we have written the PID file, we can switch
2164     * to the user and group ID indicated by the --user option
2165     */
2166    write_pid_file();
2167    
2168    if (NULL != pw)
2169    {
2170       if (setgid((NULL != grp) ? grp->gr_gid : pw->pw_gid))
2171       {
2172          log_error(LOG_LEVEL_FATAL, "Cannot setgid(): Insufficient permissions.");
2173       }
2174       if (do_chroot)
2175       {
2176          if (!pw->pw_dir)
2177          {
2178             log_error(LOG_LEVEL_FATAL, "Home directory for %s undefined", pw->pw_name);
2179          }
2180          if (chroot(pw->pw_dir) < 0)
2181          {
2182             log_error(LOG_LEVEL_FATAL, "Cannot chroot to %s", pw->pw_dir);
2183          }
2184          if (chdir ("/"))
2185          {
2186             log_error(LOG_LEVEL_FATAL, "Cannot chdir /");
2187          }
2188       }
2189       if (setuid(pw->pw_uid))
2190       {
2191          log_error(LOG_LEVEL_FATAL, "Cannot setuid(): Insufficient permissions.");
2192       }
2193       if (do_chroot)
2194       {
2195          char putenv_dummy[64];
2196
2197          strcpy(putenv_dummy, "HOME=/");
2198          if (putenv(putenv_dummy) != 0)
2199          {
2200             log_error(LOG_LEVEL_FATAL, "Cannot putenv(): HOME");
2201          }                
2202
2203          snprintf(putenv_dummy, 64, "USER=%s", pw->pw_name);
2204          if (putenv(putenv_dummy) != 0)
2205          {
2206             log_error(LOG_LEVEL_FATAL, "Cannot putenv(): USER");
2207          }
2208       }
2209    }
2210    else if (do_chroot)
2211    {
2212       log_error(LOG_LEVEL_FATAL, "Cannot chroot without --user argument.");
2213    }
2214 }
2215 #endif /* defined unix */
2216
2217 #ifdef _WIN32
2218    /* This will be FALSE unless the command line specified --service
2219     */
2220    if (bRunAsService)
2221    {
2222       /* Yup, so now we must attempt to establish a connection 
2223        * with the service dispatcher. This will only work if this
2224        * process was launched by the service control manager to
2225        * actually run as a service. If this isn't the case, i've
2226        * known it take around 30 seconds or so for the call to return.
2227        */
2228
2229       /* The StartServiceCtrlDispatcher won't return until the service is stopping */
2230       if (w32_start_service_ctrl_dispatcher(w32ServiceDispatchTable))
2231       {
2232          /* Service has run, and at this point is now being stopped, so just return */
2233          return 0;
2234       }
2235
2236 #ifdef _WIN_CONSOLE
2237       printf("Warning: Failed to connect to Service Control Dispatcher\nwhen starting as a service!\n");
2238 #endif
2239       /* An error occurred. Usually it's because --service was wrongly specified
2240        * and we were unable to connect to the Service Control Dispatcher because
2241        * it wasn't expecting us and is therefore not listening.
2242        *
2243        * For now, just continue below to call the listen_loop function.
2244        */
2245    }
2246 #endif /* def _WIN32 */
2247
2248    listen_loop();
2249
2250    /* NOTREACHED */
2251    return(-1);
2252
2253 }
2254
2255
2256 /*********************************************************************
2257  *
2258  * Function    :  bind_port_helper
2259  *
2260  * Description :  Bind the listen port.  Handles logging, and aborts
2261  *                on failure.
2262  *
2263  * Parameters  :
2264  *          1  :  config = Privoxy configuration.  Specifies port
2265  *                         to bind to.
2266  *
2267  * Returns     :  Port that was opened.
2268  *
2269  *********************************************************************/
2270 static jb_socket bind_port_helper(struct configuration_spec * config)
2271 {
2272    int result;
2273    jb_socket bfd;
2274
2275    if ( (config->haddr != NULL)
2276      && (config->haddr[0] == '1')
2277      && (config->haddr[1] == '2')
2278      && (config->haddr[2] == '7')
2279      && (config->haddr[3] == '.') )
2280    {
2281       log_error(LOG_LEVEL_INFO, "Listening on port %d for local connections only",
2282                 config->hport);
2283    }
2284    else if (config->haddr == NULL)
2285    {
2286       log_error(LOG_LEVEL_INFO, "Listening on port %d on all IP addresses",
2287                 config->hport);
2288    }
2289    else
2290    {
2291       log_error(LOG_LEVEL_INFO, "Listening on port %d on IP address %s",
2292                 config->hport, config->haddr);
2293    }
2294
2295    result = bind_port(config->haddr, config->hport, &bfd);
2296
2297    if (result < 0)
2298    {
2299       switch(result)
2300       {
2301          case -3 :
2302             log_error(LOG_LEVEL_FATAL, "can't bind to %s:%d: "
2303                "There may be another Privoxy or some other "
2304                "proxy running on port %d",
2305                (NULL != config->haddr) ? config->haddr : "INADDR_ANY",
2306                       config->hport, config->hport);
2307
2308          case -2 :
2309             log_error(LOG_LEVEL_FATAL, "can't bind to %s:%d: " 
2310                "The hostname is not resolvable",
2311                (NULL != config->haddr) ? config->haddr : "INADDR_ANY", config->hport);
2312
2313          default :
2314             log_error(LOG_LEVEL_FATAL, "can't bind to %s:%d: because %E",
2315                (NULL != config->haddr) ? config->haddr : "INADDR_ANY", config->hport);
2316       }
2317
2318       /* shouldn't get here */
2319       return JB_INVALID_SOCKET;
2320    }
2321
2322    config->need_bind = 0;
2323
2324    return bfd;
2325 }
2326
2327
2328 #ifdef _WIN32
2329 /* Without this simple workaround we get this compiler warning from _beginthread
2330  *     warning C4028: formal parameter 1 different from declaration
2331  */
2332 void w32_service_listen_loop(void *p)
2333 {
2334    listen_loop();
2335 }
2336 #endif /* def _WIN32 */
2337
2338
2339 /*********************************************************************
2340  *
2341  * Function    :  listen_loop
2342  *
2343  * Description :  bind the listen port and enter a "FOREVER" listening loop.
2344  *
2345  * Parameters  :  N/A
2346  *
2347  * Returns     :  Never.
2348  *
2349  *********************************************************************/
2350 static void listen_loop(void)
2351 {
2352    struct client_state *csp = NULL;
2353    jb_socket bfd;
2354    struct configuration_spec * config;
2355
2356    config = load_config();
2357
2358    bfd = bind_port_helper(config);
2359
2360 #ifdef FEATURE_GRACEFUL_TERMINATION
2361    while (!g_terminate)
2362 #else
2363    for (;;)
2364 #endif
2365    {
2366 #if !defined(FEATURE_PTHREAD) && !defined(_WIN32) && !defined(__BEOS__) && !defined(AMIGA) && !defined(__OS2__)
2367       while (waitpid(-1, NULL, WNOHANG) > 0)
2368       {
2369          /* zombie children */
2370       }
2371 #endif /* !defined(FEATURE_PTHREAD) && !defined(_WIN32) && !defined(__BEOS__) && !defined(AMIGA) */
2372
2373       /*
2374        * Free data that was used by died threads
2375        */
2376       sweep();
2377
2378 #if defined(unix)
2379       /*
2380        * Re-open the errlog after HUP signal
2381        */
2382       if (received_hup_signal)
2383       {
2384          init_error_log(Argv[0], config->logfile, config->debug);
2385          received_hup_signal = 0;
2386       }
2387 #endif
2388
2389 #ifdef __OS2__
2390 #ifdef FEATURE_COOKIE_JAR
2391       /*
2392        * Need a workaround here: we have to fclose() the jarfile, or we die because it's
2393        * already open.  I think unload_configfile() is not being run, which should do
2394        * this work.  Until that can get resolved, we'll use this workaround.
2395        */
2396        if (csp)
2397          if(csp->config)
2398            if (csp->config->jar)
2399            {
2400              fclose(csp->config->jar);
2401              csp->config->jar = NULL;
2402            }
2403 #endif /* FEATURE_COOKIE_JAR */
2404 #endif /* __OS2__ */
2405
2406       if ( NULL == (csp = (struct client_state *) zalloc(sizeof(*csp))) )
2407       {
2408          log_error(LOG_LEVEL_FATAL, "malloc(%d) for csp failed: %E", sizeof(*csp));
2409          continue;
2410       }
2411
2412       csp->flags |= CSP_FLAG_ACTIVE;
2413       csp->sfd    = JB_INVALID_SOCKET;
2414
2415       csp->config = config = load_config();
2416
2417       if ( config->need_bind )
2418       {
2419          /*
2420           * Since we were listening to the "old port", we will not see
2421           * a "listen" param change until the next IJB request.  So, at
2422           * least 1 more request must be made for us to find the new
2423           * setting.  I am simply closing the old socket and binding the
2424           * new one.
2425           *
2426           * Which-ever is correct, we will serve 1 more page via the
2427           * old settings.  This should probably be a "show-proxy-args"
2428           * request.  This should not be a so common of an operation
2429           * that this will hurt people's feelings.
2430           */
2431
2432          close_socket(bfd);
2433
2434          bfd = bind_port_helper(config);
2435       }
2436
2437       log_error(LOG_LEVEL_CONNECT, "accept connection ... ");
2438
2439       if (!accept_connection(csp, bfd))
2440       {
2441          log_error(LOG_LEVEL_CONNECT, "accept failed: %E");
2442
2443 #ifdef AMIGA
2444          if(!childs)
2445          {
2446             exit(1);
2447          }
2448 #endif
2449          freez(csp);
2450          continue;
2451       }
2452       else
2453       {
2454          log_error(LOG_LEVEL_CONNECT, "OK");
2455       }
2456
2457 #ifdef FEATURE_TOGGLE
2458       if (global_toggle_state)
2459       {
2460          csp->flags |= CSP_FLAG_TOGGLED_ON;
2461       }
2462 #endif /* def FEATURE_TOGGLE */
2463
2464       if (run_loader(csp))
2465       {
2466          log_error(LOG_LEVEL_FATAL, "a loader failed - must exit");
2467          /* Never get here - LOG_LEVEL_FATAL causes program exit */
2468       }
2469
2470 #ifdef FEATURE_ACL
2471       if (block_acl(NULL,csp))
2472       {
2473          log_error(LOG_LEVEL_CONNECT, "Connection dropped due to ACL");
2474          close_socket(csp->cfd);
2475          freez(csp);
2476          continue;
2477       }
2478 #endif /* def FEATURE_ACL */
2479
2480       /* add it to the list of clients */
2481       csp->next = clients->next;
2482       clients->next = csp;
2483
2484       if (config->multi_threaded)
2485       {
2486          int child_id;
2487
2488 /* this is a switch () statment in the C preprocessor - ugh */
2489 #undef SELECTED_ONE_OPTION
2490
2491 /* Use Pthreads in preference to native code */
2492 #if defined(FEATURE_PTHREAD) && !defined(SELECTED_ONE_OPTION)
2493 #define SELECTED_ONE_OPTION
2494          {
2495             pthread_t the_thread;
2496             pthread_attr_t attrs;
2497
2498             pthread_attr_init(&attrs);
2499             pthread_attr_setdetachstate(&attrs, PTHREAD_CREATE_DETACHED);
2500             errno = pthread_create(&the_thread, &attrs,
2501                (void*)serve, csp);
2502             child_id = errno ? -1 : 0;
2503             pthread_attr_destroy(&attrs);
2504          }
2505 #endif
2506
2507 #if defined(_WIN32) && !defined(_CYGWIN) && !defined(SELECTED_ONE_OPTION)
2508 #define SELECTED_ONE_OPTION
2509          child_id = _beginthread(
2510             (void (*)(void *))serve,
2511             64 * 1024,
2512             csp);
2513 #endif
2514
2515 #if defined(__OS2__) && !defined(SELECTED_ONE_OPTION)
2516 #define SELECTED_ONE_OPTION
2517          child_id = _beginthread(
2518             (void(* _Optlink)(void*))serve,
2519             NULL,
2520             64 * 1024,
2521             csp);
2522 #endif
2523
2524 #if defined(__BEOS__) && !defined(SELECTED_ONE_OPTION)
2525 #define SELECTED_ONE_OPTION
2526          {
2527             thread_id tid = spawn_thread
2528                (server_thread, "server", B_NORMAL_PRIORITY, csp);
2529
2530             if ((tid >= 0) && (resume_thread(tid) == B_OK))
2531             {
2532                child_id = (int) tid;
2533             }
2534             else
2535             {
2536                child_id = -1;
2537             }
2538          }
2539 #endif
2540
2541 #if defined(AMIGA) && !defined(SELECTED_ONE_OPTION)
2542 #define SELECTED_ONE_OPTION
2543          csp->cfd = ReleaseSocket(csp->cfd, -1);
2544          
2545          if((child_id = (int)CreateNewProcTags(
2546             NP_Entry, (ULONG)server_thread,
2547             NP_Output, Output(),
2548             NP_CloseOutput, FALSE,
2549             NP_Name, (ULONG)"privoxy child",
2550             NP_StackSize, 200*1024,
2551             TAG_DONE)))
2552          {
2553             childs++;
2554             ((struct Task *)child_id)->tc_UserData = csp;
2555             Signal((struct Task *)child_id, SIGF_SINGLE);
2556             Wait(SIGF_SINGLE);
2557          }
2558 #endif
2559
2560 #if !defined(SELECTED_ONE_OPTION)
2561          child_id = fork();
2562
2563          /* This block is only needed when using fork().
2564           * When using threads, the server thread was
2565           * created and run by the call to _beginthread().
2566           */
2567          if (child_id == 0)   /* child */
2568          {
2569             int rc = 0;
2570 #ifdef FEATURE_TOGGLE
2571             int inherited_toggle_state = global_toggle_state;
2572 #endif /* def FEATURE_TOGGLE */
2573
2574             serve(csp);
2575
2576             /* 
2577              * If we've been toggled or we've blocked the request, tell Mom
2578              */
2579
2580 #ifdef FEATURE_TOGGLE
2581             if (inherited_toggle_state != global_toggle_state)
2582             {
2583                rc |= RC_FLAG_TOGGLED;
2584             }
2585 #endif /* def FEATURE_TOGGLE */
2586
2587 #ifdef FEATURE_STATISTICS  
2588             if (csp->flags & CSP_FLAG_REJECTED)
2589             {
2590                rc |= RC_FLAG_BLOCKED;
2591             }
2592 #endif /* ndef FEATURE_STATISTICS */
2593
2594             _exit(rc);
2595          }
2596          else if (child_id > 0) /* parent */
2597          {
2598             /* in a fork()'d environment, the parent's
2599              * copy of the client socket and the CSP
2600              * are not used.
2601              */
2602             int child_status;
2603 #if !defined(_WIN32) && !defined(__CYGWIN__)
2604
2605             wait( &child_status );
2606
2607             /* 
2608              * Evaluate child's return code: If the child has
2609              *  - been toggled, toggle ourselves
2610              *  - blocked its request, bump up the stats counter
2611              */
2612
2613 #ifdef FEATURE_TOGGLE
2614             if (WIFEXITED(child_status) && (WEXITSTATUS(child_status) & RC_FLAG_TOGGLED))
2615             {
2616                global_toggle_state = !global_toggle_state;
2617             }
2618 #endif /* def FEATURE_TOGGLE */
2619
2620 #ifdef FEATURE_STATISTICS
2621             urls_read++;
2622             if (WIFEXITED(child_status) && (WEXITSTATUS(child_status) & RC_FLAG_BLOCKED))
2623             {
2624                urls_rejected++;
2625             }
2626 #endif /* def FEATURE_STATISTICS */ 
2627
2628 #endif /* !defined(_WIN32) && defined(__CYGWIN__) */
2629             close_socket(csp->cfd);
2630             csp->flags &= ~CSP_FLAG_ACTIVE;
2631          }
2632 #endif
2633
2634 #undef SELECTED_ONE_OPTION
2635 /* end of cpp switch () */
2636
2637          if (child_id < 0) /* failed */
2638          {
2639             char buf[BUFFER_SIZE];
2640
2641             log_error(LOG_LEVEL_ERROR, "can't fork: %E");
2642
2643             sprintf(buf , "Privoxy: can't fork: errno = %d", errno);
2644
2645             write_socket(csp->cfd, buf, strlen(buf));
2646             close_socket(csp->cfd);
2647             csp->flags &= ~CSP_FLAG_ACTIVE;
2648             sleep(5);
2649             continue;
2650          }
2651       }
2652       else
2653       {
2654          serve(csp);
2655       }
2656    }
2657
2658    /* NOTREACHED unless FEATURE_GRACEFUL_TERMINATION is defined */
2659
2660    /* Clean up.  Aim: free all memory (no leaks) */
2661 #ifdef FEATURE_GRACEFUL_TERMINATION
2662
2663    log_error(LOG_LEVEL_ERROR, "Graceful termination requested");
2664
2665    unload_current_config_file();
2666    unload_current_actions_file();
2667    unload_current_re_filterfile();
2668 #ifdef FEATURE_TRUST
2669    unload_current_trust_file();
2670 #endif
2671
2672    if (config->multi_threaded)
2673    {
2674       int i = 60;
2675       do
2676       {
2677          sleep(1);
2678          sweep();
2679       } while ((clients->next != NULL) && (--i > 0));
2680
2681       if (i <= 0)
2682       {
2683          log_error(LOG_LEVEL_ERROR, "Graceful termination failed - still some live clients after 1 minute wait.");
2684       }
2685    }
2686    sweep();
2687    sweep();
2688
2689 #if defined(unix)
2690    freez(basedir);
2691 #endif
2692    freez(configfile);
2693
2694 #ifdef FEATURE_COOKIE_JAR
2695    if (NULL != config->jar)
2696    {
2697       fclose(config->jar);
2698    }
2699 #endif
2700
2701 #if defined(_WIN32) && !defined(_WIN_CONSOLE)
2702    /* Cleanup - remove taskbar icon etc. */
2703    TermLogWindow();
2704 #endif
2705
2706    exit(0);
2707 #endif /* FEATURE_GRACEFUL_TERMINATION */
2708
2709 }
2710
2711
2712 /*
2713   Local Variables:
2714   tab-width: 3
2715   end:
2716 */