Extended the Filter File chapter & minor fixes
[privoxy.git] / doc / source / user-manual.sgml
1 <!DOCTYPE article PUBLIC "-//OASIS//DTD DocBook V3.1//EN" [
2 <!entity % dummy "IGNORE"> 
3 <!entity supported SYSTEM "supported.sgml">
4 <!entity newfeatures SYSTEM "newfeatures.sgml">
5 <!entity p-intro SYSTEM "privoxy.sgml">
6 <!entity seealso SYSTEM "seealso.sgml">
7 <!entity buildsource SYSTEM "buildsource.sgml">
8 <!entity contacting SYSTEM "contacting.sgml">
9 <!entity history SYSTEM "history.sgml">
10 <!entity copyright SYSTEM "copyright.sgml">
11 <!entity license SYSTEM "license.sgml">
12 <!entity p-version "2.9.15">
13 <!entity p-status "beta">
14 <!entity % p-not-stable "INCLUDE">
15 <!entity % p-stable "IGNORE">
16 <!entity % p-text "IGNORE">        <!-- define we are not a text only doc -->
17 <!entity % p-doc "INCLUDE">        <!-- and we are a formal doc           -->
18 <!entity % p-readme "IGNORE">
19 <!entity % p-config "IGNORE">
20 <!entity % p-supp-userman "IGNORE"> <!-- Omit some from supported.sgml    -->
21 <!entity  my-copy "&copy;">         <!-- kludge for docbook2man           -->
22 ]>
23 <!--
24  File        :  $Source: /cvsroot/ijbswa/current/doc/source/user-manual.sgml,v $
25
26  Purpose     :  user manual
27                 This file belongs into
28                 ijbswa.sourceforge.net:/home/groups/i/ij/ijbswa/htdocs/
29
30  $Id: user-manual.sgml,v 1.114 2002/05/16 09:42:50 oes Exp $
31
32  Copyright (C) 2001, 2002 Privoxy Developers <developers@privoxy.org>
33  See LICENSE.
34
35  ========================================================================
36  NOTE: Please read developer-manual/documentation.html before touching 
37  anything in this, or other Privoxy documentation.
38  ========================================================================
39
40 -->
41
42 <article id="index">
43 <artheader>
44
45 <title>Privoxy User Manual</title>
46
47 <pubdate>
48  <subscript>
49 <!-- Completely the wrong markup, but very little is allowed  -->
50 <!-- in this part of an article. FIXME -->
51  <link linkend="copyright">Copyright</link> &my-copy; 2001, 2002 by 
52  <ulink url="http://www.privoxy.org">Privoxy Developers</ulink>
53  </subscript>
54 </pubdate>
55
56 <pubdate>$Id: user-manual.sgml,v 1.114 2002/05/16 09:42:50 oes Exp $</pubdate>
57
58 <!--
59
60 Note: the following should generate a separate page, and a live link to it,
61 all nicely done. But it doesn't for some mysterious reason. Please leave
62 commented unless it can be fixed proper. For the time being, the
63 copyright/license declarations will be in their own sgml.
64
65 Hal.
66
67 <copyright>
68   <year>2001</year>
69   <year>2002</year>
70   <holder>Privoxy Developers</holder>
71 </copyright>
72
73 <legalnotice id="legalnotice"> 
74  <para>
75   text goes here ........
76  </para>
77 </legalnotice>
78
79 -->
80
81
82 <abstract>
83
84 <![%dummy;[
85  <para>
86  <comment>
87   This is here to keep vim syntax file from breaking :/
88   If I knew enough to fix it, I would.
89   PLEASE DO NOT REMOVE! HB: hal@foobox.net
90  </comment>
91  </para>
92 ]]>
93
94  <para>
95   The user manual gives users information on how to install, configure and use
96   <ulink
97   url="http://www.privoxy.org/"><application>Privoxy</application></ulink>.
98  </para>
99
100 <!-- Include privoxy.sgml boilerplate: -->
101  &p-intro;
102 <!-- end privoxy.sgml -->
103
104  <para>
105   You can find the latest version of the user manual at  <ulink
106   url="http://www.privoxy.org/user-manual/">http://www.privoxy.org/user-manual/</ulink>.
107   Please see the <ulink url="contact.html">Contact section</ulink> on how to
108   contact the developers.
109  </para>
110
111 <!--   <para> -->
112 <!--    Feel free to send a note to the developers at <email>ijbswa-developers@lists.sourceforge.net</email>. -->
113 <!--   </para> -->
114 </abstract>
115
116 </artheader>
117
118 <!--   ~~~~~       New section      ~~~~~     -->
119 <sect1 label="1" id="introduction"><title>Introduction</title>
120 <para>
121  This documentation is included with the current &p-status; version of
122  <application>Privoxy</application>, v.&p-version;<![%p-not-stable;[, 
123  and is mostly complete at this point. The most up to date reference for the
124  time being is still the comments in the source files and in the individual
125  configuration files. Development of version 3.0 is currently nearing
126  completion, and includes many significant changes and enhancements over
127  earlier versions. The target release date for
128  stable v3.0 is <quote>soon</quote> ;-)]]>.
129 </para>
130
131 <!-- include only in non-stable versions -->
132 <![%p-not-stable;[
133 <para>
134  Since this is a &p-status; version, not all new features are well tested. This
135  documentation may be slightly out of sync as a result (especially with 
136  CVS sources). And there <emphasis>may be</emphasis> bugs, though hopefully
137  not many! 
138 </para>
139 ]]>
140
141 <!--   ~~~~~       New section      ~~~~~     -->
142 <sect2 id="features"><title>Features</title>
143 <para>
144  In addition to <application>Internet Junkbuster's</application> traditional
145  features of ad and banner blocking and cookie management,
146  <application>Privoxy</application> provides new features<![%p-not-stable;[,
147  some of them currently under development]]>:
148 </para>
149 <!-- Include newfeatures.sgml boilerplate here: -->
150  &newfeatures;
151 <!-- end boilerplate -->
152 </sect2>
153
154 </sect1>
155
156 <!--  ~  End section  ~  -->
157
158
159 <!--   ~~~~~       New section      ~~~~~     -->
160 <sect1 id="installation"><title>Installation</title>
161
162 <para>
163  <application>Privoxy</application> is available both in convenient pre-compiled
164  packages for a wide range of operating systems, and as raw source code.
165  For most users, we recommend using the packages, which can be downloaded from our
166  <ulink url="http://sourceforge.net/projects/ijbswa/">Privoxy Project
167  Page</ulink>.
168 </para>
169
170 <para>
171  Note: If you have a previous <application>Junkbuster</application> or
172  <application>Privoxy</application> installation on your system, you
173  will need to remove it.  On some platforms, this may be done for you as part
174  of their installation procedure. (See below for your platform). In any case
175  <emphasis>be sure to backup your old configuration if it is valuable to
176  you.</emphasis> See the <link linkend="upgradersnote">note to
177  upgraders</link> section below.
178 </para>
179
180 <!--   ~~~~~       New section      ~~~~~     --> 
181 <sect2 id="installation-packages"><title>Binary Packages</title>
182 <para>
183 How to install the binary packages depends on your operating system:
184 </para>
185
186 <!--   ~~~~~       New section      ~~~~~     -->
187 <sect3 id="installation-pack-rpm"><title>Red Hat, SuSE RPMs and Conectiva</title>
188
189 <para>
190  RPMs can be installed with <literal>rpm -Uvh privoxy-&p-version;-1.rpm</literal>,
191  and will use <filename>/etc/privoxy</filename> for the location 
192  of configuration files.
193 </para>
194
195 <para>
196  Note that on Red Hat, <application>Privoxy</application> will
197  <emphasis>not</emphasis> be automatically started on system boot. You will
198  need to enable that using <command>chkconfig</command>,
199  <command>ntsysv</command>, or similar methods. Note that SuSE will 
200 automatically start Privoxy in the boot process.
201 </para>
202
203 <para>
204  If you have problems with failed dependencies, try rebuilding the SRC RPM: 
205  <literal>rpm --rebuild privoxy-&p-version;-1.src.rpm;</literal>. This 
206  will use your locally installed libraries and RPM version. 
207 </para>
208
209 <para>
210  Also note that if you have a <application>Junkbuster</application> RPM installed
211  on your system, you need to remove it first, because the packages conflict.
212  Otherwise, RPM will try to remove <application>Junkbuster</application>
213  automatically, before installing <application>Privoxy</application>.
214 </para>
215 </sect3>
216
217 <!--   ~~~~~       New section      ~~~~~     -->
218 <sect3 id="installation-deb"><title>Debian</title>
219 <para>
220  FIXME.
221 </para>
222 </sect3>
223
224 <!--   ~~~~~       New section      ~~~~~     -->
225 <sect3 id="installation-pack-win"><title>Windows</title>
226
227 <para>
228  Just double-click the installer, which will guide you through
229  the installation process. You will find the configuration files
230  in the same directory as you installed Privoxy in. We do not
231  use the registry of Windows. 
232 </para>
233 </sect3>
234
235 <!--   ~~~~~       New section      ~~~~~     -->
236 <sect3 id="installation-pack-bintgz"><title>Solaris, NetBSD, FreeBSD, HP-UX</title>
237
238 <para>
239  Create a new directory, <literal>cd</literal> to it, then unzip and
240  untar the archive. For the most part, you'll have to figure out where
241  things go. FIXME.
242 </para>
243 </sect3>
244
245 <!--   ~~~~~       New section      ~~~~~     -->
246 <sect3 id="installation-os2"><title>OS/2</title>
247
248 <para>
249  First, make sure that no previous installations of
250  <application>Junkbuster</application> and / or 
251  <application>Privoxy</application> are left on your
252  system. You can do this by 
253 </para>
254
255 <para>
256  Then, just double-click the WarpIN self-installing archive, which will
257  guide you through the installation process. A shadow of the
258  <application>Privoxy</application> executable will be placed in your
259  startup folder so it will start automatically whenever OS/2 starts.
260 </para>
261
262 <para>
263  The directory you choose to install <application>Privoxy</application>
264  into will contain all of the configuration files.
265 </para>
266 </sect3>
267
268 <!--   ~~~~~       New section      ~~~~~     -->
269 <sect3 id="installation-mac"><title>Max OSX</title>
270 <para>
271  Unzip the downloaded package (you can either double-click on the file
272  in the finder, or on the desktop if you downloaded it there).  Then,
273  double-click on the package installer icon and follow the installation
274  process.
275  <application>Privoxy</application> will be installed in the subdirectory
276  <literal>/Applications/Privoxy.app</literal>.
277  <application>Privoxy</application> will set itself up to start 
278  automatically on system bring-up via
279  <literal>/System/Library/StartupItems/Privoxy</literal>.
280 </para>
281 </sect3>
282
283 <!--   ~~~~~       New section      ~~~~~     -->
284 <sect3 id="installation-amiga"><title>AmigaOS</title>
285 <para>
286  Copy and then unpack the <filename>lha</filename> archive to a suitable location. 
287  All necessary files will be installed into <application>Privoxy</application>
288  directory, including all configuration and log files. To uninstall, just 
289  remove this directory.
290 </para>
291 <para>
292  Start <application>Privoxy</application> (with RUN &lt;&gt;NIL:) in your
293  <filename>startnet</filename> script (AmiTCP), in
294  <filename>s:user-startup</filename> (RoadShow), as startup program in your
295  startup script (Genesis), or as startup action (Miami and MiamiDx). 
296  <application>Privoxy</application> will automatically quit when you quit your
297  TCP/IP stack (just ignore the harmless warning your TCP/IP stack may display that
298  <application>Privoxy</application> is still running).
299 </para>
300 </sect3>
301 </sect2>
302
303 <!--   ~~~~~       New section      ~~~~~     -->
304 <sect2 id="installation-source"><title>Building from Source</title>
305
306 <para>
307  The most convenient way to obtain the <application>Privoxy</application> sources
308  is to download the source tarball from our <ulink url="http://sf.net/projects/ijbswa/">project
309  page</ulink>.
310 </para>
311
312 <para>
313  If you like to live on the bleeding edge and are not afraid of using
314  possibly unstable development versions, you can check out the up-to-the-minute
315  version directly from <ulink url="http://sourceforge.net/cvs/?group_id=11118">the
316  CVS repository</ulink> or simply download <ulink
317  url="http://cvs.sourceforge.net/cvstarballs/ijbswa-cvsroot.tar.gz">the nightly CVS
318  tarball.</ulink>
319 </para>
320
321 <!-- include buildsource.sgml boilerplate: -->
322 &buildsource;
323 <!-- end boilerplate -->
324
325 </sect2>
326
327 </sect1>
328
329 <!--  ~  End section  ~  -->
330
331 <!--   ~~~~~       New section      ~~~~~     -->
332 <sect1 id="upgradersnote">
333 <title>Note to Upgraders</title>
334 <para>
335  There are very significant changes from earlier 
336  <application>Junkbuster</application> versions to the current
337  <application>Privoxy</application>. The number, names, syntax, and
338  purposes of configuration files have substantially  changed.
339  <application>Junkbuster 2.0.x</application> configuration
340  files will not migrate, <application>Junkbuster 2.9.x</application>
341  and <application>Privoxy</application> configurations will need to be
342  ported. The functionalities of the old <filename>blockfile</filename>,
343  <filename>cookiefile</filename> and <filename>imagelist</filename> 
344  are now combined into the <link linkend="actions-file"><quote>actions
345  files</quote></link>.  
346  <filename>default.action</filename>, is the main actions file. Local
347  exceptions should best be put into <filename>user.action</filename>.
348 </para>
349 <para>
350  A <link linkend="filter-file"><quote>filter file</quote></link> (typically
351  <filename>default.filter</filename>) is new as of <application>Privoxy
352  2.9.x</application>, and provides some of the new sophistication (explained
353  below). <filename>config</filename> is much the same as before.
354 </para>
355 <para>
356  If upgrading from a 2.0.x version, you will have to use the new config 
357  files, and possibly adapt any personal rules from your older files.
358  When porting personal rules over from the old <filename>blockfile</filename>
359  to the new actions files, please note that even the pattern syntax has
360  changed. If upgrading from 2.9.x development versions, it is still
361  recommended to use the new configuration files.
362 </para>
363 <para>
364  A quick list of things to be aware of before upgrading: 
365 </para>
366
367 <para>
368  <itemizedlist>
369
370  <listitem>
371   <para>
372    The default listening port is now 8118 due to a conflict with another 
373    service (NAS).
374   </para>
375  </listitem>  
376  <listitem>
377   <para>  
378     Some installers may remove earlier versions completely. Save any 
379     important configuration files!
380   </para>
381  </listitem>
382  <listitem>
383   <para>
384    <application>Privoxy</application> is controllable with a web browser 
385    at the special URL: <ulink
386    url="http://config.privoxy.org/">http://config.privoxy.org/</ulink>
387    (Shortcut: <ulink url="http://p.p/">http://p.p/</ulink>). Many
388    aspects of configuration can be done here, including temporarily disabling
389    <application>Privoxy</application>.
390   </para>
391  </listitem> 
392  <listitem>
393   <para>
394    The primary configuration files for cookie management, ad and banner 
395    blocking, and many other aspects of <application>Privoxy</application>
396    configuration are the <link linkend="actions-file">actions
397    files</link>. It is strongly recommended to become familiar with the new
398    actions concept below, before modifying these files. Locally defined rules 
399    should go into <filename>user.action</filename>.
400   </para>
401  </listitem> 
402   <listitem>
403   <para>
404 <!-- I think it is best to keep this somewhat vague, in case  -->
405 <!-- the situation changes under our feet. -->   
406    Some installers may not automatically start
407    <application>Privoxy</application> after installation.
408   </para>
409  </listitem> 
410
411  </itemizedlist>
412 </para>
413 </sect1>
414
415 <!--   ~~~~~       New section      ~~~~~     -->
416 <sect1 id="quickstart"><title>Quickstart to Using <application>Privoxy</application></title>
417 <para>
418  <itemizedlist>
419
420  <listitem>
421   <para>
422    If upgrading, from versions before 2.9.16, please back up any configuration
423    files. See the <link linkend="upgradersnote">Note to Upgraders</link> Section.
424  </para>
425 </listitem> 
426
427  <listitem>
428   <para>
429    Install <application>Privoxy</application>. See the <link
430    linkend="installation">Installation Section</link> for platform specific
431    information. 
432  </para>
433  </listitem>  
434
435  <listitem>
436   <para>
437    Advanced users and those who want to offer <application>Privoxy</application>
438    service to more than just their local machine should check the <link
439    linkend="config">main config file</link>, especially the <link
440    linkend="access-control">security-relevant</link> options.
441   </para>
442  </listitem>
443
444  <listitem>
445   <para>
446    Start <application>Privoxy</application>, if the installation program has
447    not done this already. See the section <link linkend="startup">Starting
448    <application>Privoxy</application></link>.
449   </para>
450  </listitem>  
451
452  <listitem>
453   <para>
454    Set your browser to use <application>Privoxy</application> as HTTP and HTTPS
455    proxy by setting the proxy configuration for address of
456    <literal>127.0.0.1</literal> and port <literal>8118</literal>.
457    (<application>Junkbuster</application> and earlier versions of
458    <application>Privoxy</application> used port 8000.) See the section <link
459    linkend="startup">Starting <application>Privoxy</application></link>.
460   </para>
461  </listitem>  
462
463  <listitem>
464   <para>
465     Flush your browser's caches, to remove any cached ad images.
466   </para>
467 </listitem> 
468
469  <listitem>
470   <para>
471    Enjoy surfing with enhanced comfort and privacy.
472   </para>
473  </listitem> 
474  
475  <listitem>
476   <para>
477     If you experience ads that slipped through, innocent images that are
478     blocked, or otherwise feel the need to fine-tune <application>Privoxy's</application>
479     behaviour, take a look at the <link linkend="actions-file">actions files</link>.
480     As a quick start, you might find the <link linkend="act-examples">richly
481     commented examples</link> helpful. You can also view and edit the actions
482     files through the <ulink url="http://config.privoxy.org">web-based
483     user interface</ulink>. The Appendix <quote><link linkend="actionsanat">Anatomy of
484     an Action</link></quote> has hints how to debug actions that <quote>misbehave</quote>.
485   </para>
486  </listitem> 
487  
488  <listitem>
489   <para>
490    Please see the section <link linkend="contact">Contacting the
491    Developers</link> on how to report bugs or problems with websites or to get
492    help. 
493   </para>
494  </listitem> 
495  </itemizedlist>
496 </para>
497
498 </sect1>
499
500 <!--   ~~~~~       New section      ~~~~~     -->
501 <sect1 id="startup">
502 <title>Starting <application>Privoxy</application></title>
503 <para>
504  Before launching <application>Privoxy</application> for the first time, you
505  will want to configure your browser(s) to use
506  <application>Privoxy</application> as a HTTP and HTTPS proxy. The default is
507  127.0.0.1 (or localhost) for the proxy address, and port 8118 (earlier versions
508  used port 8000). This is the one configuration step that must be done!
509 </para>
510  
511 <para> 
512  With <application>Netscape</application> (and
513  <application>Mozilla</application>), this can be set under <literal>Edit
514  -&gt; Preferences -&gt; Advanced -&gt; Proxies -&gt; HTTP Proxy</literal>.
515  For <application>Internet Explorer</application>: <literal>Tools -&gt;
516  Internet Properties -&gt; Connections -&gt; LAN Setting</literal>. Then,
517  check <quote>Use Proxy</quote> and fill in the appropriate info (Address:
518  127.0.0.1, Port: 8118). Include if HTTPS proxy support too.
519 </para>
520
521 <para>
522  After doing this, flush your browser's disk and memory caches to force a
523  re-reading of all pages and to get rid of any ads that may be cached. You 
524  are now ready to start enjoying the benefits of using
525  <application>Privoxy</application>!
526 </para>
527
528 <para>
529  <application>Privoxy</application> is typically started by specifying the
530  main configuration file to be used on the command line. If no configuration
531  file is specified on the command line, <application>Privoxy</application>
532  will look for a file named <filename>config</filename> in the current
533  directory. Except on Win32 where it will try <filename>config.txt</filename>.
534 </para>
535
536 <sect2 id="start-redhatdebian">
537 <title>RedHat, Conectiva and Debian</title>
538 <para>
539 We use a script. Note that RedHat does not start Privoxy upon booting per
540 default. It will use the file <filename>/etc/privoxy/config</filename> as its
541 main configuration file. FIXME: Debian??
542 </para>
543 <para>
544  <screen>
545  # /etc/rc.d/init.d/privoxy start
546 </screen>
547 </para>
548 </sect2>
549
550 <sect2 id="start-suse">
551 <title>SuSE</title>
552 <para>
553 We use a script. It will use the file <filename>/etc/privoxy/config</filename>
554 as its main configuration file. Note that SuSE starts Privoxy upon booting
555 your PC.
556 </para>
557 <para>
558  <screen>
559  # rcprivoxy start
560 </screen>
561 </para>
562 </sect2>
563
564 <sect2 id="start-windows">
565 <title>Windows</title>
566 <para>
567 Click on the Privoxy Icon to start Privoxy. If no configuration file is
568  specified on the command line, <application>Privoxy</application> will look
569  for a file named <filename>config.txt</filename>. Note that Windows will
570  automatically start Privoxy upon booting you PC.
571 </para>
572 </sect2>
573
574 <sect2 id="start-unices">
575 <title>Solaris, NetBSD, FreeBSD, HP-UX and others</title>
576 <para>
577 Example Unix startup command:
578 </para>
579 <para>
580  <screen>
581  # /usr/sbin/privoxy /etc/privoxy/config
582 </screen>
583 </para>
584 </sect2>
585
586 <sect2 id="start-os2">
587 <title>OS/2</title>
588 <para>
589 FIXME.
590 </para>
591 </sect2>
592
593 <sect2 id="start-macosx">
594 <title>MAX OSX</title>
595 <para>
596 FIXME.
597 </para>
598 </sect2>
599
600
601 <sect2 id="start-amigaos">
602 <title>AmigaOS</title>
603 <para>
604 FIXME.
605 </para>
606 </sect2>
607
608 <!--
609
610 <para>
611  See the section <link linkend="cmdoptions">Command line options</link> for
612  furher info.
613 </para>
614
615 must find a better place for this paragraph
616
617 <para>
618  The included default configuration files should give a reasonable starting
619  point. Most of the per site configuration is done in the
620  <ulink url="actions-file.html"><quote>actions</quote></ulink> files. These are
621  where various cookie actions are defined, ad and banner blocking, and other
622  aspects of <application>Privoxy</application> configuration. There are several
623  such files included, with varying levels of aggressiveness. 
624 </para>
625
626 <para>
627  You will probably want to keep an eye out for sites for which you may prefer
628  persistent cookies, and add these to your actions configuration as needed. By
629  default, most of these will be accepted only during the current browser
630  session (aka <quote>session cookies</quote>), unless you add them to the
631  configuration. If you want the browser to handle this instead, you will need
632  to edit <filename>user.action</filename> (or through the web based interface)
633  and disable this feature. If you use more than one browser, it would make
634  more sense to let <application>Privoxy</application> handle this. In which
635  case, the browser(s) should be set to accept all cookies.
636 </para>
637
638 <para>
639  Another feature where you will probably want to define exceptions for trusted
640  sites is the popup-killing (through the <ulink
641  url="actions-file.html#KILL-POPUPS"><quote>+kill-popups</quote></ulink> and
642  <ulink
643  url="actions-file.html#FILTER-POPUPS"><quote>+filter{popups}</quote></ulink>
644  actions), because your favorite shopping, banking, or leisure site may need
645  popups (explained below). 
646 </para>
647
648 <para>
649  <application>Privoxy</application> is HTTP/1.1 compliant,  but not all of
650  the optional 1.1 features are as yet supported. In the unlikely event that
651  you experience inexplicable problems with browsers that use HTTP/1.1 per default
652  (like <application>Mozilla</application> or recent versions of I.E.), you might
653  try to force HTTP/1.0 compatibility. For Mozilla, look under <literal>Edit -&gt;
654  Preferences -&gt; Debug -&gt; Networking</literal>.
655  Alternatively, set the <quote>+downgrade-http-version</quote> config option in
656  <filename>default.action</filename> which will downgrade your browser's HTTP
657  requests from HTTP/1.1 to HTTP/1.0 before processing them.
658 </para>
659
660 <para>
661  After running <application>Privoxy</application> for a while, you can 
662  start to fine tune the configuration to suit your personal, or site, 
663  preferences and requirements. There are many, many aspects that can 
664  be customized. <quote>Actions</quote> 
665  can be adjusted by pointing your browser to 
666  <ulink url="http://config.privoxy.org/">http://config.privoxy.org/</ulink>
667  (shortcut: <ulink url="http://p.p/">http://p.p/</ulink>), 
668  and then follow the link to <quote>View &#38; Change the Current Configuration</quote>. 
669  (This is an internal page and does not require Internet access.)
670 </para>
671
672 <para>
673  In fact, various aspects of <application>Privoxy</application>
674  configuration can be viewed from this page, including 
675  current configuration parameters, source code version numbers, 
676  the browser's request headers, and <quote>actions</quote> that apply 
677  to a given URL. In addition to the actions file 
678  editor mentioned above, <application>Privoxy</application> can also 
679  be turned <quote>on</quote> and <quote>off</quote> (toggled) from this page.
680 </para>
681
682 <para>
683  If you encounter problems, try loading the page without
684  <application>Privoxy</application>. If that helps, enter the URL where
685  you have the problems into <ulink url="http://p.p/show-url-info">the browser
686  based rule tracing utility</ulink>. See which rules apply and why, and
687  then try turning them off for that site one after the other, until the problem
688  is gone. When you have found the culprit, you might want to turn the rest on
689  again.
690 </para>
691
692 <para>
693  If the above paragraph sounds gibberish to you, you might want to <ulink
694  url="actions-file.html#ACTIONSFILE">read more about the actions concept</ulink>
695  or even dive deep into the <ulink url="appendix.html#ACTIONSANAT">Appendix
696  on actions</ulink>.
697 </para>
698
699 <para>
700  If you can't get rid of the problem at all, think you've found a bug in
701  Privoxy, want to propose a new feature or smarter rules, please see the 
702  section <ulink url="contact.html"><quote>Contacting the
703  Developers</quote></ulink> below. 
704 </para>
705
706 -->
707
708 <!--   ~~~~~       New section      ~~~~~     -->
709 <sect2 id="cmdoptions">
710 <title>Command Line Options</title>
711 <para>
712  <application>Privoxy</application> may be invoked with the following
713  command-line options:
714 </para>
715
716 <para>
717  <itemizedlist>
718
719  <listitem>
720   <para>
721     <emphasis>--version</emphasis>
722   </para>
723   <para>
724      Print version info and exit. Unix only.
725   </para>
726  </listitem> 
727  <listitem>
728   <para>
729     <emphasis>--help</emphasis>
730   </para>
731   <para>
732    Print short usage info and exit. Unix only.
733   </para>
734  </listitem> 
735  <listitem>
736   <para>
737    <emphasis>--no-daemon</emphasis>
738   </para>
739   <para>
740    Don't become a daemon, i.e. don't fork and become process group
741    leader, and don't detach from controlling tty. Unix only.
742   </para>
743  </listitem> 
744  <listitem>
745   <para>
746    <emphasis>--pidfile FILE</emphasis>
747   
748   </para>
749   <para>
750    On startup, write the process ID to <emphasis>FILE</emphasis>. Delete the
751    <emphasis>FILE</emphasis> on exit. Failure to create or delete the
752    <emphasis>FILE</emphasis> is non-fatal. If no <emphasis>FILE</emphasis>
753    option is given, no PID file will be used. Unix only.
754   </para>
755  </listitem> 
756  <listitem>
757   <para>
758    <emphasis>--user USER[.GROUP]</emphasis>
759   
760   </para>
761   <para>
762    After (optionally) writing the PID file, assume the user  ID  of
763    <emphasis>USER</emphasis>, and if included the GID of GROUP.  Exit if the
764    privileges are not sufficient to do so. Unix only.
765   </para>
766  </listitem> 
767  <listitem>
768   <para>
769     <emphasis>configfile</emphasis>
770   </para>
771   <para>
772     If no <emphasis>configfile</emphasis> is included on the command line, 
773     <application>Privoxy</application> will look for a file named 
774     <quote>config</quote> in the current directory (except on Win32 
775     where it will look for <quote>config.txt</quote> instead). Specify 
776     full path to avoid confusion. If no config file is found, 
777     <application>Privoxy</application> will fail to start.
778   </para>
779  </listitem> 
780
781  </itemizedlist>
782 </para>
783
784 </sect2>
785
786 </sect1>
787
788 <!--  ~  End section  ~  -->
789
790
791 <!--   ~~~~~       New section      ~~~~~     -->
792 <sect1 id="configuration"><title><application>Privoxy</application> Configuration</title>
793  <para>
794   All <application>Privoxy</application> configuration is stored  
795   in text files. These files can be edited with a text editor.
796   Many important aspects of <application>Privoxy</application> can 
797   also be controlled easily with a web browser.
798  </para>
799
800
801 <!--   ~~~~~       New section      ~~~~~     -->
802
803 <sect2>
804 <title>Controlling <application>Privoxy</application> with Your Web Browser</title>
805 <para>
806  <application>Privoxy</application>'s user interface can be reached through the special 
807  URL <ulink url="http://config.privoxy.org/">http://config.privoxy.org/</ulink>
808  (shortcut: <ulink url="http://p.p/">http://p.p/</ulink>), 
809  which is a built-in page and works without Internet access.
810  You will see the following section:
811
812 </para>
813
814 <!-- Needs to be put in a table and colorized  -->
815 <screen>
816  <msgtext>
817  <bridgehead renderas="sect2">Privoxy Menu</bridgehead>
818
819  <simplelist>
820  <member>
821   &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&squf;&nbsp;&nbsp;<ulink url="http://config.privoxy.org/show-status">View & change the current configuration</ulink>
822  </member>
823  <member>
824   &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&squf;&nbsp;&nbsp;<ulink url="http://config.privoxy.org/show-version">View the source code version numbers</ulink>
825  </member>
826  <member>
827   &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&squf;&nbsp;&nbsp;<ulink url="http://config.privoxy.org/show-request">View the request headers.</ulink>
828  </member>
829  <member>
830   &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&squf;&nbsp;&nbsp;<ulink url="http://config.privoxy.org/show-url-info">Look up which actions apply to a URL and why</ulink>
831  </member>
832  <member>
833   &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&squf;&nbsp;&nbsp;<ulink url="http://config.privoxy.org/toggle">Toggle Privoxy on or off</ulink>
834  </member>
835  </simplelist>
836  </msgtext>
837 </screen>
838
839
840 <para>
841  This should be self-explanatory. Note the first item leads to an editor for the
842  <link linkend="actions-file">actions files</link>, which is where the ad, banner,
843  cookie, and URL blocking magic is configured as well as other advanced features of
844  <application>Privoxy</application>. This is an easy way to adjust various
845  aspects of <application>Privoxy</application> configuration. The actions
846  file, and other configuration files, are explained in detail below. 
847 </para>
848
849 <para>
850  <quote>Toggle Privoxy On or Off</quote> is handy for sites that might 
851  have problems with your current actions and filters. You can in fact use
852  it as a test to see whether it is <application>Privoxy</application> 
853  causing the problem or not. <application>Privoxy</application> continues 
854  to run as a proxy in this case, but all manipulation is disabled, i.e.
855  <application>Privoxy</application> acts like a normal forwarding proxy. There
856  is even a toggle <link linkend="bookmarklets">Bookmarklet</link> offered, so
857  that you can toggle <application>Privoxy</application> with one click from
858  your browser.
859 </para>
860
861 </sect2>
862
863 <!--  ~  End section  ~  -->
864
865
866
867
868 <!--   ~~~~~       New section      ~~~~~     -->
869
870 <sect2 id="confoverview">
871 <title>Configuration Files Overview</title>
872 <para>
873  For Unix, *BSD and Linux, all configuration files are located in
874  <filename>/etc/privoxy/</filename> by default. For MS Windows, OS/2, and
875  AmigaOS these are all in the same directory as the 
876  <application>Privoxy</application> executable. <![%p-not-stable;[ The name
877  and number of configuration files has changed from previous versions, and is
878  subject to change as development progresses.]]>
879 </para>
880
881 <para>
882  The installed defaults provide a reasonable starting point, though 
883  some settings may be aggressive by some standards. For the time being, the
884  principle configuration files are:
885 </para>
886
887 <para>
888  <itemizedlist>
889
890   <listitem>
891    <para>
892      The <link linkend="config">main configuration file</link> is named <filename>config</filename>
893      on Linux, Unix, BSD, OS/2, and AmigaOS and <filename>config.txt</filename>
894      on Windows. This is a required file.
895    </para>
896   </listitem> 
897
898   <listitem>
899    <para>
900     <filename>default.action</filename> (the main <link linkend="actions-file">actions file</link>)
901     is used to define which <quote>actions</quote> relating to banner-blocking, images, pop-ups,
902     content modification, cookie handling etc should be applied by default. It also defines many
903     exceptions (both positive and negative) from this default set of actions that enable 
904     <application>Privoxy</application> to selectively eliminate the junk, and only the junk, on
905     as many websites as possible.
906    </para>
907    <para>
908     Multiple actions files may be defined in <filename>config</filename>. These 
909     are processed in the order they are defined. Local customizations and locally 
910     preferred exceptions to the default policies  as defined in
911     <filename>default.action</filename> (which you will most probably want
912     to define sooner or later) are probably best applied in
913     <filename>user.action</filename>, where you can preserve them across
914     upgrades. <filename>standard.action</filename> is for
915     <application>Privoxy's</application> internal use.
916    </para>
917    <para>    
918     There is also a web based editor that can be accessed from
919     <ulink
920     url="http://config.privoxy.org/show-status">http://config.privoxy.org/show-status</ulink>
921     (Shortcut: <ulink
922     url="http://p.p/show-status">http://p.p/show-status</ulink>) for the
923     various actions files. 
924    </para>
925   </listitem> 
926
927   <listitem>
928    <para>
929     <filename>default.filter</filename> (the <link linkend="filter-file">filter
930     file</link>) can be used to re-write the raw page content, including
931     viewable text as well as embedded HTML and JavaScript, and whatever else
932     lurks on any given web page. The filtering jobs are only pre-defined here;
933     whether to apply them or not is up to the actions files.
934    </para>
935   </listitem> 
936
937  </itemizedlist>
938 </para>
939
940 <para>
941  All files use the <quote><literal>#</literal></quote> character to denote a
942  comment (the rest of the line will be ignored) and understand line continuation
943  through placing a backslash ("<literal>\</literal>") as the very last character
944  in a line. If the <literal>#</literal> is preceded by a backslash, it looses
945  its special function. Placing a <literal>#</literal> in front of an otherwise
946  valid configuration line to prevent it from being interpreted is called "commenting
947  out" that line.
948 </para>
949
950 <para>
951  The actions files and <filename>default.filter</filename> 
952  can use Perl style <link linkend="regex">regular expressions</link> for
953  maximum flexibility. 
954 </para>
955
956 <para>
957  After making any changes, there is no need to restart
958  <application>Privoxy</application> in order for the changes to take
959  effect. <application>Privoxy</application> detects such changes 
960  automatically. Note, however, that it may take one or two additional
961  requests for the change to take effect. When changing the listening address
962  of <application>Privoxy</application>, these <quote>wake up</quote> requests
963  must obviously be sent to the <emphasis>old</emphasis> listening address.
964 </para>
965
966 <![%p-not-stable;[
967 <para>
968  While under development, the configuration content is subject to change. 
969  The below documentation may not be accurate by the time you read this. 
970  Also, what constitutes a <quote>default</quote> setting, may change, so 
971  please check all your configuration files on important issues.
972 </para>
973 ]]>
974
975 </sect2>
976 </sect1>
977 <!--  ~  End section  ~  -->
978
979
980 <!--   ~~~~~~~~       New section Header    ~~~~~~~~~     -->
981
982 <sect1 id="config">
983 <title>The Main Configuration File</title>
984
985 <para>
986  Again, the main configuration file is named <filename>config</filename> on
987  Linux/Unix/BSD and OS/2, and <filename>config.txt</filename> on Windows.
988  Configuration lines consist of an initial keyword followed by a list of
989  values, all separated by whitespace (any number of spaces or tabs). For
990  example:
991 </para>
992
993 <para>
994  <literal>
995   <msgtext> 
996    <literallayout>
997   <emphasis>confdir /etc/privoxy</emphasis></literallayout>
998   </msgtext>
999  </literal> 
1000 </para>
1001
1002 <para>
1003  Assigns the value <literal>/etc/privoxy</literal> to the option
1004  <literal>confdir</literal> and thus indicates that the configuration
1005  directory is named <quote>/etc/privoxy/</quote>.
1006 </para>
1007
1008 <para>
1009  All options in the config file except for <literal>confdir</literal> and
1010  <literal>logdir</literal> are optional. Watch out in the below description
1011  for what happens if you leave them unset.
1012 </para>
1013
1014 <para>
1015  The main config file controls all aspects of <application>Privoxy</application>'s
1016  operation that are not location dependent (i.e. they apply universally, no matter
1017  where you may be surfing).
1018 </para>
1019
1020
1021 <!--   ~~~~~       New section      ~~~~~     -->
1022
1023 <sect2 id="conf-log-loc">
1024 <title>Configuration and Log File Locations</title>
1025
1026 <para>
1027  <application>Privoxy</application> can (and normally does) use a number of
1028  other files for additional configuration, help and logging.
1029  This section of the configuration file tells <application>Privoxy</application>
1030  where to find those other files. 
1031 </para>
1032
1033 <para>
1034  The user running Privoxy, must have read permission for all 
1035  configuration files, and write permission to any files that would 
1036  be modified, such as log files.
1037 </para>
1038
1039 <sect3 renderas="sect4" id="confdir"><title>confdir</title>
1040
1041 <variablelist>
1042  <varlistentry>
1043   <term>Specifies:</term>
1044   <listitem>
1045    <para>The directory where the other configuration files are located</para>
1046   </listitem>
1047  </varlistentry>
1048  <varlistentry>
1049   <term>Type of value:</term>
1050   <listitem>
1051    <para>Path name</para>
1052   </listitem>
1053  </varlistentry>
1054  <varlistentry>
1055   <term>Default value:</term>
1056   <listitem>
1057    <para>/etc/privoxy (Unix) <emphasis>or</emphasis> <application>Privoxy</application> installation dir (Windows) </para>
1058   </listitem>
1059  </varlistentry>
1060  <varlistentry>
1061   <term>Effect if unset:</term>
1062   <listitem>
1063    <para><emphasis>Mandatory</emphasis></para>
1064   </listitem>
1065  </varlistentry>
1066  <varlistentry>
1067   <term>Notes:</term>
1068   <listitem>
1069    <para>
1070     No trailing <quote><literal>/</literal></quote>, please
1071    </para>
1072    <para>
1073     When development goes modular and multi-user, the blocker, filter, and
1074     per-user config will be stored in subdirectories of <quote>confdir</quote>.
1075     For now, the configuration directory structure is flat, except for 
1076     <filename>confdir/templates</filename>, where the HTML templates for CGI 
1077     output reside (e.g. <application>Privoxy's</application> 404 error page). 
1078    </para>
1079   </listitem>
1080  </varlistentry>
1081 </variablelist>
1082 </sect3>
1083
1084
1085 <sect3 renderas="sect4" id="logdir"><title>logdir</title>
1086
1087 <variablelist>
1088  <varlistentry>
1089   <term>Specifies:</term>
1090   <listitem>
1091    <para>
1092     The directory where all logging takes place (i.e. where <filename>logfile</filename> and 
1093     <filename>jarfile</filename> are located) 
1094    </para>
1095   </listitem>
1096  </varlistentry>
1097  <varlistentry>
1098   <term>Type of value:</term>
1099   <listitem>
1100    <para>Path name</para>
1101   </listitem>
1102  </varlistentry>
1103  <varlistentry>
1104   <term>Default value:</term>
1105   <listitem>
1106    <para>/var/log/privoxy (Unix) <emphasis>or</emphasis> <application>Privoxy</application> installation dir (Windows) </para>
1107   </listitem>
1108  </varlistentry>
1109  <varlistentry>
1110   <term>Effect if unset:</term>
1111   <listitem>
1112    <para><emphasis>Mandatory</emphasis></para>
1113   </listitem>
1114  </varlistentry>
1115  <varlistentry>
1116   <term>Notes:</term>
1117   <listitem>
1118    <para>
1119     No trailing <quote><literal>/</literal></quote>, please
1120    </para>
1121   </listitem>
1122  </varlistentry>
1123 </variablelist>
1124 </sect3>
1125
1126 <sect3 renderas="sect4" id="actionsfile"><title>
1127 actionsfile
1128 </title>
1129 <anchor id="default.action">
1130 <anchor id="standard.action">
1131 <anchor id="user.action">
1132 <!-- Note: slightly modified this section 04/28/02, hal. See NOTE. -->
1133 <variablelist>
1134  <varlistentry>
1135   <term>Specifies:</term>
1136   <listitem>
1137    <para>
1138     The <link linkend="actions-file">actions file(s)</link> to use
1139    </para>
1140   </listitem>
1141  </varlistentry>
1142  <varlistentry>
1143   <term>Type of value:</term>
1144   <listitem>
1145    <para>File name, relative to <literal>confdir</literal>, without the <literal>.action</literal> suffix</para>
1146   </listitem>
1147  </varlistentry>
1148  <varlistentry>
1149   <term>Default values:</term>
1150   <listitem>
1151    <simplelist>
1152     <member>
1153      <msgtext><literallayout>  standard     # Internal purposes, no editing recommended</literallayout></msgtext>
1154     </member>
1155     <member>
1156      <msgtext><literallayout>  default      # Main actions file</literallayout></msgtext>
1157     </member>
1158     <member>
1159      <msgtext><literallayout>  user         # User customizations</literallayout></msgtext>
1160     </member>
1161    </simplelist>
1162   </listitem>
1163  </varlistentry>
1164  <varlistentry>
1165   <term>Effect if unset:</term>
1166   <listitem>
1167    <para>
1168     No actions are taken at all. Simple neutral proxying. 
1169    </para>
1170   </listitem>
1171  </varlistentry>
1172  <varlistentry>
1173   <term>Notes:</term>
1174   <listitem>
1175    <para>
1176     Multiple <literal>actionsfile</literal> lines are permitted, and are in fact recommended!
1177    </para>
1178    <para> 
1179     The default values include standard.action, which is used for internal
1180     purposes and should be loaded, default.action, which is the
1181     <quote>main</quote> actions file maintained by the developers, and
1182     <filename>user.action</filename>, where you can make your personal additions.
1183    </para>
1184    <para> 
1185     Actions files are where all the per site and per URL configuration is done for 
1186     ad blocking, cookie management, privacy considerations, etc.
1187     There is no point in using <application>Privoxy</application> without at 
1188     least one actions file.
1189    </para>
1190   </listitem>
1191  </varlistentry>
1192 </variablelist>
1193 </sect3>
1194
1195 <sect3 renderas="sect4" id="filterfile"><title>filterfile</title>
1196 <anchor id="default.filter">
1197 <variablelist>
1198  <varlistentry>
1199   <term>Specifies:</term>
1200   <listitem>
1201    <para>
1202     The <link linkend="filter-file">filter file</link> to use
1203    </para>
1204   </listitem>
1205  </varlistentry>
1206  <varlistentry>
1207   <term>Type of value:</term>
1208   <listitem>
1209    <para>File name, relative to <literal>confdir</literal></para>
1210   </listitem>
1211  </varlistentry>
1212  <varlistentry>
1213   <term>Default value:</term>
1214   <listitem>
1215    <para>default.filter (Unix) <emphasis>or</emphasis> default.filter.txt (Windows)</para>
1216   </listitem>
1217  </varlistentry>
1218  <varlistentry>
1219   <term>Effect if unset:</term>
1220   <listitem>
1221    <para>
1222     No textual content filtering takes place, i.e. all
1223     <literal>+<link linkend="filter">filter</link>{<replaceable class="parameter">name</replaceable>}</literal>
1224     actions in the actions files are turned neutral.
1225    </para>
1226   </listitem>
1227  </varlistentry>
1228  <varlistentry>
1229   <term>Notes:</term>
1230   <listitem>
1231    <para>
1232     The <link linkend="filter-file">filter file</link> contains content modification
1233     rules that use <link linkend="regex">regular expressions</link>. These rules permit
1234     powerful changes on the content of Web pages, e.g., you could disable your favorite
1235     JavaScript annoyances, re-write the actual displayed text, or just have some
1236     fun replacing <quote>Microsoft</quote> with <quote>MicroSuck</quote> wherever
1237     it appears on a Web page.
1238    </para>
1239    <para>
1240     The
1241     <literal>+<link linkend="filter">filter</link>{<replaceable class="parameter">name</replaceable>}</literal>
1242     actions rely on the relevant filter (<replaceable class="parameter">name</replaceable>)
1243     to be defined in the filter file!
1244    </para>
1245    <para>
1246     A pre-defined filter file called <filename>default.filter</filename> that contains
1247     a bunch of handy filters for common problems is included in the distribution.
1248     See the section on the <literal><link linkend="filter">filter</link></literal>
1249     action for a list.
1250    </para>
1251   </listitem>
1252  </varlistentry>
1253 </variablelist>
1254 </sect3>
1255
1256 <sect3 renderas="sect4" id="logfile"><title>logfile</title>
1257
1258 <variablelist>
1259  <varlistentry>
1260   <term>Specifies:</term>
1261   <listitem>
1262    <para>
1263     The log file to use
1264    </para>
1265   </listitem>
1266  </varlistentry>
1267  <varlistentry>
1268   <term>Type of value:</term>
1269   <listitem>
1270    <para>File name, relative to <literal>logdir</literal></para>
1271   </listitem>
1272  </varlistentry>
1273  <varlistentry>
1274   <term>Default value:</term>
1275   <listitem>
1276    <para>logfile (Unix) <emphasis>or</emphasis> privoxy.log (Windows)</para>
1277   </listitem>
1278  </varlistentry>
1279  <varlistentry>
1280   <term>Effect if unset:</term>
1281   <listitem>
1282    <para>
1283     No log file is used, all log messages go to the console (<literal>stderr</literal>).
1284    </para>
1285   </listitem>
1286  </varlistentry>
1287  <varlistentry>
1288   <term>Notes:</term>
1289   <listitem>
1290    <para>
1291     The windows version will additionally log to the console.
1292    </para>
1293    <para>
1294     The logfile is where all logging and error messages are written. The level
1295     of detail and number of messages are set with the <literal>debug</literal>
1296     option (see below). The logfile can be useful for tracking down a problem with
1297     <application>Privoxy</application> (e.g., it's not blocking an ad you
1298     think it should block) but in most cases you probably will never look at it.
1299    </para>
1300    <para>
1301     Your logfile will grow indefinitely, and you will probably want to
1302     periodically remove it.  On Unix systems, you can do this with a cron job
1303     (see <quote>man cron</quote>). For Red Hat, a <command>logrotate</command> 
1304     script has been included.
1305    </para> 
1306    <para>
1307     On SuSE Linux systems, you can place a line like <quote>/var/log/privoxy.*
1308     +1024k 644 nobody.nogroup</quote> in <filename>/etc/logfiles</filename>, with
1309     the effect that cron.daily will automatically archive, gzip, and empty the
1310     log, when it exceeds 1M size.
1311    </para>
1312    <para>
1313     Any log files must be writable by whatever user <application>Privoxy</application>
1314     is being run as (default on UNIX, user id is <quote>privoxy</quote>).
1315    </para>
1316   </listitem>
1317  </varlistentry>
1318 </variablelist>
1319 </sect3>
1320
1321 <sect3 renderas="sect4" id="jarfile"><title>jarfile</title>
1322
1323 <variablelist>
1324  <varlistentry>
1325   <term>Specifies:</term>
1326   <listitem>
1327    <para>
1328     The file to store intercepted cookies in
1329    </para>
1330   </listitem>
1331  </varlistentry>
1332  <varlistentry>
1333   <term>Type of value:</term>
1334   <listitem>
1335    <para>File name, relative to <literal>logdir</literal></para>
1336   </listitem>
1337  </varlistentry>
1338  <varlistentry>
1339   <term>Default value:</term>
1340   <listitem>
1341    <para>jarfile (Unix) <emphasis>or</emphasis> privoxy.jar (Windows)</para>
1342   </listitem>
1343  </varlistentry>
1344  <varlistentry>
1345   <term>Effect if unset:</term>
1346   <listitem>
1347    <para>
1348     Intercepted cookies are not stored at all.
1349    </para>
1350   </listitem>
1351  </varlistentry>
1352  <varlistentry>
1353   <term>Notes:</term>
1354   <listitem>
1355    <para>
1356     The jarfile may grow to ridiculous sizes over time.
1357    </para>
1358   </listitem>
1359  </varlistentry>
1360 </variablelist>
1361 </sect3>
1362
1363 <sect3 renderas="sect4" id="trustfile"><title>trustfile</title>
1364 <variablelist>
1365  <varlistentry>
1366   <term>Specifies:</term>
1367   <listitem>
1368    <para>
1369     The trust file to use
1370    </para>
1371   </listitem>
1372  </varlistentry>
1373  <varlistentry>
1374   <term>Type of value:</term>
1375   <listitem>
1376    <para>File name, relative to <literal>confdir</literal></para>
1377   </listitem>
1378  </varlistentry>
1379  <varlistentry>
1380   <term>Default value:</term>
1381   <listitem>
1382    <para><emphasis>Unset (commented out)</emphasis>. When activated: trust (Unix) <emphasis>or</emphasis> trust.txt (Windows)</para>
1383   </listitem>
1384  </varlistentry>
1385  <varlistentry>
1386   <term>Effect if unset:</term>
1387   <listitem>
1388    <para>
1389     The whole trust mechanism is turned off.
1390    </para>
1391   </listitem>
1392  </varlistentry>
1393  <varlistentry>
1394   <term>Notes:</term>
1395   <listitem>
1396    <para>
1397     The trust mechanism is an experimental feature for building white-lists and should
1398     be used with care. It is <emphasis>NOT</emphasis> recommended for the casual user.
1399    </para>
1400    <para>
1401     If you specify a trust file, <application>Privoxy</application> will only allow
1402     access to sites that are named in the trustfile. 
1403     You can also mark sites as trusted referrers (with <literal>+</literal>), with
1404     the effect that access to untrusted sites will be granted, if a link from a
1405     trusted referrer was used.
1406     The link target will then be added to the <quote>trustfile</quote>.
1407     Possible applications include limiting Internet access for children.
1408    </para>
1409    <para>
1410     If you use <literal>+</literal> operator in the trust file, it may grow considerably over time.
1411    </para>
1412   </listitem>
1413  </varlistentry>
1414 </variablelist>
1415 </sect3>
1416 </sect2>
1417
1418 <!--  ~  End section  ~  -->
1419
1420
1421
1422 <!--   ~~~~~       New section      ~~~~~     -->
1423
1424 <sect2 id="local-set-up">
1425 <title>Local Set-up Documentation</title>
1426
1427   <para>
1428     If you intend to operate <application>Privoxy</application> for more users
1429     than just yourself, it might be a good idea to let them know how to reach
1430     you, what you block and why you do that, your policies, etc.
1431    </para>
1432
1433 <sect3 renderas="sect4" id="user-manual"><title>user-manual</title>
1434 <variablelist>
1435  <varlistentry>
1436   <term>Specifies:</term>
1437   <listitem>
1438    <para>
1439     Location of the <application>Privoxy</application> User Manual.
1440    </para>
1441   </listitem>
1442  </varlistentry>
1443  <varlistentry>
1444   <term>Type of value:</term>
1445   <listitem>
1446    <para>A fully qualified URI</para>
1447   </listitem>
1448  </varlistentry>
1449  <varlistentry>
1450   <term>Default value:</term>
1451   <listitem>
1452    <para><emphasis>Unset</emphasis></para>
1453   </listitem>
1454  </varlistentry>
1455  <varlistentry>
1456   <term>Effect if unset:</term>
1457   <listitem>
1458    <para>
1459     <ulink url="http://www.privoxy.org/user-manual/">http://www.privoxy.org/<replaceable class="parameter">version</replaceable>/user-manual/</ulink>
1460     will be used, where <replaceable class="parameter">version</replaceable> is the <application>Privoxy</application> version.
1461    </para>
1462   </listitem>
1463  </varlistentry>
1464  <varlistentry>
1465   <term>Notes:</term>
1466   <listitem>
1467     <para>
1468     The User Manual URI is used for help links from some of the internal CGI pages. 
1469     The manual itself is normally packaged with the binary distributions, so you probably want
1470     to set this to a locally installed copy. For multi-user setups, you could provide a copy on
1471     a local webserver for all your users and use the corresponding URL here.
1472    </para>
1473    <para>
1474     Examples:
1475    </para>
1476   <para>
1477    Unix, in local filesystem:
1478   </para>
1479   <para>
1480    <screen>user-manual&nbsp;&nbsp;file:///usr/share/doc/privoxy-&p-version;/user-manual/</screen>
1481   </para>
1482   <para>
1483    Any platform, on local webserver (called <quote>local-webserver</quote>):
1484   </para>
1485   <para>
1486    <screen>user-manual&nbsp;&nbsp;http://local-webserver/privoxy-user-manual/</screen>
1487   </para>
1488   <warning>
1489    <para>
1490      If set, this option should be <emphasis>the first option in the config file</emphasis>, because
1491      it is used while the config file is being read.
1492    </para>
1493   </warning>     
1494  </listitem>
1495  </varlistentry>
1496 </variablelist>
1497 </sect3>
1498
1499 <sect3 renderas="sect4" id="trust-info-url"><title>trust-info-url</title>
1500
1501 <variablelist>
1502  <varlistentry>
1503   <term>Specifies:</term>
1504   <listitem>
1505    <para>
1506     A URL to be displayed in the error page that users will see if access to an untrusted page is denied.    
1507    </para>
1508   </listitem>
1509  </varlistentry>
1510  <varlistentry>
1511   <term>Type of value:</term>
1512   <listitem>
1513    <para>URL</para>
1514   </listitem>
1515  </varlistentry>
1516  <varlistentry>
1517   <term>Default value:</term>
1518   <listitem>
1519    <para>Two example URL are provided</para>
1520   </listitem>
1521  </varlistentry>
1522  <varlistentry>
1523   <term>Effect if unset:</term>
1524   <listitem>
1525    <para>
1526     No links are displayed on the "untrusted" error page.
1527    </para>
1528   </listitem>
1529  </varlistentry>
1530  <varlistentry>
1531   <term>Notes:</term>
1532   <listitem>
1533    <para>
1534     The value of this option only matters if the experimental trust mechanism has been
1535     activated. (See <link linkend="trustfile"><emphasis>trustfile</emphasis></link> above.)
1536    </para>
1537    <para>
1538     If you use the trust mechanism, it is a good idea to write up some on-line
1539     documentation about your trust policy and to specify the URL(s) here.
1540     Use multiple times for multiple URLs.
1541    </para>
1542    <para>
1543     The URL(s) should be added to the trustfile as well, so users don't end up
1544     locked out from the information on why they were locked out in the first place!
1545    </para>
1546   </listitem>
1547  </varlistentry>
1548 </variablelist>
1549 </sect3>
1550
1551 <sect3 renderas="sect4" id="admin-address"><title>admin-address</title>
1552
1553 <variablelist>
1554  <varlistentry>
1555   <term>Specifies:</term>
1556   <listitem>
1557    <para>
1558     An email address to reach the proxy administrator.
1559    </para>
1560   </listitem>
1561  </varlistentry>
1562  <varlistentry>
1563   <term>Type of value:</term>
1564   <listitem>
1565    <para>Email address</para>
1566   </listitem>
1567  </varlistentry>
1568  <varlistentry>
1569   <term>Default value:</term>
1570   <listitem>
1571    <para><emphasis>Unset</emphasis></para>
1572   </listitem>
1573  </varlistentry>
1574  <varlistentry>
1575   <term>Effect if unset:</term>
1576   <listitem>
1577    <para>
1578     No email address is displayed on error pages and the CGI user interface.
1579    </para>
1580   </listitem>
1581  </varlistentry>
1582  <varlistentry>
1583   <term>Notes:</term>
1584   <listitem>
1585     <para>
1586     If both <literal>admin-address</literal> and <literal>proxy-info-url</literal>
1587     are unset, the whole "Local Privoxy Support" box on all generated pages will
1588     not be shown.
1589    </para>  
1590   </listitem>
1591  </varlistentry>
1592 </variablelist>
1593 </sect3>
1594
1595 <sect3 renderas="sect4" id="proxy-info-url"><title>proxy-info-url</title>
1596
1597 <variablelist>
1598  <varlistentry>
1599   <term>Specifies:</term>
1600   <listitem>
1601    <para>
1602     A URL to documentation about the local <application>Privoxy</application> setup,
1603     configuration or policies.
1604    </para>
1605   </listitem>
1606  </varlistentry>
1607  <varlistentry>
1608   <term>Type of value:</term>
1609   <listitem>
1610    <para>URL</para>
1611   </listitem>
1612  </varlistentry>
1613  <varlistentry>
1614   <term>Default value:</term>
1615   <listitem>
1616    <para><emphasis>Unset</emphasis></para>
1617   </listitem>
1618  </varlistentry>
1619  <varlistentry>
1620   <term>Effect if unset:</term>
1621   <listitem>
1622    <para>
1623     No link to local documentation is displayed on error pages and the CGI user interface.
1624    </para>
1625   </listitem>
1626  </varlistentry>
1627  <varlistentry>
1628   <term>Notes:</term>
1629   <listitem>
1630    <para>
1631     If both <literal>admin-address</literal> and <literal>proxy-info-url</literal>
1632     are unset, the whole "Local Privoxy Support" box on all generated pages will
1633     not be shown.
1634    </para>  
1635    <para>
1636     This URL shouldn't be blocked ;-)
1637    </para> 
1638   </listitem>
1639  </varlistentry>
1640 </variablelist>
1641 </sect3>
1642
1643 </sect2>
1644 <!--  ~  End section  ~  -->
1645
1646 <!--   ~~~~~       New section      ~~~~~     -->
1647
1648 <sect2 id="debugging">
1649 <title>Debugging</title>
1650
1651  <para>
1652   These options are mainly useful when tracing a problem.
1653   Note that you might also want to invoke
1654   <application>Privoxy</application> with the <literal>--no-daemon</literal>
1655   command line option when debugging.
1656  </para>
1657
1658 <sect3 renderas="sect4" id="debug"><title>debug</title>
1659
1660 <variablelist>
1661  <varlistentry>
1662   <term>Specifies:</term>
1663   <listitem>
1664    <para>
1665     Key values that determine what information gets logged to the 
1666     <link linkend="logfile"><emphasis>logfile</emphasis></link>.
1667    </para>
1668   </listitem>
1669  </varlistentry>
1670  <varlistentry>
1671   <term>Type of value:</term>
1672   <listitem>
1673    <para>Integer values</para>
1674   </listitem>
1675  </varlistentry>
1676  <varlistentry>
1677   <term>Default value:</term>
1678   <listitem>
1679    <para>12289 (i.e.: URLs plus informational and warning messages)</para>
1680   </listitem>
1681  </varlistentry>
1682  <varlistentry>
1683   <term>Effect if unset:</term>
1684   <listitem>
1685    <para>
1686     Nothing gets logged.
1687    </para>
1688   </listitem>
1689  </varlistentry>
1690  <varlistentry>
1691   <term>Notes:</term>
1692   <listitem>
1693    <para>
1694     The available debug levels are:
1695    </para>
1696    <para>
1697     <programlisting>
1698   debug         1 # show each GET/POST/CONNECT request
1699   debug         2 # show each connection status
1700   debug         4 # show I/O status
1701   debug         8 # show header parsing
1702   debug        16 # log all data into the logfile
1703   debug        32 # debug force feature
1704   debug        64 # debug regular expression filter 
1705   debug       128 # debug fast redirects
1706   debug       256 # debug GIF de-animation
1707   debug       512 # Common Log Format
1708   debug      1024 # debug kill pop-ups
1709   debug      4096 # Startup banner and warnings.
1710   debug      8192 # Non-fatal errors
1711 </programlisting>
1712    </para>
1713    <para>
1714     To select multiple debug levels, you can either add them or use
1715     multiple <literal>debug</literal> lines.
1716    </para>
1717    <para>
1718     A debug level of 1 is informative because it will show you each request
1719     as it happens. <emphasis>1, 4096 and 8192 are highly recommended</emphasis>
1720     so that you will notice when things go wrong. The other levels are probably
1721     only of interest if you are hunting down a specific problem. They can produce
1722     a hell of an output (especially 16).
1723     <!-- LOL -->
1724    </para>
1725    <para>
1726     The reporting of <emphasis>fatal</emphasis> errors (i.e. ones which crash 
1727     <application>Privoxy</application>) is always on and cannot be disabled.
1728    </para>
1729    <para>
1730     If you want to use CLF (Common Log Format), you should set <quote>debug
1731     512</quote> <emphasis>ONLY</emphasis> and not enable anything else.
1732    </para>
1733   </listitem>
1734  </varlistentry>
1735 </variablelist>
1736 </sect3>
1737
1738 <sect3 renderas="sect4" id="single-threaded"><title>single-threaded</title>
1739
1740 <variablelist>
1741  <varlistentry>
1742   <term>Specifies:</term>
1743   <listitem>
1744    <para>
1745     Whether to run only one server thread
1746    </para>
1747   </listitem>
1748  </varlistentry>
1749  <varlistentry>
1750   <term>Type of value:</term>
1751   <listitem>
1752    <para><emphasis>None</emphasis></para>
1753   </listitem>
1754  </varlistentry>
1755  <varlistentry>
1756   <term>Default value:</term>
1757   <listitem>
1758    <para><emphasis>Unset</emphasis></para>
1759   </listitem>
1760  </varlistentry>
1761  <varlistentry>
1762   <term>Effect if unset:</term>
1763   <listitem>
1764    <para>
1765     Multi-threaded (or, where unavailable: forked) operation, i.e. the ability to
1766     serve multiple requests simultaneously.
1767    </para>
1768   </listitem>
1769  </varlistentry>
1770  <varlistentry>
1771   <term>Notes:</term>
1772   <listitem>
1773    <para>
1774     This option is only there for debug purposes and you should never
1775     need to use it. <emphasis>It will drastically reduce performance.</emphasis>
1776    </para>
1777   </listitem>
1778  </varlistentry>
1779 </variablelist>
1780 </sect3>
1781
1782 </sect2>
1783
1784 <!--   ~~~~~       New section      ~~~~~     -->
1785
1786 <sect2 id="access-control">
1787 <title>Access Control and Security</title>
1788
1789  <para>
1790   This section of the config file controls the security-relevant aspects
1791   of <application>Privoxy</application>'s configuration.
1792  </para>
1793
1794 <sect3 renderas="sect4" id="listen-address"><title>listen-address</title>
1795
1796 <variablelist>
1797  <varlistentry>
1798   <term>Specifies:</term>
1799   <listitem>
1800    <para>
1801     The IP address and TCP port on which <application>Privoxy</application> will
1802     listen for client requests.
1803    </para>
1804   </listitem>
1805  </varlistentry>
1806  <varlistentry>
1807   <term>Type of value:</term>
1808   <listitem>
1809    <para>[<replaceable class="parameter">IP-Address</replaceable>]:<replaceable class="parameter">Port</replaceable></para>
1810   </listitem>
1811  </varlistentry>
1812
1813  <varlistentry>
1814   <term>Default value:</term>
1815   <listitem>
1816    <para>127.0.0.1:8118</para>
1817   </listitem>
1818  </varlistentry>
1819  <varlistentry>
1820   <term>Effect if unset:</term>
1821   <listitem>
1822    <para>
1823     Bind to 127.0.0.1 (localhost), port 8118. This is suitable and recommended for
1824     home users who run <application>Privoxy</application> on the same machine as
1825     their browser.
1826    </para>
1827   </listitem>
1828  </varlistentry>
1829  <varlistentry>
1830   <term>Notes:</term>
1831   <listitem>
1832    <para>
1833     You will need to configure your browser(s) to this proxy address and port.
1834    </para>
1835    <para>
1836     If you already have another service running on port 8118, or if you want to
1837     serve requests from other machines (e.g. on your local network) as well, you
1838     will need to override the default.
1839    </para>
1840    <para>
1841     If you leave out the IP address, <application>Privoxy</application> will
1842     bind to all interfaces (addresses) on your machine and may become reachable
1843     from the Internet. In that case, consider using access control lists (ACL's)
1844     (see <quote>ACLs</quote> below), or a firewall.
1845    </para>
1846   </listitem>
1847  </varlistentry>
1848  <varlistentry>
1849   <term>Example:</term>
1850   <listitem>
1851    <para>
1852      Suppose you are running <application>Privoxy</application> on
1853      a machine which has the address 192.168.0.1 on your local private network
1854      (192.168.0.0) and has another outside connection with a different address.
1855      You want it to serve requests from inside only:
1856    </para>
1857    <para>
1858     <programlisting>
1859   listen-address  192.168.0.1:8118
1860 </programlisting>
1861    </para>
1862   </listitem>
1863  </varlistentry>
1864 </variablelist>
1865 </sect3>
1866
1867 <sect3 renderas="sect4" id="toggle"><title>toggle</title>
1868
1869 <variablelist>
1870  <varlistentry>
1871   <term>Specifies:</term>
1872   <listitem>
1873    <para>
1874     Initial state of "toggle" status
1875    </para>
1876   </listitem>
1877  </varlistentry>
1878  <varlistentry>
1879   <term>Type of value:</term>
1880   <listitem>
1881    <para>1 or 0</para>
1882   </listitem>
1883  </varlistentry>
1884  <varlistentry>
1885   <term>Default value:</term>
1886   <listitem>
1887    <para>1</para>
1888   </listitem>
1889  </varlistentry>
1890  <varlistentry>
1891   <term>Effect if unset:</term>
1892   <listitem>
1893    <para>
1894     Act as if toggled on
1895    </para>
1896   </listitem>
1897  </varlistentry>
1898  <varlistentry>
1899   <term>Notes:</term>
1900   <listitem>
1901    <para>
1902     If set to 0, <application>Privoxy</application> will start in
1903     <quote>toggled off</quote> mode, i.e. behave like a normal, content-neutral
1904     proxy where all ad blocking, filtering, etc are disabled. See
1905     <literal>enable-remote-toggle</literal> below. This is not really useful
1906     anymore, since toggling is much easier via <ulink
1907     url="http://config.privoxy.org/toggle">the web interface</ulink> than via
1908     editing the <filename>conf</filename> file.
1909    </para>
1910    <para>
1911     The windows version will only display the toggle icon in the system tray
1912     if this option is present.
1913    </para>
1914   </listitem>
1915  </varlistentry>
1916 </variablelist>
1917 </sect3>
1918
1919
1920 <sect3 renderas="sect4" id="enable-remote-toggle"><title>enable-remote-toggle</title>
1921 <variablelist>
1922  <varlistentry>
1923   <term>Specifies:</term>
1924   <listitem>
1925    <para>
1926     Whether or not the <ulink url="http://config.privoxy.org/toggle">web-based toggle
1927     feature</ulink> may be used
1928    </para>
1929   </listitem>
1930  </varlistentry>
1931  <varlistentry>
1932   <term>Type of value:</term>
1933   <listitem>
1934    <para>0 or 1</para>
1935   </listitem>
1936  </varlistentry>
1937  <varlistentry>
1938   <term>Default value:</term>
1939   <listitem>
1940    <para>1</para>
1941   </listitem>
1942  </varlistentry>
1943  <varlistentry>
1944   <term>Effect if unset:</term>
1945   <listitem>
1946    <para>
1947     The web-based toggle feature is disabled.
1948    </para>
1949   </listitem>
1950  </varlistentry>
1951  <varlistentry>
1952   <term>Notes:</term>
1953   <listitem>
1954    <para>
1955     When toggled off, <application>Privoxy</application> acts like a normal,
1956     content-neutral proxy, i.e. it acts as if none of the actions applied to
1957     any URL.
1958    </para>
1959    <para>
1960     For the time being, access to the toggle feature can <emphasis>not</emphasis> be
1961     controlled separately by <quote>ACLs</quote> or HTTP authentication,
1962     so that everybody who can access <application>Privoxy</application> (see
1963     <quote>ACLs</quote> and <literal>listen-address</literal> above) can
1964     toggle it for all users. So this option is <emphasis>not recommended</emphasis>
1965     for multi-user environments with untrusted users.
1966    </para>
1967    <para>
1968     Note that you must have compiled <application>Privoxy</application> with
1969     support for this feature, otherwise this option has no effect. 
1970    </para>
1971   </listitem>
1972  </varlistentry>
1973 </variablelist>
1974 </sect3>
1975
1976
1977 <sect3 renderas="sect4" id="enable-edit-actions"><title>enable-edit-actions</title>
1978 <variablelist>
1979  <varlistentry>
1980   <term>Specifies:</term>
1981   <listitem>
1982    <para>
1983     Whether or not the <ulink url="http://config.privoxy.org/show-status">web-based actions
1984     file editor</ulink> may be used
1985    </para>
1986   </listitem>
1987  </varlistentry>
1988  <varlistentry>
1989   <term>Type of value:</term>
1990   <listitem>
1991    <para>0 or 1</para>
1992   </listitem>
1993  </varlistentry>
1994  <varlistentry>
1995   <term>Default value:</term>
1996   <listitem>
1997    <para>1</para>
1998   </listitem>
1999  </varlistentry>
2000  <varlistentry>
2001   <term>Effect if unset:</term>
2002   <listitem>
2003    <para>
2004     The web-based actions file editor is disabled.
2005    </para>
2006   </listitem>
2007  </varlistentry>
2008  <varlistentry>
2009   <term>Notes:</term>
2010   <listitem>
2011    <para>
2012     For the time being, access to the editor can <emphasis>not</emphasis> be
2013     controlled separately by <quote>ACLs</quote> or HTTP authentication,
2014     so that everybody who can access <application>Privoxy</application> (see
2015     <quote>ACLs</quote> and <literal>listen-address</literal> above) can
2016     modify its configuration for all users. So this option is <emphasis>not
2017     recommended</emphasis> for multi-user environments with untrusted users.
2018    </para>
2019    <para>
2020     Note that you must have compiled <application>Privoxy</application> with
2021     support for this feature, otherwise this option has no effect. 
2022    </para>
2023   </listitem>
2024  </varlistentry>
2025 </variablelist>
2026 </sect3>
2027
2028 <sect3 renderas="sect4" id="acls"><title>
2029 ACLs: permit-access and deny-access</title>
2030 <anchor id="permit-acces">
2031 <anchor id="deny-acces">
2032
2033 <variablelist>
2034  <varlistentry>
2035   <term>Specifies:</term>
2036   <listitem>
2037    <para>
2038     Who can access what.
2039    </para>
2040   </listitem>
2041  </varlistentry>
2042  <varlistentry>
2043   <term>Type of value:</term>
2044   <listitem>
2045    <para>
2046     <replaceable class="parameter">src_addr</replaceable>[/<replaceable class="parameter">src_masklen</replaceable>]
2047     [<replaceable class="parameter">dst_addr</replaceable>[/<replaceable class="parameter">dst_masklen</replaceable>]]
2048    </para>
2049    <para>
2050     Where <replaceable class="parameter">src_addr</replaceable> and 
2051    <replaceable class="parameter">dst_addr</replaceable> are IP addresses in dotted decimal notation or valid
2052     DNS names, and <replaceable class="parameter">src_masklen</replaceable> and
2053     <replaceable class="parameter">dst_masklen</replaceable> are subnet masks in CIDR notation, i.e. integer
2054     values from 2 to 30 representing the length (in bits) of the network address. The masks and the whole
2055     destination part are optional.
2056    </para>
2057   </listitem>
2058  </varlistentry>
2059  <varlistentry>
2060   <term>Default value:</term>
2061   <listitem>
2062    <para><emphasis>Unset</emphasis></para>
2063   </listitem>
2064  </varlistentry>
2065  <varlistentry>
2066   <term>Effect if unset:</term>
2067   <listitem>
2068    <para>
2069     Don't restrict access further than implied by <literal>listen-address</literal>
2070    </para>
2071   </listitem>
2072  </varlistentry>
2073  <varlistentry>
2074   <term>Notes:</term>
2075   <listitem>
2076    <para>
2077     Access controls are included at the request of ISPs and systems
2078     administrators, and <emphasis>are not usually needed by individual users</emphasis>.
2079     For a typical home user, it will normally suffice to ensure that 
2080     <application>Privoxy</application> only listens on the localhost
2081     (127.0.0.1) or internal (home) network address by means of the
2082     <link linkend="listen-address"><emphasis>listen-address</emphasis></link>
2083     option. 
2084    </para>
2085    <para>
2086     Please see the warnings in the FAQ that this proxy is not intended to be a substitute
2087     for a firewall or to encourage anyone to defer addressing basic security
2088     weaknesses.
2089    </para>
2090    <para>
2091     Multiple ACL lines are OK.
2092     If any ACLs are specified, then the <application>Privoxy</application>
2093     talks only to IP addresses that match at least one <literal>permit-access</literal> line
2094     and don't match any subsequent <literal>deny-access</literal> line. In other words, the
2095     last match wins, with the default being <literal>deny-access</literal>.
2096    </para>
2097    <para>
2098     If <application>Privoxy</application> is using a forwarder (see <literal>forward</literal> below)
2099     for a particular destination URL, the <replaceable class="parameter">dst_addr</replaceable>
2100     that is examined is the address of the forwarder and <emphasis>NOT</emphasis> the address
2101     of the ultimate target. This is necessary because it may be impossible for the local
2102     <application>Privoxy</application> to determine the IP address of the
2103     ultimate target (that's often what gateways are used for).
2104    </para>
2105    <para>
2106     You should prefer using IP addresses over DNS names, because the address lookups take
2107     time. All DNS names must resolve! You can <emphasis>not</emphasis> use domain patterns
2108     like <quote>*.org</quote> or partial domain names. If a DNS name resolves to multiple
2109     IP addresses, only the first one is used.
2110    </para>
2111    <para>
2112     Denying access to particular sites by ACL may have undesired side effects
2113     if the site in question is hosted on a machine which also hosts other sites.
2114    </para>
2115   </listitem>
2116  </varlistentry>
2117  <varlistentry>
2118   <term>Examples:</term>
2119   <listitem>
2120    <para>
2121     Explicitly define the default behavior if no ACL and
2122     <literal>listen-address</literal> are set: <quote>localhost</quote>
2123     is OK. The absence of a <replaceable class="parameter">dst_addr</replaceable> implies that
2124     <emphasis>all</emphasis> destination addresses are OK:
2125    </para>
2126    <para>
2127     <screen>
2128   permit-access  localhost
2129 </screen>
2130    </para>
2131    <para>
2132     Allow any host on the same class C subnet as www.privoxy.org access to
2133     nothing but www.example.com:
2134    </para>
2135    <para>
2136     <screen>
2137   permit-access  www.privoxy.org/24 www.example.com/32
2138 </screen>
2139    </para>
2140    <para>
2141     Allow access from any host on the 26-bit subnet 192.168.45.64 to anywhere,
2142     with the exception that 192.168.45.73 may not access www.dirty-stuff.example.com:
2143    </para>
2144    <para>
2145     <screen>
2146   permit-access  192.168.45.64/26
2147   deny-access    192.168.45.73    www.dirty-stuff.example.com
2148 </screen>
2149    </para>
2150   </listitem>
2151  </varlistentry>
2152 </variablelist>
2153 </sect3>
2154
2155 <sect3 renderas="sect4" id="buffer-limit"><title>buffer-limit</title>
2156
2157 <variablelist>
2158  <varlistentry>
2159   <term>Specifies:</term>
2160   <listitem>
2161    <para>
2162     Maximum size of the buffer for content filtering.
2163    </para>
2164   </listitem>
2165  </varlistentry>
2166  <varlistentry>
2167   <term>Type of value:</term>
2168   <listitem>
2169    <para>Size in Kbytes</para>
2170   </listitem>
2171  </varlistentry>
2172  <varlistentry>
2173   <term>Default value:</term>
2174   <listitem>
2175    <para>4096</para>
2176   </listitem>
2177  </varlistentry>
2178  <varlistentry>
2179   <term>Effect if unset:</term>
2180   <listitem>
2181    <para>
2182     Use a 4MB (4096 KB) limit.
2183    </para>
2184   </listitem>
2185  </varlistentry>
2186  <varlistentry>
2187   <term>Notes:</term>
2188   <listitem>
2189    <para>
2190     For content filtering, i.e. the <literal>+filter</literal> and
2191     <literal>+deanimate-gif</literal> actions, it is necessary that 
2192     <application>Privoxy</application> buffers the entire document body.
2193     This can be potentially dangerous, since a server could just keep sending
2194     data indefinitely and wait for your RAM to exhaust -- with nasty consequences.
2195     Hence this option.
2196    </para>
2197    <para>
2198     When a document buffer size reaches the <literal>buffer-limit</literal>, it is
2199     flushed to the client unfiltered and no further attempt to
2200     filter the rest of the document is made. Remember that there may be multiple threads
2201     running, which might require up to <literal>buffer-limit</literal> Kbytes
2202     <emphasis>each</emphasis>, unless you have enabled <quote>single-threaded</quote>
2203     above.
2204    </para>
2205   </listitem>
2206  </varlistentry>
2207 </variablelist>
2208 </sect3>
2209
2210 </sect2>
2211
2212 <!--  ~  End section  ~  -->
2213
2214
2215 <!--   ~~~~~       New section      ~~~~~     -->
2216
2217 <sect2 id="forwarding">
2218 <title>Forwarding</title>
2219
2220 <para>
2221  This feature allows routing of HTTP requests through a chain of
2222  multiple proxies.
2223  It can be used to better protect privacy and confidentiality when
2224  accessing specific domains by routing requests to those domains
2225  through an anonymous public proxy (see e.g. <ulink
2226  url="http://www.multiproxy.org/anon_list.htm">http://www.multiproxy.org/anon_list.htm</ulink>)
2227  Or to use a caching proxy to speed up browsing. Or chaining to a parent
2228  proxy may be necessary because the machine that <application>Privoxy</application>
2229  runs on has no direct Internet access.
2230 </para>
2231
2232 <para>
2233  Also specified here are SOCKS proxies. <application>Privoxy</application>
2234  supports the SOCKS 4 and SOCKS 4A protocols.
2235 </para>
2236
2237 <sect3 renderas="sect4" id="forward"><title>forward</title>
2238 <variablelist>
2239  <varlistentry>
2240   <term>Specifies:</term>
2241   <listitem>
2242    <para>
2243     To which parent HTTP proxy specific requests should be routed.
2244    </para>
2245   </listitem>
2246  </varlistentry>
2247  <varlistentry>
2248   <term>Type of value:</term>
2249   <listitem>
2250    <para>
2251     <replaceable class="parameter">target_domain</replaceable>[:<replaceable class="parameter">port</replaceable>]
2252     <replaceable class="parameter">http_parent</replaceable>[/<replaceable class="parameter">port</replaceable>]
2253    </para>
2254    <para>
2255     Where <replaceable class="parameter">target_domain</replaceable> is a domain name pattern (see the
2256     chapter on domain matching in the <filename>default.action</filename> file),
2257     <replaceable class="parameter">http_parent</replaceable> is the address of the parent HTTP proxy
2258     as an IP addresses in dotted decimal notation or as a valid DNS name (or <quote>.</quote> to denote
2259     <quote>no forwarding</quote>, and the optional 
2260     <replaceable class="parameter">port</replaceable> parameters are TCP ports, i.e. integer
2261     values from 1 to 64535
2262    </para>
2263   </listitem>
2264  </varlistentry>
2265  <varlistentry>
2266   <term>Default value:</term>
2267   <listitem>
2268    <para><emphasis>Unset</emphasis></para>
2269   </listitem>
2270  </varlistentry>
2271  <varlistentry>
2272   <term>Effect if unset:</term>
2273   <listitem>
2274    <para>
2275     Don't use parent HTTP proxies.
2276    </para>
2277   </listitem>
2278  </varlistentry>
2279  <varlistentry>
2280   <term>Notes:</term>
2281   <listitem>
2282    <para>
2283     If <replaceable class="parameter">http_parent</replaceable> is <quote>.</quote>, then requests are not
2284     forwarded to another HTTP proxy but are made directly to the web servers.
2285    </para>
2286    <para>
2287     Multiple lines are OK, they are checked in sequence, and the last match wins.
2288    </para>
2289   </listitem>
2290  </varlistentry>
2291  <varlistentry>
2292   <term>Examples:</term>
2293   <listitem>
2294    <para>
2295     Everything goes to an example anonymizing proxy, except SSL on port 443 (which it doesn't handle):
2296    </para>
2297    <para>
2298     <screen>
2299   forward   .*     anon-proxy.example.org:8080
2300   forward   :443   .
2301 </screen>
2302    </para>
2303    <para>
2304     Everything goes to our example ISP's caching proxy, except for requests
2305     to that ISP's sites:
2306    </para>
2307    <para>
2308     <screen>
2309   forward   .*.                caching-proxy.example-isp.net:8000
2310   forward   .example-isp.net   .
2311 </screen>
2312    </para>
2313   </listitem>
2314  </varlistentry>
2315 </variablelist>
2316 </sect3>
2317
2318 <sect3 renderas="sect4" id="socks"><title>
2319 forward-socks4 and forward-socks4a</title>
2320 <anchor id="forward-socks4">
2321 <anchor id="forward-socks4a">
2322
2323 <variablelist>
2324  <varlistentry>
2325   <term>Specifies:</term>
2326   <listitem>
2327    <para>
2328     Through which SOCKS proxy (and to which parent HTTP proxy) specific requests should be routed.
2329    </para>
2330   </listitem>
2331  </varlistentry>
2332  <varlistentry>
2333   <term>Type of value:</term>
2334   <listitem>
2335    <para>
2336     <replaceable class="parameter">target_domain</replaceable>[:<replaceable class="parameter">port</replaceable>]
2337     <replaceable class="parameter">socks_proxy</replaceable>[/<replaceable class="parameter">port</replaceable>]
2338     <replaceable class="parameter">http_parent</replaceable>[/<replaceable class="parameter">port</replaceable>]
2339    </para>
2340    <para>
2341     Where <replaceable class="parameter">target_domain</replaceable> is a domain name pattern (see the
2342     chapter on domain matching in the <filename>default.action</filename> file),
2343     <replaceable class="parameter">http_parent</replaceable> and <replaceable class="parameter">socks_proxy</replaceable>
2344     are IP addresses in dotted decimal notation or valid DNS names (<replaceable class="parameter">http_parent</replaceable>
2345     may be <quote>.</quote> to denote <quote>no HTTP forwarding</quote>), and the optional 
2346     <replaceable class="parameter">port</replaceable> parameters are TCP ports, i.e. integer values from 1 to 64535
2347    </para>
2348   </listitem>
2349  </varlistentry>
2350  <varlistentry>
2351   <term>Default value:</term>
2352   <listitem>
2353    <para><emphasis>Unset</emphasis></para>
2354   </listitem>
2355  </varlistentry>
2356  <varlistentry>
2357   <term>Effect if unset:</term>
2358   <listitem>
2359    <para>
2360     Don't use SOCKS proxies.
2361    </para>
2362   </listitem>
2363  </varlistentry>
2364  <varlistentry>
2365   <term>Notes:</term>
2366   <listitem>
2367    <para>
2368     Multiple lines are OK, they are checked in sequence, and the last match wins.
2369    </para>
2370    <para>
2371     The difference between <literal>forward-socks4</literal> and <literal>forward-socks4a</literal>
2372     is that in the SOCKS 4A protocol, the DNS resolution of the target hostname happens on the SOCKS
2373     server, while in SOCKS 4 it happens locally.
2374    </para>
2375    <para>
2376     If <replaceable class="parameter">http_parent</replaceable> is <quote>.</quote>, then requests are not
2377     forwarded to another HTTP proxy but are made (HTTP-wise) directly to the web servers, albeit through
2378     a SOCKS proxy.
2379    </para>
2380   </listitem>
2381  </varlistentry>
2382  <varlistentry>
2383   <term>Examples:</term>
2384   <listitem>
2385    <para>
2386      From the company example.com, direct connections are made to all
2387      <quote>internal</quote> domains, but everything outbound goes through
2388      their ISP's proxy by way of example.com's corporate SOCKS 4A gateway to
2389      the Internet.
2390    </para>
2391    <para>
2392     <screen>
2393   forward-socks4a   .*.            socks-gw.example.com:1080  www-cache.example-isp.net:8080
2394   forward           .example.com   .
2395 </screen>
2396    </para>
2397    <para>
2398     A rule that uses a SOCKS 4 gateway for all destinations but no HTTP parent looks like this:
2399    </para>
2400    <para>
2401     <screen>
2402   forward-socks4   .*.            socks-gw.example.com:1080  .
2403 </screen>
2404    </para>
2405   </listitem>
2406  </varlistentry>
2407 </variablelist>
2408 </sect3>
2409
2410 <sect3 renderas="sect4" id="advanced-forwarding-examples"><title>Advanced Forwarding Examples</title>
2411
2412 <para>
2413  If you have links to multiple ISPs that provide various special content 
2414  only to their subscribers, you can configure multiple <application>Privoxies</application>
2415  which have connections to the respective ISPs to act as forwarders to each other, so that
2416  <emphasis>your</emphasis> users can see the internal content of all ISPs.
2417 </para>
2418
2419 <para>
2420  Assume that host-a has a PPP connection to isp-a.net. And host-b has a PPP connection to
2421  isp-b.net. Both run <application>Privoxy</application>. Their forwarding
2422  configuration can look like this:
2423 </para>
2424
2425 <para>
2426  host-a:
2427 </para>
2428
2429 <para>
2430  <screen>
2431   forward    .*.         .
2432   forward    .isp-b.net  host-b:8118
2433 </screen>
2434 </para>
2435
2436 <para>
2437  host-b:
2438 </para>
2439
2440 <para>
2441  <screen>
2442   forward    .*.         .
2443   forward    .isp-a.net  host-a:8118
2444 </screen>
2445 </para>
2446
2447 <para>
2448  Now, your users can set their browser's proxy to use either
2449  host-a or host-b and be able to browse the internal content
2450  of both isp-a and isp-b.
2451 </para>
2452
2453 <para>
2454  If you intend to chain <application>Privoxy</application> and 
2455  <application>squid</application> locally, then chain as 
2456  <literal>browser -> squid -> privoxy</literal> is the recommended way. 
2457 </para>
2458
2459 <para>
2460  Assuming that <application>Privoxy</application> and <application>squid</application>
2461  run on the same box, your squid configuration could then look like this:
2462 </para>
2463
2464 <para>
2465  <screen>
2466   # Define Privoxy as parent proxy (without ICP) 
2467   cache_peer 127.0.0.1 parent 8118 7 no-query 
2468
2469   # Define ACL for protocol FTP 
2470   acl ftp proto FTP 
2471
2472   # Do not forward FTP requests to Privoxy
2473   always_direct allow ftp 
2474
2475   # Forward all the rest to Privoxy
2476   never_direct allow all</screen>
2477 </para>
2478
2479 <para>
2480  You would then need to change your browser's proxy settings to <application>squid</application>'s address and port.
2481  Squid normally uses port 3128. If unsure consult <literal>http_port</literal> in <filename>squid.conf</filename>.
2482 </para>
2483
2484 </sect3>
2485
2486 </sect2>
2487
2488 <!--  ~  End section  ~  -->
2489
2490
2491 <!--   ~~~~~       New section      ~~~~~     -->
2492
2493 <sect2 id="windows-gui">
2494 <title>Windows GUI Options</title>
2495 <para>
2496  <application>Privoxy</application> has a number of options specific to the
2497  Windows GUI interface:
2498 </para>
2499
2500 <anchor id="activity-animation">
2501 <para>
2502  If <quote>activity-animation</quote> is set to 1, the
2503  <application>Privoxy</application> icon will animate when
2504  <quote>Privoxy</quote> is active. To turn off, set to 0.
2505 </para>
2506
2507 <para>
2508  <literal>
2509   <msgtext> 
2510    <literallayout>
2511   <emphasis>activity-animation   1</emphasis>
2512    </literallayout>
2513   </msgtext> 
2514  </literal>
2515 </para>
2516
2517 <anchor id="log-messages">
2518 <para>
2519  If <quote>log-messages</quote> is set to 1,
2520  <application>Privoxy</application> will log messages to the console
2521  window:
2522 </para>
2523
2524 <para>
2525  <literal>
2526   <msgtext> 
2527    <literallayout>
2528   <emphasis>log-messages       1</emphasis>
2529    </literallayout>
2530   </msgtext> 
2531  </literal>
2532 </para>
2533
2534 <anchor id="log-buffer-size">
2535 <para> 
2536  If <quote>log-buffer-size</quote> is set to 1, the size of the log buffer,
2537  i.e. the amount of memory used for the log messages displayed in the
2538  console window, will be limited to <quote>log-max-lines</quote> (see below).
2539 </para>
2540
2541 <para>
2542  Warning: Setting this to 0 will result in the buffer to grow infinitely and
2543  eat up all your memory!
2544 </para>
2545
2546 <para>
2547  <literal>
2548   <msgtext> 
2549    <literallayout>
2550   <emphasis>log-buffer-size      1</emphasis>
2551    </literallayout>
2552   </msgtext> 
2553  </literal>
2554 </para>
2555
2556 <anchor id="log-max-lines">
2557 <para>
2558  <application>log-max-lines</application> is the maximum number of lines held
2559  in the log buffer. See above.
2560 </para>
2561
2562 <para>
2563  <literal>
2564   <msgtext> 
2565    <literallayout>
2566   <emphasis>log-max-lines      200</emphasis>
2567    </literallayout>
2568   </msgtext> 
2569  </literal>
2570 </para>
2571
2572 <anchor id="log-highlight-messages">
2573 <para>
2574  If <quote>log-highlight-messages</quote> is set to 1,
2575  <application>Privoxy</application> will highlight portions of the log
2576  messages with a bold-faced font:
2577 </para>
2578
2579 <para>
2580  <literal>
2581   <msgtext> 
2582    <literallayout>
2583   <emphasis>log-highlight-messages   1</emphasis>
2584    </literallayout>
2585   </msgtext> 
2586  </literal>
2587 </para>
2588
2589 <anchor id="log-font-name">
2590 <para>
2591  The font used in the console window:
2592 </para>
2593
2594 <para>
2595  <literal>
2596   <msgtext> 
2597    <literallayout>
2598   <emphasis>log-font-name        Comic Sans MS</emphasis>
2599    </literallayout>
2600   </msgtext> 
2601  </literal>
2602 </para>
2603
2604 <anchor id="log-font-size">
2605 <para>
2606  Font size used in the console window:
2607 </para>
2608
2609 <para>
2610  <literal>
2611   <msgtext> 
2612    <literallayout>
2613   <emphasis>log-font-size        8</emphasis>
2614    </literallayout>
2615   </msgtext> 
2616  </literal>
2617 </para>
2618
2619 <anchor id="show-on-task-bar">
2620 <para>  
2621  <quote>show-on-task-bar</quote> controls whether or not
2622  <application>Privoxy</application> will appear as a button on the Task bar
2623  when minimized:
2624 </para>
2625
2626 <para>
2627  <literal>
2628   <msgtext> 
2629    <literallayout>
2630   <emphasis>show-on-task-bar     0</emphasis>
2631    </literallayout>
2632   </msgtext> 
2633  </literal>
2634 </para>
2635
2636 <anchor id="close-button-minimizes">
2637 <para>
2638  If <quote>close-button-minimizes</quote> is set to 1, the Windows close
2639  button will minimize <application>Privoxy</application> instead of closing
2640  the program (close with the exit option on the File menu).
2641 </para>
2642
2643 <para>
2644  <literal>
2645   <msgtext> 
2646    <literallayout>
2647   <emphasis>close-button-minimizes  1</emphasis>
2648    </literallayout>
2649   </msgtext> 
2650  </literal>
2651 </para>
2652
2653 <anchor id="hide-console">
2654 <para>
2655  The <quote>hide-console</quote> option is specific to the MS-Win console
2656  version of <application>Privoxy</application>. If this option is used,
2657  <application>Privoxy</application> will disconnect from and hide  the
2658  command console.
2659 </para>
2660
2661 <para>
2662  <literal>
2663   <msgtext> 
2664    <literallayout>
2665   #<emphasis>hide-console</emphasis>
2666    </literallayout>
2667   </msgtext> 
2668  </literal>
2669 </para>
2670
2671 </sect2>
2672 </sect1>
2673
2674 <!--  ~  End section  ~  -->
2675
2676
2677
2678 <!--   ~~~~~~~~       New section Header    ~~~~~~~~~     -->
2679
2680 <sect1 id="actions-file"><title>Actions Files</title>
2681
2682 <para>
2683  The actions files are used to define what actions
2684  <application>Privoxy</application> takes for which URLs, and thus determine
2685  how ad images, cookies and various other aspects of HTTP content and
2686  transactions are handled, and on which sites (or even parts thereof). There 
2687  are three such files included with <application>Privoxy</application> (as of 
2688  version 2.9.15), with differing purposes:
2689  </para>
2690  
2691  <para>
2692   <itemizedlist>
2693    <listitem>
2694     <para>
2695      <filename>default.action</filename> - is the primary action file 
2696      that sets the initial values for all actions. It is intended to 
2697      provide a base level of functionality for
2698      <application>Privoxy's</application> array of features. So it is 
2699      a set of broad rules that should work reasonably well for users everywhere.
2700      This is the file that the developers are keeping updated, and making 
2701      available to users.
2702     </para>
2703    </listitem> 
2704    <listitem>
2705     <para>
2706      <filename>user.action</filename> - is intended to be for local site 
2707      preferences and exceptions. As an example, if your ISP or your bank
2708      has specific requirements, and need special handling, this kind of 
2709      thing should go here. This file will not be upgraded.
2710     </para>
2711   </listitem> 
2712    <listitem>
2713     <para>
2714      <filename>standard.action</filename> - is used by the web based editor, 
2715      to set various pre-defined sets of rules for the default actions section
2716      in <filename>default.action</filename>. These have increasing levels of
2717      aggressiveness <emphasis>and have no influence on your browsing unless
2718      you select them explicitly in the editor</emphasis>. It is not recommend
2719      to edit this file.
2720     </para>
2721    </listitem> 
2722   </itemizedlist>
2723  </para> 
2724
2725 <para>
2726  The list of actions files to be used are defined in the main configuration 
2727  file, and are processed in the order they are defined. The content of these
2728  can all be viewed and edited from <ulink
2729  url="http://config.privoxy.org/show-status">http://config.privoxy.org/show-status</ulink>.
2730 </para>
2731
2732 <para>
2733  An actions file typically has multiple sections. If you want to use
2734  <quote>aliases</quote> in an actions file, you have to place the (optional)
2735  <link linkend="aliases">alias section</link> at the top of that file.
2736  Then comes the default set of rules which will apply universally to all
2737  sites and pages (be <emphasis>very careful</emphasis> with using such a
2738  universal set in <filename>user.action</filename> or any other actions file after 
2739  <filename>default.action</filename>, because it will override the result
2740  from consulting any previous file). And then below that,
2741  exceptions to the defined universal policies. You can regard
2742  <filename>user.action</filename> as an appendix to <filename>default.action</filename>,
2743  with the advantage that is a separate file, which makes preserving your
2744  personal settings across <application>Privoxy</application> upgrades easier.
2745 </para>
2746
2747 <para> 
2748  Actions can be used to block anything you want, including ads, banners, or
2749  just some obnoxious URL that you would rather not see. Cookies can be accepted
2750  or rejected, or accepted only during the current browser session (i.e. not
2751  written to disk), content can be modified, JavaScripts tamed, user-tracking
2752  fooled, and much more. See below for a <link linkend="actions">complete list
2753  of actions</link>.
2754 </para>
2755
2756 <!--   ~~~~~       New section      ~~~~~     -->
2757 <sect2>
2758 <title>Finding the Right Mix</title>
2759 <para>
2760  Note that some <link linkend="actions">actions</link>, like cookie suppression
2761  or script disabling, may render some sites unusable that rely on these
2762  techniques to work properly. Finding the right mix of actions is not always easy and
2763  certainly a matter of personal taste. In general, it can be said that the more
2764  <quote>aggressive</quote> your default settings (in the top section of the
2765  actions file) are, the more exceptions for <quote>trusted</quote> sites you
2766  will have to make later. If, for example, you want to kill popup windows per
2767  default, you'll have to make exceptions from that rule for sites that you
2768  regularly use and that require popups for actually useful content, like maybe
2769  your bank, favorite shop, or newspaper.
2770 </para>
2771
2772 <para>
2773  We have tried to provide you with reasonable rules to start from in the
2774  distribution actions files. But there is no general rule of thumb on these
2775  things. There just are too many variables, and sites are constantly changing.
2776  Sooner or later you will want to change the rules (and read this chapter again :).
2777 </para>
2778 </sect2>
2779
2780 <!--   ~~~~~       New section      ~~~~~     -->
2781 <sect2>
2782 <title>How to Edit</title>
2783 <para>
2784  The easiest way to edit the actions files is with a browser by
2785  using our browser-based editor, which can be reached from <ulink
2786  url="http://config.privoxy.org/show-status">http://config.privoxy.org/show-status</ulink>.
2787  The editor allows both fine-grained control over every single feature on a
2788  per-URL basis, and easy choosing from wholesale sets of defaults like
2789  <quote>Cautious</quote>, <quote>Medium</quote> or <quote>Advanced</quote>.
2790 </para>
2791
2792 <para>
2793  If you prefer plain text editing to GUIs, you can of course also directly edit the
2794  the actions files. Look at <filename>default.action</filename> which is richly
2795  commented.
2796 </para>
2797 </sect2>
2798
2799
2800 <sect2 id="actions-apply">
2801 <title>How Actions are Applied to URLs</title>
2802 <para>
2803  Actions files are divided into sections. There are special sections,
2804  like the <quote><link linkend="aliases">alias</link></quote> sections which will be discussed later. For now
2805  let's concentrate on regular sections: They have a heading line (often split
2806  up to multiple lines for readability) which consist of a list of actions,
2807  separated by whitespace and enclosed in curly braces. Below that, there
2808  is a list of URL patterns, each on a separate line.
2809 </para>
2810
2811 <para>
2812  To determine which actions apply to a request, the URL of the request is
2813  compared to all patterns in each action file file. Every time it matches, the list of
2814  applicable actions for the URL is incrementally updated, using the heading
2815  of the section in which the pattern is located. If multiple matches for
2816  the same URL set the same action differently, the last match wins. If not, 
2817  the effects are aggregated (e.g. a URL might match both the 
2818  <ulink url="actions-file.html#HANDLE-AS-IMAGE"><quote>+handle-as-image</quote></ulink>
2819  and <ulink url="actions-file.html#BLOCK"><quote>+block</quote></ulink> actions).
2820  
2821 </para>
2822
2823 <para>
2824  You can trace this process for any given URL by visiting <ulink
2825  url="http://config.privoxy.org/show-url-info">http://config.privoxy.org/show-url-info</ulink>.
2826 </para>
2827
2828 <para>
2829  More detail on this is provided in the Appendix, <link linkend="ACTIONSANAT">
2830  Anatomy of an Action</link>.
2831 </para>
2832 </sect2>
2833
2834 <!--   ~~~~~       New section      ~~~~~     -->
2835 <sect2 id="af-patterns">
2836 <title>Patterns</title>
2837 <para>
2838  Generally, a pattern has the form <literal>&lt;domain&gt;/&lt;path&gt;</literal>,
2839  where both the <literal>&lt;domain&gt;</literal> and <literal>&lt;path&gt;</literal>
2840  are optional. (This is why the pattern <literal>/</literal> matches all URLs).
2841 </para>
2842
2843 <variablelist>
2844  <varlistentry>
2845   <term><literal>www.example.com/</literal></term>
2846   <listitem>
2847    <para>
2848     is a domain-only pattern and will match any request to <literal>www.example.com</literal>,
2849     regardless of which document on that server is requested.
2850    </para>
2851   </listitem>
2852  </varlistentry>
2853  <varlistentry>
2854   <term><literal>www.example.com</literal></term>
2855   <listitem>
2856    <para>
2857     means exactly the same. For domain-only patterns, the trailing <literal>/</literal> may
2858     be omitted.
2859    </para>
2860   </listitem>
2861  </varlistentry>
2862  <varlistentry>
2863   <term><literal>www.example.com/index.html</literal></term>
2864   <listitem>
2865    <para>
2866     matches only the single document <literal>/index.html</literal>
2867     on <literal>www.example.com</literal>.
2868    </para>
2869   </listitem>
2870  </varlistentry>
2871  <varlistentry>
2872   <term><literal>/index.html</literal></term>
2873   <listitem>
2874    <para>
2875     matches the document <literal>/index.html</literal>, regardless of the domain,
2876     i.e. on <emphasis>any</emphasis> web server.
2877    </para>
2878   </listitem>
2879  </varlistentry>
2880  <varlistentry>
2881   <term><literal>index.html</literal></term>
2882   <listitem>
2883    <para>
2884     matches nothing, since it would be  interpreted as a domain name and
2885     there is no top-level domain called <literal>.html</literal>.
2886    </para>
2887   </listitem>
2888  </varlistentry>
2889 </variablelist>
2890
2891
2892 <!--   ~~~~~       New section      ~~~~~     -->
2893 <sect3><title>The Domain Pattern</title>
2894
2895 <para>
2896  The matching of the domain part offers some flexible options: if the
2897  domain starts or ends with a dot, it becomes unanchored at that end. 
2898  For example:
2899 </para>
2900
2901 <variablelist>
2902  <varlistentry>
2903   <term><literal>.example.com</literal></term>
2904   <listitem>
2905    <para>
2906     matches any domain that <emphasis>ENDS</emphasis> in
2907     <literal>.example.com</literal>
2908    </para>
2909   </listitem>
2910  </varlistentry>
2911  <varlistentry>
2912   <term><literal>www.</literal></term>
2913   <listitem>
2914    <para>
2915     matches any domain that <emphasis>STARTS</emphasis> with
2916     <literal>www.</literal>
2917    </para>
2918   </listitem>
2919  </varlistentry>
2920  <varlistentry>
2921   <term><literal>.example.</literal></term>
2922   <listitem>
2923    <para>
2924     matches any domain that <emphasis>CONTAINS</emphasis> <literal>.example.</literal>
2925     (Correctly speaking: It matches any FQDN that contains <literal>example</literal> as a domain.)
2926    </para>
2927   </listitem>
2928  </varlistentry>
2929 </variablelist>
2930
2931 <para>
2932  Additionally, there are wild-cards that you can use in the domain names
2933  themselves. They work pretty similar to shell wild-cards: <quote>*</quote>
2934  stands for zero or more arbitrary characters, <quote>?</quote> stands for
2935  any single character, you can define character classes in square
2936  brackets and all of that can be freely mixed:
2937 </para>
2938
2939 <variablelist>
2940  <varlistentry>
2941   <term><literal>ad*.example.com</literal></term>
2942   <listitem>
2943    <para>
2944     matches <quote>adserver.example.com</quote>, 
2945     <quote>ads.example.com</quote>, etc but not <quote>sfads.example.com</quote>
2946    </para>
2947   </listitem>
2948  </varlistentry>
2949  <varlistentry>
2950   <term><literal>*ad*.example.com</literal></term>
2951   <listitem>
2952    <para>
2953     matches all of the above, and then some.
2954    </para>
2955   </listitem>
2956  </varlistentry>
2957  <varlistentry>
2958   <term><literal>.?pix.com</literal></term>
2959   <listitem>
2960    <para>
2961     matches <literal>www.ipix.com</literal>,
2962     <literal>pictures.epix.com</literal>, <literal>a.b.c.d.e.upix.com</literal> etc. 
2963    </para>
2964   </listitem>
2965  </varlistentry>
2966  <varlistentry>
2967   <term><literal>www[1-9a-ez].example.c*</literal></term>
2968   <listitem>
2969    <para>
2970      matches <literal>www1.example.com</literal>, 
2971      <literal>www4.example.cc</literal>, <literal>wwwd.example.cy</literal>, 
2972      <literal>wwwz.example.com</literal> etc., but <emphasis>not</emphasis> 
2973      <literal>wwww.example.com</literal>.
2974    </para>
2975   </listitem>
2976  </varlistentry>
2977 </variablelist>
2978
2979 </sect3>
2980
2981 <!--  ~  End section  ~  -->
2982
2983
2984 <!--   ~~~~~       New section      ~~~~~     -->
2985 <sect3><title>The Path Pattern</title>
2986
2987 <para>
2988  <application>Privoxy</application> uses Perl compatible regular expressions
2989  (through the <ulink url="http://www.pcre.org/">PCRE</ulink> library) for
2990  matching the path.
2991 </para>
2992
2993 <para>
2994  There is an <link linkend="regex">Appendix</link> with a brief quick-start into regular
2995  expressions, and full (very technical) documentation on PCRE regex syntax is available on-line
2996  at <ulink url="http://www.pcre.org/man.txt">http://www.pcre.org/man.txt</ulink>.
2997  You might also find the Perl man page on regular expressions (<literal>man perlre</literal>)
2998  useful, which is available on-line at <ulink
2999  url="http://www.perldoc.com/perl5.6/pod/perlre.html">http://www.perldoc.com/perl5.6/pod/perlre.html</ulink>.
3000 </para>
3001
3002 <para>
3003  Note that the path pattern is automatically left-anchored at the <quote>/</quote>,
3004  i.e. it matches as if it would start with a <quote>^</quote> (regular expression speak 
3005  for the beginning of a line).
3006 </para>
3007
3008 <para>
3009  Please also note that matching in the path is case
3010  <emphasis>INSENSITIVE</emphasis> by default, but you can switch to case
3011  sensitive at any point in the pattern by using the 
3012  <quote>(?-i)</quote> switch:
3013  <literal>www.example.com/(?-i)PaTtErN.*</literal> will match only
3014  documents whose path starts with <literal>PaTtErN</literal> in
3015  <emphasis>exactly</emphasis> this capitalization.
3016 </para>
3017 </sect3>
3018
3019 </sect2>
3020
3021 <!--  ~  End section  ~  -->
3022
3023
3024 <!--   ~~~~~       New section      ~~~~~     -->
3025
3026 <sect2 id="actions">
3027 <title>Actions</title>
3028 <para>
3029  All actions are disabled by default, until they are explicitly enabled
3030  somewhere in an actions file. Actions are turned on if preceded with a
3031  <quote>+</quote>, and turned off if preceded with a <quote>-</quote>. So a
3032  <literal>+action</literal> means <quote>do that action</quote>, e.g.
3033  <literal>+block</literal> means <quote>please block URLs that match the
3034  following patterns</quote>, and <literal>-block</literal> means <quote>don't
3035  block URLs that match the following patterns, even if <literal>+block</literal>
3036  previously applied.</quote>
3037
3038 </para>
3039
3040 <para> 
3041  Again, actions are invoked by placing them on a line, enclosed in curly braces and
3042  separated by whitespace, like in 
3043  <literal>{+some-action -some-other-action{some-parameter}}</literal>,
3044  followed by a list of URL patterns, one per line, to which they apply.
3045  Together, the actions line and the following pattern lines make up a section
3046  of the actions file. 
3047 </para>
3048
3049 <para> 
3050  There are three classes of actions:
3051 </para>
3052
3053 <para>
3054  <itemizedlist>
3055  <listitem>
3056   <para>  
3057    Boolean, i.e the action can only be <quote>enabled</quote> or
3058    <quote>disabled</quote>. Syntax:
3059   </para>
3060   <para>
3061    <screen>
3062   +<replaceable class="function">name</replaceable>        # enable action <replaceable class="parameter">name</replaceable>
3063   -<replaceable class="function">name</replaceable>        # disable action <replaceable class="parameter">name</replaceable></screen>
3064   </para>
3065   <para>  
3066    Example: <literal>+block</literal>
3067   </para>
3068  </listitem>
3069
3070
3071  <listitem>
3072   <para>  
3073    Parameterized, where some value is required in order to enable this type of action.
3074    Syntax:
3075   </para>
3076   <para>
3077    <screen>
3078   +<replaceable class="function">name</replaceable>{<replaceable class="parameter">param</replaceable>}  # enable action and set parameter to <replaceable class="parameter">param</replaceable>,
3079                # overwriting parameter from previous match if necessary
3080   -<replaceable class="function">name</replaceable>         # disable action. The parameter can be omitted</screen>
3081   </para>
3082   <para>
3083    Note that if the URL matches multiple positive forms of a parameterized action,
3084    the last match wins, i.e. the params from earlier matches are simply ignored.
3085   </para>
3086   <para>  
3087    Example: <literal>+hide-user-agent{ Mozilla 1.0 }</literal>
3088   </para>
3089  </listitem>
3090  
3091  <listitem>
3092   <para>  
3093    Multi-value. These look exactly like parameterized actions,
3094    but they behave differently: If the action applies multiple times to the
3095    same URL, but with different parameters, <emphasis>all</emphasis> the parameters
3096    from <emphasis>all</emphasis> matches are remembered. This is used for actions
3097    that can be executed for the same request repeatedly, like adding multiple
3098    headers, or filtering through multiple filters. Syntax:
3099   </para>
3100   <para>
3101    <screen>
3102   +<replaceable class="function">name</replaceable>{<replaceable class="parameter">param</replaceable>}   # enable action and add <replaceable class="parameter">param</replaceable> to the list of parameters
3103   -<replaceable class="function">name</replaceable>{<replaceable class="parameter">param</replaceable>}   # remove the parameter <replaceable class="parameter">param</replaceable> from the list of parameters
3104                 # If it was the last one left, disable the action.
3105   <replaceable class="parameter">-name</replaceable>          # disable this action completely and remove all parameters from the list</screen>
3106   </para>
3107   <para>  
3108    Examples: <literal>+add-header{X-Fun-Header: Some text}</literal> and
3109    <literal>+filter{html-annoyances}</literal>
3110   </para>
3111  </listitem>
3112
3113  </itemizedlist>
3114 </para>
3115
3116 <para>
3117  If nothing is specified in any actions file, no <quote>actions</quote> are
3118  taken. So in this case <application>Privoxy</application> would just be a
3119  normal, non-blocking, non-anonymizing proxy. You must specifically enable the
3120  privacy and blocking features you need (although the provided default actions
3121  files will give a good starting point).
3122 </para>
3123
3124 <para>
3125  Later defined actions always over-ride earlier ones.  So exceptions 
3126  to any rules you make, should come in the latter part of the file (or 
3127  in a file that is processed later when using multiple actions files). For
3128  multi-valued actions, the actions are applied in the order they are specified.
3129  Actions files are processed in the order they are defined in
3130  <filename>config</filename> (the default installation has three actions
3131  files). It also quite possible for any given URL pattern to match more than
3132  one pattern and thus more than one set of actions!
3133 </para>
3134
3135 <!-- start actions listing -->
3136 <para>
3137  The list of valid <application>Privoxy</application> actions are:
3138 </para>
3139
3140
3141 <!-- ********************************************************** -->
3142 <!-- Please note the below defined actions use id's that are    -->
3143 <!-- probably linked from other places, so please don't change. -->
3144 <!--                                                            -->
3145 <!-- ********************************************************** -->
3146
3147
3148 <!--   ~~~~~       New section      ~~~~~     -->
3149
3150 <sect3 renderas="sect4" id="add-header">
3151 <title><emphasis>add-header</emphasis></title>
3152
3153 <variablelist>
3154  <varlistentry>
3155   <term>Typical use:</term>
3156   <listitem>
3157    <para>Confuse log analysis, custom applications</para>
3158   </listitem>
3159  </varlistentry>
3160
3161  <varlistentry>
3162   <term>Effect:</term>
3163   <listitem>
3164    <para>
3165     Sends a user defined HTTP header to the web server.
3166    </para>
3167   </listitem>
3168  </varlistentry>
3169
3170  <varlistentry>
3171   <term>Type:</term>
3172   <!-- boolean, parameterized, Multi-value -->
3173   <listitem>
3174    <para>Multi-value.</para>
3175   </listitem>
3176  </varlistentry>
3177  
3178  <varlistentry>
3179   <term>Parameter:</term>
3180   <listitem>
3181    <para>
3182     Any string value is possible. Validity of the defined HTTP headers is not checked.
3183     It is recommended that you use the <quote><literal>X-</literal></quote> prefix
3184     for custom headers.
3185    </para>
3186   </listitem>
3187  </varlistentry>
3188  
3189 <varlistentry>
3190   <term>Notes:</term>
3191   <listitem>
3192    <para>
3193     This action may be specified multiple times, in order to define multiple 
3194     headers. This is rarely needed for the typical user. If you don't know what 
3195     <quote>HTTP headers</quote> are, you definitely don't need to worry about this 
3196     one.
3197    </para>
3198   </listitem>
3199  </varlistentry>
3200
3201  <varlistentry>
3202   <term>Example usage:</term>
3203   <listitem>
3204     <para>
3205      <screen>+add-header{X-User-Tracking: sucks}</screen>
3206    </para>
3207   </listitem>
3208  </varlistentry>
3209 </variablelist>
3210 </sect3>
3211
3212
3213 <!--   ~~~~~       New section      ~~~~~     -->
3214 <sect3 renderas="sect4" id="block">
3215 <title><emphasis>block</emphasis></title>
3216
3217 <variablelist>
3218  <varlistentry>
3219   <term>Typical use:</term>
3220   <listitem>
3221    <para>Block ads or other obnoxious content</para>
3222   </listitem>
3223  </varlistentry>
3224
3225  <varlistentry>
3226   <term>Effect:</term>
3227   <listitem>
3228    <para>
3229     Requests for URLs to which this action applies are blocked, i.e. the requests are not
3230     forwarded to the remote server, but answered locally with a substitute page or image,
3231     as determined by the <literal><link linkend="handle-as-image">handle-as-image</link></literal>
3232     and <literal><link linkend="set-image-blocker">set-image-blocker</link></literal> actions.
3233    </para>
3234   </listitem>
3235  </varlistentry>
3236
3237  <varlistentry>
3238   <term>Type:</term>
3239   <!-- boolean, parameterized, Multi-value -->
3240   <listitem>
3241    <para>Boolean.</para>
3242   </listitem>
3243  </varlistentry>
3244
3245  <varlistentry>
3246   <term>Parameter:</term>
3247   <listitem>
3248    <para>N/A</para>
3249   </listitem>
3250  </varlistentry>
3251  
3252 <varlistentry>
3253   <term>Notes:</term>
3254   <listitem>
3255    <para>
3256     <application>Privoxy</application> sends a special <quote>BLOCKED</quote> page
3257     for requests to blocked pages. This page contains links to find out why the request
3258     was blocked, and a click-through to the blocked content (the latter only if compiled with the
3259     force feature enabled). The <quote>BLOCKED</quote> page adapts to the available
3260     screen space -- it displays full-blown if space allows, or miniaturized and text-only
3261     if loaded into a small frame or window. If you are using <application>Privoxy</application>
3262     right now, you can take a look at the 
3263     <ulink url="http://ads.bannerserver.example.com/nasty-ads/sponsor.html"><quote>BLOCKED</quote>
3264     page</ulink>.
3265    </para>
3266    <para> 
3267     A very important exception occurs if <emphasis>both</emphasis> 
3268     <literal>block</literal> and <literal><link linkend="handle-as-image">handle-as-image</link></literal>,
3269     apply to the same request: it will then be replaced by an image. If 
3270     <literal><link linkend="set-image-blocker">set-image-blocker</link></literal>
3271     (see below) also applies, the type of image will be determined by its parameter,
3272     if not, the standard checkerboard pattern is sent.
3273    </para>
3274    <para>
3275     It is important to understand this process, in order 
3276     to understand how <application>Privoxy</application> deals with 
3277     ads and other unwanted content.
3278    </para>
3279    <para>
3280     The <literal><link linkend="filter">filter</link></literal>
3281     action can perform a very similar task, by <quote>blocking</quote>
3282     banner images and other content through rewriting the relevant URLs in the
3283     document's HTML source, so they don't get requested in the first place.
3284     Note that this is a totally different technique, and it's easy to confuse the two.
3285    </para>
3286   </listitem>
3287  </varlistentry>
3288
3289  <varlistentry>
3290   <term>Example usage (section):</term>
3291   <listitem>
3292     <para>
3293      <screen>{+block}      # Block and replace with "blocked" page
3294 .nasty-stuff.example.com
3295
3296 {+block +handle-as-image} # Block and replace with image
3297 .ad.doubleclick.net
3298 .ads.r.us</screen>
3299     </para>
3300   </listitem>
3301  </varlistentry>
3302
3303
3304 </variablelist>
3305 </sect3>
3306
3307 <!--   ~~~~~       New section      ~~~~~     -->
3308 <sect3 renderas="sect4" id="crunch-incoming-cookies">
3309 <title><emphasis>crunch-incoming-cookies</emphasis></title>
3310
3311 <variablelist>
3312  <varlistentry>
3313   <term>Typical use:</term>
3314   <listitem>
3315    <para>
3316     Prevent the web server from setting any cookies on your system
3317    </para>
3318   </listitem>
3319  </varlistentry>
3320
3321  <varlistentry>
3322   <term>Effect:</term>
3323   <listitem>
3324    <para>
3325     Deletes any <quote>Set-Cookie:</quote> HTTP headers from server replies.
3326    </para>
3327   </listitem>
3328  </varlistentry>
3329
3330  <varlistentry>
3331   <term>Type:</term>
3332   <!-- Boolean, Parameterized, Multi-value -->
3333   <listitem>
3334    <para>Boolean.</para>
3335   </listitem>
3336  </varlistentry>
3337
3338  <varlistentry>
3339   <term>Parameter:</term>
3340   <listitem>
3341    <para>
3342     N/A
3343    </para>
3344   </listitem>
3345  </varlistentry>
3346  
3347  <varlistentry>
3348   <term>Notes:</term>
3349   <listitem>
3350    <para>
3351     This action is only concerned with <emphasis>incoming</emphasis> cookies. For
3352     <emphasis>outgoing</emphasis> cookies, use
3353     <literal><link linkend="crunch-outgoing-cookies">crunch-outgoing-cookies</link></literal>.
3354     Use <emphasis>both</emphasis> to disable cookies completely.
3355    </para>
3356    <para>
3357     It makes <emphasis>no sense at all</emphasis> to use this action in conjunction
3358     with the <literal><link linkend="session-cookies-only">session-cookies-only</link></literal> action,
3359     since it would prevent the session cookies from being set.
3360    </para>
3361   </listitem>
3362  </varlistentry>
3363
3364  <varlistentry>
3365   <term>Example usage:</term>
3366   <listitem>
3367    <para>
3368     <screen>+crunch-incoming-cookies</screen>
3369    </para>
3370   </listitem>
3371  </varlistentry>
3372 </variablelist>
3373 </sect3>
3374
3375
3376 <!--   ~~~~~       New section      ~~~~~     -->
3377 <sect3 renderas="sect4" id="crunch-outgoing-cookies">
3378 <title><emphasis>crunch-outgoing-cookies</emphasis></title>
3379
3380 <variablelist>
3381  <varlistentry>
3382   <term>Typical use:</term>
3383   <listitem>
3384    <para>
3385     Prevent the web server from reading any cookies from your system
3386    </para>
3387   </listitem>
3388  </varlistentry>
3389
3390  <varlistentry>
3391   <term>Effect:</term>
3392   <listitem>
3393    <para>
3394     Deletes any <quote>Cookie:</quote> HTTP headers from client requests.
3395    </para>
3396   </listitem>
3397  </varlistentry>
3398
3399  <varlistentry>
3400   <term>Type:</term>
3401   <!-- Boolean, Parameterized, Multi-value -->
3402   <listitem>
3403    <para>Boolean.</para>
3404   </listitem>
3405  </varlistentry>
3406
3407  <varlistentry>
3408   <term>Parameter:</term>
3409   <listitem>
3410    <para>
3411     N/A
3412    </para>
3413   </listitem>
3414  </varlistentry>
3415  
3416  <varlistentry>
3417   <term>Notes:</term>
3418   <listitem>
3419    <para>
3420     This action is only concerned with <emphasis>outgoing</emphasis> cookies. For
3421     <emphasis>incoming</emphasis> cookies, use
3422     <literal><link linkend="crunch-incoming-cookies">crunch-incoming-cookies</link></literal>.
3423     Use <emphasis>both</emphasis> to disable cookies completely.
3424    </para>
3425    <para>
3426     It makes <emphasis>no sense at all</emphasis> to use this action in conjunction
3427     with the <literal><link linkend="session-cookies-only">session-cookies-only</link></literal> action,
3428     since it would prevent the session cookies from being read.
3429    </para>
3430   </listitem>
3431  </varlistentry>
3432
3433  <varlistentry>
3434   <term>Example usage:</term>
3435   <listitem>
3436    <para>
3437     <screen>+crunch-outgoing-cookies</screen>
3438    </para>
3439   </listitem>
3440  </varlistentry>
3441
3442 </variablelist>
3443 </sect3>
3444
3445
3446 <!--   ~~~~~       New section      ~~~~~     -->
3447 <sect3 renderas="sect4" id="deanimate-gifs">
3448 <title><emphasis>deanimate-gifs</emphasis></title>
3449
3450 <variablelist>
3451  <varlistentry>
3452   <term>Typical use:</term>
3453   <listitem>
3454    <para>Stop those annoying, distracting animated GIF images.</para>
3455   </listitem>
3456  </varlistentry>
3457
3458  <varlistentry>
3459   <term>Effect:</term>
3460   <listitem>
3461    <para>
3462     De-animate GIF animations, i.e. reduce them to their first or last image.
3463    </para>
3464   </listitem>
3465  </varlistentry>
3466
3467  <varlistentry>
3468   <term>Type:</term>
3469   <!-- boolean, parameterized, Multi-value -->
3470   <listitem>
3471    <para>Parameterized.</para>
3472   </listitem>
3473  </varlistentry>
3474
3475  <varlistentry>
3476   <term>Parameter:</term>
3477   <listitem>
3478    <para>
3479     <quote>last</quote> or <quote>first</quote>
3480    </para>
3481   </listitem>
3482  </varlistentry>
3483  
3484  <varlistentry>
3485   <term>Notes:</term>
3486   <listitem>
3487    <para>
3488     This will also shrink the images considerably (in bytes, not pixels!). If
3489     the option <quote>first</quote> is given, the first frame of the animation
3490     is used as the replacement. If <quote>last</quote> is given, the last
3491     frame of the animation is used instead, which probably makes more sense for
3492     most banner animations, but also has the risk of not showing the entire
3493     last frame (if it is only a delta to an earlier frame).
3494    </para>
3495    <para>
3496     You can safely use this action with patterns that will also match non-GIF
3497     objects, because no attempt will be made at anything that doesn't look like
3498     a GIF.
3499    </para>
3500   </listitem>
3501  </varlistentry>
3502
3503  <varlistentry>
3504   <term>Example usage:</term>
3505   <listitem>
3506     <para>
3507       <screen>+deanimate-gifs{last}</screen>
3508     </para>
3509   </listitem>
3510  </varlistentry>
3511 </variablelist>
3512 </sect3>
3513
3514 <!--   ~~~~~       New section      ~~~~~     -->
3515 <sect3 renderas="sect4" id="downgrade-http-version">
3516 <title><emphasis>downgrade-http-version</emphasis></title>
3517
3518 <variablelist>
3519  <varlistentry>
3520   <term>Typical use:</term>
3521   <listitem>
3522    <para>Work around (very rare) problems with HTTP/1.1</para>
3523   </listitem>
3524  </varlistentry>
3525
3526  <varlistentry>
3527   <term>Effect:</term>
3528   <listitem>
3529    <para>
3530     Downgrades HTTP/1.1 client requests and server replies to HTTP/1.0.
3531    </para>
3532   </listitem>
3533  </varlistentry>
3534
3535  <varlistentry>
3536   <term>Type:</term>
3537   <!-- boolean, parameterized, Multi-value -->
3538   <listitem>
3539    <para>Boolean.</para>
3540   </listitem>
3541  </varlistentry>
3542
3543  <varlistentry>
3544   <term>Parameter:</term>
3545   <listitem>
3546    <para>
3547     N/A
3548    </para>
3549   </listitem>
3550  </varlistentry>
3551  
3552 <varlistentry>
3553   <term>Notes:</term>
3554   <listitem>
3555    <para>
3556     This is a left-over from the time when <application>Privoxy</application>
3557     didn't support important HTTP/1.1 features well. It is left here for the
3558     unlikely case that you experience HTTP/1.1 related problems with some server
3559     out there. Not all (optional) HTTP/1.1 features are supported yet, so there
3560     is a chance you might need this action.
3561    </para>
3562   </listitem>
3563  </varlistentry>
3564
3565  <varlistentry>
3566   <term>Example usage (section):</term>
3567   <listitem>
3568     <para>
3569      <screen>{+downgrade-http-version}
3570 problem-host.example.com</screen>
3571     </para>
3572   </listitem>
3573  </varlistentry>
3574
3575 </variablelist>
3576 </sect3>
3577
3578 <!--   ~~~~~       New section      ~~~~~     -->
3579 <sect3 renderas="sect4" id="fast-redirects">
3580 <title><emphasis>fast-redirects</emphasis></title>
3581
3582 <variablelist>
3583  <varlistentry>
3584   <term>Typical use:</term>
3585   <listitem>
3586    <para>Fool some click-tracking scripts and speed up indirect links</para>
3587   </listitem>
3588  </varlistentry>
3589
3590  <varlistentry>
3591   <term>Effect:</term>
3592   <listitem>
3593    <para>
3594     Cut off all but the last valid URL from requests.
3595    </para>
3596   </listitem>
3597  </varlistentry>
3598
3599  <varlistentry>
3600   <term>Type:</term>
3601   <!-- boolean, parameterized, Multi-value -->
3602   <listitem>
3603    <para>Boolean.</para>
3604   </listitem>
3605  </varlistentry>
3606
3607  <varlistentry>
3608   <term>Parameter:</term>
3609   <listitem>
3610    <para>
3611     N/A
3612    </para>
3613   </listitem>
3614  </varlistentry>
3615
3616  <varlistentry>
3617   <term>Notes:</term>
3618   <listitem>
3619    <para>  
3620     Many sites, like yahoo.com, don't just link to other sites. Instead, they
3621     will link to some script on their own servers, giving the destination as a
3622     parameter, which will then redirect you to the final target. URLs
3623     resulting from this scheme typically look like:
3624     <emphasis>http://some.place/click-tracker.cgi?target=http://some.where.else</emphasis>.
3625   </para>
3626    <para>
3627     Sometimes, there are even multiple consecutive redirects encoded in the
3628     URL. These redirections via scripts make your web browsing more traceable,
3629     since the server from which you follow such a link can see where you go
3630     to. Apart from that, valuable bandwidth and time is wasted, while your
3631     browser ask the server for one redirect after the other. Plus, it feeds
3632     the advertisers.
3633    </para>
3634    <para>
3635     This feature is currently not very smart and is scheduled for improvement.
3636     It is likely to break some sites. You should expect to need possibly 
3637     many exceptions to this action, if it is enabled by default in
3638     <filename>default.action</filename>. Some sites just don't work without 
3639     it.
3640    </para>
3641   </listitem>
3642  </varlistentry>
3643
3644  <varlistentry>
3645   <term>Example usage:</term>
3646   <listitem>
3647     <para>
3648      <screen>{+fast-redirects}</screen>
3649     </para>
3650   </listitem>
3651  </varlistentry>
3652
3653 </variablelist>
3654 </sect3>
3655
3656
3657 <!--   ~~~~~       New section      ~~~~~     -->
3658 <sect3 renderas="sect4" id="filter">
3659 <title><emphasis>filter</emphasis></title>
3660
3661 <variablelist>
3662  <varlistentry>
3663   <term>Typical use:</term>
3664   <listitem>
3665    <para>Get rid of HTML and JavaScript annoyances, banner advertisements (by size), do fun text replacements, etc.</para>
3666   </listitem>
3667  </varlistentry>
3668
3669  <varlistentry>
3670   <term>Effect:</term>
3671   <listitem>
3672    <para>
3673     Text documents, including HTML and JavaScript, to which this action applies, are filtered on-the-fly
3674     through the specified regular expression based substitutions.    
3675    </para>
3676   </listitem>
3677  </varlistentry>
3678
3679  <varlistentry>
3680   <term>Type:</term>
3681   <!-- boolean, parameterized, Multi-value -->
3682   <listitem>
3683    <para>Parameterized.</para>
3684   </listitem>
3685  </varlistentry>
3686
3687  <varlistentry>
3688   <term>Parameter:</term>
3689   <listitem>
3690    <para>
3691     The name of a filter, as defined in the <link linkend="filter-file">filter file</link>
3692     (typically <filename>default.filter</filename>, set by the
3693     <literal><link linkend="filterfile">filterfile</link></literal>
3694     option in the <link linkend="config">config file</link>)
3695    </para>
3696   </listitem>
3697  </varlistentry>
3698  
3699  <varlistentry>
3700   <term>Notes:</term>
3701   <listitem>
3702    <para>
3703     For your convenience, there are a bunch of pre-defined filters available 
3704     in the distribution filter file that you can use. See the example below for
3705     a list.
3706    </para>
3707    <para>
3708     This is potentially a very powerful feature!  But <quote>rolling your own</quote>
3709     filters requires a knowledge of regular expressions and HTML.
3710    </para>
3711    <para>
3712     Filtering requires buffering the page content, which may appear to
3713     slow down page rendering since nothing is displayed until all content has
3714     passed the filters. (It does not really take longer, but seems that way
3715     since the page is not incrementally displayed.) This effect will be more
3716     noticeable on slower connections.
3717    </para>
3718    <para>
3719     At this time, <application>Privoxy</application> cannot (yet!) uncompress compressed
3720     documents. If you want filtering to work on all documents, even those that
3721     would normally be sent compressed, use the
3722     <literal><link linkend="prevent-compression">prevent-compression</link></literal>
3723     action in conjunction with <literal>filter</literal>.
3724    </para>
3725    <para>
3726     Filtering can achieve some of the effects as the 
3727     <literal><link linkend="block">block</link></literal>
3728     action, i.e. it can be used to block ads and banners. 
3729    </para>
3730    <para>
3731     <link linkend="contact">Feedback</link> with suggestions for new or improved filters is particularly
3732     welcome!
3733    </para>
3734   </listitem>
3735  </varlistentry>
3736
3737  <varlistentry>
3738   <term>Example usage (with filters from the distribution <filename>default.filter</filename> file):</term>
3739   <listitem>
3740    <para>
3741     <anchor id="filter-html-annoyances">
3742     <screen>+filter{html-annoyances}     # Get rid of particularly annoying HTML abuse.</screen>
3743    </para>
3744    <para>
3745     <anchor id="filter-js-annoyances">
3746     <screen>+filter{js-annoyances}       # Get rid of particularly annoying JavaScript abuse</screen>
3747    </para>
3748    <para>
3749     <anchor id="filter-banners-by-size">
3750     <screen>+filter{banners-by-size}     # Kill banners by size (<emphasis>very</emphasis> efficient!)</screen>
3751    </para>
3752    <para>
3753     <anchor id="filter-content-cookies">
3754     <screen>+filter{content-cookies}     # Kill cookies that come sneaking in the HTML or JS content</screen>
3755    </para>
3756    <para>
3757     <anchor id="filter-popups">
3758     <screen>+filter{popups}              # Kill all popups in JS and HTML</screen>
3759    </para>
3760    <para>
3761     <anchor id="filter-webbugs">
3762     <screen>+filter{webbugs}             # Squish WebBugs (1x1 invisible GIFs used for user tracking)</screen>
3763    </para>
3764    <para>
3765     <anchor id="filter-fun">
3766     <screen>+filter{fun}                 # Text replacements for subversive browsing fun!</screen>
3767    </para>
3768    <para>
3769     <anchor id="filter-frameset-borders">
3770     <screen>+filter{frameset-borders}    # Give frames a border and make them resizeable</screen> 
3771    </para>
3772    <para>
3773     <anchor id="filter-refresh-tags">
3774     <screen>+filter{refresh-tags}        # Kill automatic refresh tags (for dial-on-demand setups)</screen>
3775    </para>
3776    <para>
3777     <anchor id="filter-nimda">
3778     <screen>+filter{nimda}               # Remove Nimda (virus) code.</screen>
3779    </para>
3780    <para>
3781     <anchor id="filter-shockwave-flash">
3782     <screen>+filter{shockwave-flash}     # Kill embedded Shockwave Flash objects</screen>
3783    </para>
3784    <para>
3785     <anchor id="filter-crude-parental">
3786     <screen>+filter{crude-parental}      # Kill all web pages that contain the words "sex" or "warez"</screen>
3787    </para>
3788   </listitem>
3789  </varlistentry>
3790 </variablelist>
3791 </sect3>
3792
3793
3794 <!--   ~~~~~       New section      ~~~~~     -->
3795 <sect3 renderas="sect4" id="handle-as-image">
3796 <title><emphasis>handle-as-image</emphasis></title>
3797
3798 <variablelist>
3799  <varlistentry>
3800   <term>Typical use:</term>
3801   <listitem>
3802    <para>Mark URLs as belonging to images (so they'll be replaced by images <emphasis>if they get blocked</emphasis>)</para>
3803   </listitem>
3804  </varlistentry>
3805
3806  <varlistentry>
3807   <term>Effect:</term>
3808   <listitem>
3809    <para>
3810     This action alone doesn't do anything noticeable. It just marks URLs as images.
3811     If the <literal><link linkend="block">block</link></literal> action <emphasis>also applies</emphasis>,
3812     the presence or absence of this mark decides whether an HTML <quote>blocked</quote>
3813     page, or a replacement image (as determined by the <literal><link
3814     linkend="set-image-blocker">set-image-blocker</link></literal> action) will be sent to the
3815     client as a substitute for the blocked content.
3816    </para>
3817   </listitem>
3818  </varlistentry>
3819
3820  <varlistentry>
3821   <term>Type:</term>
3822   <!-- Boolean, Parameterized, Multi-value -->
3823   <listitem>
3824    <para>Boolean.</para>
3825   </listitem>
3826  </varlistentry>
3827
3828  <varlistentry>
3829   <term>Parameter:</term>
3830   <listitem>
3831    <para>
3832     N/A
3833    </para>
3834   </listitem>
3835  </varlistentry>
3836  
3837  <varlistentry>
3838   <term>Notes:</term>
3839   <listitem>
3840    <para>
3841     The below generic example section is actually part of <filename>default.action</filename>.
3842     It marks all URLs with well-known image file name extensions as images and should
3843     be left intact. 
3844    </para>
3845    <para>
3846     Users will probably only want to use the handle-as-image action in conjunction with
3847     <literal><link linkend="block">block</link></literal>, to block sources of banners, whose URLs don't
3848     reflect the file type, like in the second example section.
3849    </para>
3850    <para>
3851     Note that you cannot treat HTML pages as images in most cases. For instance, (inline) ad
3852     frames require an HTML page to be sent, or they won't display properly.
3853     Forcing <literal>handle-as-image</literal> in this situation will not replace the
3854     ad frame with an image, but lead to error messages.
3855    </para>
3856   </listitem>
3857  </varlistentry>
3858
3859  <varlistentry>
3860   <term>Example usage (sections):</term>
3861   <listitem>
3862    <para>
3863      <screen># Generic image extensions:
3864 #
3865 {+handle-as-image}
3866 /.*\.(gif|jpg|jpeg|png|bmp|ico)$
3867
3868 # These don't look like images, but they're banners and should be
3869 # blocked as images:
3870 #
3871 {+block +handle-as-image}
3872 some.nasty-banner-server.com/junk.cgi?output=trash
3873
3874 # Banner source! Who cares if they also have non-image content?
3875 ad.doubleclick.net 
3876 </screen>
3877    </para>
3878   </listitem>
3879  </varlistentry>
3880 </variablelist>
3881 </sect3>
3882
3883
3884 <!--   ~~~~~       New section      ~~~~~     -->
3885 <sect3 renderas="sect4" id="hide-forwarded-for-headers">
3886 <title><emphasis>hide-forwarded-for-headers</emphasis></title>
3887
3888 <variablelist>
3889  <varlistentry>
3890   <term>Typical use:</term>
3891   <listitem>
3892    <para>Improve privacy by hiding the true source of the request</para>
3893   </listitem>
3894  </varlistentry>
3895
3896  <varlistentry>
3897   <term>Effect:</term>
3898   <listitem>
3899    <para>
3900     Deletes any existing <quote>X-Forwarded-for:</quote> HTTP header from client requests,
3901     and prevents adding a new one.
3902    </para>
3903   </listitem>
3904  </varlistentry>
3905
3906  <varlistentry>
3907   <term>Type:</term>
3908   <!-- Boolean, Parameterized, Multi-value -->
3909   <listitem>
3910    <para>Boolean.</para>
3911   </listitem>
3912  </varlistentry>
3913
3914  <varlistentry>
3915   <term>Parameter:</term>
3916   <listitem>
3917    <para>
3918     N/A
3919    </para>
3920   </listitem>
3921  </varlistentry>
3922  
3923  <varlistentry>
3924   <term>Notes:</term>
3925   <listitem>
3926    <para>
3927     It is fairly safe to leave this on.
3928    </para>
3929    <para>
3930     This action is scheduled for improvement: It should be able to generate forged 
3931     <quote>X-Forwarded-for:</quote> headers using random IP addresses from a specified network,
3932     to make successive requests from the same client look like requests from a pool of different
3933     users sharing the same proxy.
3934    </para>
3935   </listitem>
3936  </varlistentry>
3937
3938  <varlistentry>
3939   <term>Example usage:</term>
3940   <listitem>
3941     <para>
3942      <screen>+hide-forwarded-for-headers</screen>
3943    </para>
3944   </listitem>
3945  </varlistentry>
3946 </variablelist>
3947 </sect3>
3948
3949
3950 <!--   ~~~~~       New section      ~~~~~     -->
3951 <sect3 renderas="sect4" id="hide-from-header">
3952 <title><emphasis>hide-from-header</emphasis></title>
3953
3954 <variablelist>
3955  <varlistentry>
3956   <term>Typical use:</term>
3957   <listitem>
3958    <para>Keep your (old and ill) browser from telling web servers your email address</para>
3959   </listitem>
3960  </varlistentry>
3961
3962  <varlistentry>
3963   <term>Effect:</term>
3964   <listitem>
3965    <para>
3966     Deletes any existing <quote>From:</quote> HTTP header, or replaces it with the
3967     specified string.
3968    </para>
3969   </listitem>
3970  </varlistentry>
3971
3972  <varlistentry>
3973   <term>Type:</term>
3974   <!-- Boolean, Parameterized, Multi-value -->
3975   <listitem>
3976    <para>Parameterized.</para>
3977   </listitem>
3978  </varlistentry>
3979
3980  <varlistentry>
3981   <term>Parameter:</term>
3982   <listitem>
3983    <para>
3984     Keyword: <quote>block</quote>, or any user defined value.
3985    </para>
3986   </listitem>
3987  </varlistentry>
3988  
3989  <varlistentry>
3990   <term>Notes:</term>
3991   <listitem>
3992    <para>
3993     The keyword <quote>block</quote> will completely remove the header 
3994     (not to be confused with the <literal><link linkend="block">block</link></literal>
3995     action).
3996    </para>
3997    <para>
3998     Alternately, you can specify any value you prefer to be sent to the web
3999     server. If you do, it is a matter of fairness not to use any address that
4000     is actually used by a real person.
4001    </para>
4002    <para>
4003     This action is rarely needed, as modern web browsers don't send
4004     <quote>From:</quote> headers anymore.
4005    </para>
4006   </listitem>
4007  </varlistentry>
4008
4009  <varlistentry>
4010   <term>Example usage:</term>
4011   <listitem>
4012    <para>
4013     <screen>+hide-from-header{block}</screen> or
4014     <screen>+hide-from-header{spam-me-senseless@sittingduck.example.com}</screen>
4015    </para>
4016   </listitem>
4017  </varlistentry>
4018 </variablelist>
4019 </sect3>
4020
4021
4022 <!--   ~~~~~       New section      ~~~~~     -->
4023 <sect3 renderas="sect4" id="hide-referrer">
4024 <title><emphasis>hide-referrer</emphasis></title>
4025 <anchor id="hide-referer">
4026 <variablelist>
4027  <varlistentry>
4028   <term>Typical use:</term>
4029   <listitem>
4030    <para>Conceal which link you followed to get to a particular site</para>
4031   </listitem>
4032  </varlistentry>
4033
4034  <varlistentry>
4035   <term>Effect:</term>
4036   <listitem>
4037    <para>
4038     Deletes the <quote>Referer:</quote> (sic) HTTP header from the client request,
4039     or replaces it with a forged one.
4040    </para>
4041   </listitem>
4042  </varlistentry>
4043
4044  <varlistentry>
4045   <term>Type:</term>
4046   <!-- Boolean, Parameterized, Multi-value -->
4047   <listitem>
4048    <para>Parameterized.</para>
4049   </listitem>
4050  </varlistentry>
4051
4052  <varlistentry>
4053   <term>Parameter:</term>
4054   <listitem>
4055    <itemizedlist>
4056     <listitem>
4057      <para><quote>block</quote> to delete the header completely.</para>
4058     </listitem>
4059     <listitem>
4060      <para><quote>forge</quote> to pretend to be coming from the homepage of the server we are talking to.</para>
4061     </listitem>
4062     <listitem>
4063      <para>Any other string to set a user defined referrer.</para>
4064     </listitem>
4065    </itemizedlist>
4066   </listitem>
4067  </varlistentry>
4068  
4069  <varlistentry>
4070   <term>Notes:</term>
4071   <listitem>
4072    <para>
4073     <quote>forge</quote> is the preferred option here, since some servers will
4074     not send images back otherwise, in an attempt to prevent their valuable
4075     content from being embedded elsewhere (and hence, without being surrounded
4076     by <emphasis>their</emphasis> banners).
4077    </para>
4078   <para>  
4079    <literal>hide-referer</literal> is an alternate spelling of
4080    <literal>hide-referrer</literal> and the two can be can be freely
4081    substituted with each other. (<quote>referrer</quote> is the
4082    correct English spelling, however the HTTP specification has a bug - it
4083    requires it to be spelled as <quote>referer</quote>.) 
4084   </para>
4085   </listitem>
4086  </varlistentry>
4087
4088  <varlistentry>
4089   <term>Example usage:</term>
4090   <listitem>
4091    <para>
4092      <screen>+hide-referrer{forge}</screen> or
4093      <screen>+hide-referrer{http://www.yahoo.com/}</screen>
4094    </para>
4095   </listitem>
4096  </varlistentry>
4097 </variablelist>
4098 </sect3>
4099
4100
4101 <!--   ~~~~~       New section      ~~~~~     -->
4102 <sect3 renderas="sect4" id="hide-user-agent">
4103 <title><emphasis>hide-user-agent</emphasis></title>
4104
4105 <variablelist>
4106  <varlistentry>
4107   <term>Typical use:</term>
4108   <listitem>
4109    <para>Conceal your type of browser and client operating system</para>
4110   </listitem>
4111  </varlistentry>
4112
4113  <varlistentry>
4114   <term>Effect:</term>
4115   <listitem>
4116    <para>
4117     Replaces the value of the <quote>User-Agent:</quote> HTTP header
4118     in client requests with the specified value.
4119    </para>
4120   </listitem>
4121  </varlistentry>
4122
4123  <varlistentry>
4124   <term>Type:</term>
4125   <!-- Boolean, Parameterized, Multi-value -->
4126   <listitem>
4127    <para>Parameterized.</para>
4128   </listitem>
4129  </varlistentry>
4130
4131  <varlistentry>
4132   <term>Parameter:</term>
4133   <listitem>
4134    <para>
4135     Any user-defined string.
4136    </para>
4137   </listitem>
4138  </varlistentry>
4139  
4140  <varlistentry>
4141   <term>Notes:</term>
4142   <listitem>
4143    <warning> 
4144     <para>
4145      This breaks many web sites that depend on looking at this header in order
4146      to customize their content for different browsers (which, by the
4147      way, is <emphasis>NOT</emphasis> a <ulink
4148      url="http://www.javascriptkit.com/javaindex.shtml">smart way to do
4149      that</ulink>!).
4150     </para>
4151    </warning>
4152    <para>
4153     Using this action in multi-user setups or wherever different types of
4154     browsers will access the same <application>Privoxy</application> is
4155     <emphasis>not recommended</emphasis>. In single-user, single-browser
4156     setups, you might use it to delete your OS version information from
4157     the headers, because it is an invitation to exploit known bugs for your
4158     OS. It is also occasionally useful to forge this in order to access 
4159     sites that won't let you in otherwise (though there may be a good 
4160     reason in some cases). Example of this: some MSN sites will not 
4161     let <application>Mozilla</application> enter, yet forging to a 
4162     <application>Netscape 6.1</application> user-agent works just fine.
4163     (Must be just a silly MS goof, I'm sure :-).
4164    </para>
4165    <para>
4166     This action is scheduled for improvement.
4167    </para>
4168    </listitem>
4169  </varlistentry>
4170
4171  <varlistentry>
4172   <term>Example usage:</term>
4173   <listitem>
4174    <para>
4175      <screen>+hide-user-agent{Netscape 6.1 (X11; I; Linux 2.4.18 i686)}</screen>
4176    </para>
4177   </listitem>
4178  </varlistentry>
4179 </variablelist>
4180 </sect3>
4181
4182
4183 <!--   ~~~~~       New section      ~~~~~     -->
4184 <sect3 renderas="sect4" id="kill-popups">
4185 <title><emphasis>kill-popups<anchor id="kill-popup"></emphasis></title>
4186
4187 <variablelist>
4188  <varlistentry>
4189   <term>Typical use:</term>
4190   <listitem>
4191    <para>Eliminate those annoying pop-up windows</para>
4192   </listitem>
4193  </varlistentry>
4194
4195  <varlistentry>
4196   <term>Effect:</term>
4197   <listitem>
4198    <para>
4199     While loading the document, replace JavaScript code that opens
4200     pop-up windows with (syntactically neutral) dummy code on the fly.
4201    </para>
4202   </listitem>
4203  </varlistentry>
4204
4205  <varlistentry>
4206   <term>Type:</term>
4207   <!-- Boolean, Parameterized, Multi-value -->
4208   <listitem>
4209    <para>Boolean.</para>
4210   </listitem>
4211  </varlistentry>
4212
4213  <varlistentry>
4214   <term>Parameter:</term>
4215   <listitem>
4216    <para>
4217     N/A
4218    </para>
4219   </listitem>
4220  </varlistentry>
4221  
4222  <varlistentry>
4223   <term>Notes:</term>
4224   <listitem>
4225    <para>
4226     This action is easily confused with the built-in, hardwired <literal><link linkend="filter">filter</link></literal>
4227     action, but there are important differences: For <literal>kill-popups</literal>,
4228     the document need not be buffered, so it can be incrementally rendered while
4229     downloading. But <literal>kill-popups</literal> doesn't catch as many pop-ups as
4230     <literal><link
4231     linkend="filter">filter</link>{<replaceable>popups</replaceable>}</literal>
4232     does. 
4233    </para>
4234    <para>
4235     Think of it as a fast and efficient replacement for a filter that you
4236     can use if you don't want any filtering at all. Note that it doesn't make
4237     sense to combine it with any <literal><link linkend="filter">filter</link></literal> action,
4238     since as soon as one <literal><link linkend="filter">filter</link></literal> applies,
4239     the whole document needs to be buffered anyway, which destroys the advantage of
4240     the <literal>kill-popups</literal> action over its filter equivalent.
4241    </para>
4242    <para>
4243     Killing all pop-ups is a dangerous business. Many shops and banks rely on
4244     pop-ups to display forms, shopping carts etc, and killing only the unwanted pop-ups 
4245     would require artificial intelligence in <application>Privoxy</application>.
4246     If the only kind of pop-ups that you want to kill are exit consoles (those
4247     <emphasis>really nasty</emphasis> windows that appear when you close an other
4248     one), you might want to use
4249     <literal><link
4250     linkend="filter">filter</link>{<replaceable>js-annoyances</replaceable>}</literal>
4251     instead. 
4252    </para>
4253
4254   <!-- 
4255    <para>
4256     An alternate spelling is <literal>+kill-popup</literal>, which is 
4257     interchangeable.
4258    </para>
4259  --> 
4260   </listitem>
4261  </varlistentry>
4262
4263  <varlistentry>
4264   <term>Example usage:</term>
4265   <listitem>
4266    <para><screen>+kill-popups</screen></para>
4267   </listitem>
4268  </varlistentry>
4269 </variablelist>
4270 </sect3>
4271
4272
4273 <!--   ~~~~~       New section      ~~~~~     -->
4274 <sect3 renderas="sect4" id="limit-connect">
4275 <title><emphasis>limit-connect</emphasis></title>
4276
4277 <variablelist>
4278  <varlistentry>
4279   <term>Typical use:</term>
4280   <listitem>
4281    <para>Prevent abuse of <application>Privoxy</application> as a TCP proxy relay</para>
4282   </listitem>
4283  </varlistentry>
4284
4285  <varlistentry>
4286   <term>Effect:</term>
4287   <listitem>
4288    <para>
4289     Specifies to which ports HTTP CONNECT requests are allowable.
4290    </para>
4291   </listitem>
4292  </varlistentry>
4293
4294  <varlistentry>
4295   <term>Type:</term>
4296   <!-- Boolean, Parameterized, Multi-value -->
4297   <listitem>
4298    <para>Parameterized.</para>
4299   </listitem>
4300  </varlistentry>
4301
4302  <varlistentry>
4303   <term>Parameter:</term>
4304   <listitem>
4305    <para>
4306     A comma-separated list of ports or port ranges (the latter using dashes, with the minimum
4307     defaulting to 0 and the maximum to 65K).
4308    </para>
4309   </listitem>
4310  </varlistentry>
4311  
4312  <varlistentry>
4313   <term>Notes:</term>
4314   <listitem>
4315    <para>
4316     By default, i.e. if no <literal>limit-connect</literal> action applies,
4317     <application>Privoxy</application> only allows HTTP CONNECT
4318     requests to port 443 (the standard, secure HTTPS port). Use 
4319     <literal>limit-connect</literal> if more fine-grained control is desired
4320     for some or all destinations.
4321    </para>
4322    <para>
4323     The CONNECT methods exists in HTTP to allow access to secure websites
4324     (<quote>https://</quote> URLs) through proxies. It works very simply:
4325     the proxy connects to the server on the specified port, and then
4326     short-circuits its connections to the client and to the remote server.
4327     This can be a big security hole, since CONNECT-enabled proxies can be
4328     abused as TCP relays very easily.
4329   </para>
4330   <para>
4331    If you don't know what any of this means, there probably is no reason to 
4332    change this one, since the default is already very restrictive.
4333   </para>
4334   </listitem>
4335  </varlistentry>
4336
4337  <varlistentry>
4338   <term>Example usages:</term>
4339   <listitem>
4340    <!-- I had trouble getting the spacing to look right in my browser -->
4341    <!-- I probably have the wrong font setup, bollocks. -->
4342    <!-- Apparently the emphasis tag uses a proportional font no matter what -->
4343     <para>
4344      <screen>+limit-connect{443}                   # This is the default and need not be specified.
4345 +limit-connect{80,443}                # Ports 80 and 443 are OK.
4346 +limit-connect{-3, 7, 20-100, 500-}   # Ports less than 3, 7, 20 to 100 and above 500 are OK.
4347 +limit-connect{-}                     # All ports are OK (gaping security hole!)</screen>
4348    </para>
4349   </listitem>
4350  </varlistentry>
4351 </variablelist>
4352 </sect3>
4353
4354 <!--   ~~~~~       New section      ~~~~~     -->
4355 <sect3 renderas="sect4" id="prevent-compression">
4356 <title><emphasis>prevent-compression</emphasis></title>
4357
4358 <variablelist>
4359  <varlistentry>
4360   <term>Typical use:</term>
4361   <listitem>
4362    <para>
4363     Ensure that servers send the content uncompressed, so it can be
4364     passed through <literal><link linkend="filter">filter</link></literal>s
4365    </para>
4366   </listitem>
4367  </varlistentry>
4368
4369  <varlistentry>
4370   <term>Effect:</term>
4371   <listitem>
4372    <para>
4373     Adds a header to the request that asks for uncompressed transfer.
4374    </para>
4375   </listitem>
4376  </varlistentry>
4377
4378  <varlistentry>
4379   <term>Type:</term>
4380   <!-- Boolean, Parameterized, Multi-value -->
4381   <listitem>
4382    <para>Boolean.</para>
4383   </listitem>
4384  </varlistentry>
4385
4386  <varlistentry>
4387   <term>Parameter:</term>
4388   <listitem>
4389    <para>
4390     N/A
4391    </para>
4392   </listitem>
4393  </varlistentry>
4394  
4395  <varlistentry>
4396   <term>Notes:</term>
4397   <listitem>
4398    <para>
4399     More and more websites send their content compressed by default, which
4400     is generally a good idea and saves bandwidth. But for the <literal><link
4401     linkend="filter">filter</link></literal>, <literal><link linkend="deanimate-gifs">deanimate-gifs</link></literal>
4402     and <literal><link linkend="kill-popups">kill-popups</link></literal> actions to work,
4403     <application>Privoxy</application> needs access to the  uncompressed data.
4404     Unfortunately, <application>Privoxy</application> can't yet(!)  uncompress, filter, and
4405     re-compress the content on the fly. So if you want to ensure that all websites, including
4406     those that normally compress, can be filtered, you need to use this action.
4407    </para>
4408    <para>
4409     This will slow down transfers from those websites, though. If you use any of the above-mentioned
4410     actions, you will typically want to use <literal>prevent-compression</literal> in conjunction
4411     with them.
4412    </para>
4413    <para>
4414     Note that some (rare) ill-configured sites don't handle requests for uncompressed
4415     documents correctly (they send an empty document body). If you use <literal>prevent-compression</literal>
4416     per default, you'll have to add exceptions for those sites. See the example for how to do that.
4417    </para>
4418   </listitem>
4419  </varlistentry>
4420
4421  <varlistentry>
4422   <term>Example usage (sections):</term>
4423   <listitem>
4424    <para>
4425     <screen># Set default:
4426 #
4427 {+prevent-compression}
4428 / # Match all sites
4429
4430 # Make exceptions for ill sites:
4431 #
4432 {-prevent-compression}
4433 www.debianhelp.org
4434 www.pclinuxonline.com</screen>
4435    </para>
4436   </listitem>
4437  </varlistentry>
4438
4439 </variablelist>
4440 </sect3>
4441
4442
4443 <!--   ~~~~~       New section      ~~~~~     -->
4444 <sect3 renderas="sect4" id="send-vanilla-wafer">
4445 <title><emphasis>send-vanilla-wafer</emphasis></title>
4446
4447 <variablelist>
4448  <varlistentry>
4449   <term>Typical use:</term>
4450   <listitem>
4451    <para>
4452     Feed log analysis scripts with useless data.
4453    </para>
4454   </listitem>
4455  </varlistentry>
4456
4457  <varlistentry>
4458   <term>Effect:</term>
4459   <listitem>
4460    <para>
4461     Sends a cookie with each request stating that you do not accept any copyright
4462     on cookies sent to you, and asking the site operator not to track you.
4463    </para>
4464   </listitem>
4465  </varlistentry>
4466
4467  <varlistentry>
4468   <term>Type:</term>
4469   <!-- Boolean, Parameterized, Multi-value -->
4470   <listitem>
4471    <para>Boolean.</para>
4472   </listitem>
4473  </varlistentry>
4474
4475  <varlistentry>
4476   <term>Parameter:</term>
4477   <listitem>
4478    <para>
4479     N/A
4480    </para>
4481   </listitem>
4482  </varlistentry>
4483  
4484  <varlistentry>
4485   <term>Notes:</term>
4486   <listitem>
4487    <para>
4488     The vanilla wafer is a (relatively) unique header and could conceivably be used to track you.
4489    </para>
4490    <para>
4491     This action is rarely used and not enabled in the default configuration.
4492    </para>
4493   </listitem>
4494  </varlistentry>
4495
4496  <varlistentry>
4497   <term>Example usage:</term>
4498   <listitem>
4499    <para>
4500      <screen>+send-vanilla-wafer</screen>
4501    </para>
4502   </listitem>
4503  </varlistentry>
4504
4505 </variablelist>
4506 </sect3>
4507
4508
4509 <!--   ~~~~~       New section      ~~~~~     -->
4510 <sect3 renderas="sect4" id="send-wafer">
4511 <title><emphasis>send-wafer</emphasis></title>
4512
4513 <variablelist>
4514  <varlistentry>
4515   <term>Typical use:</term>
4516   <listitem>
4517    <para>
4518     Send custom cookies or feed log analysis scripts with even more useless data.
4519    </para>
4520   </listitem>
4521  </varlistentry>
4522
4523  <varlistentry>
4524   <term>Effect:</term>
4525   <listitem>
4526    <para>
4527     Sends a custom, user-defined cookie with each request.
4528    </para>
4529   </listitem>
4530  </varlistentry>
4531
4532  <varlistentry>
4533   <term>Type:</term>
4534   <!-- Boolean, Parameterized, Multi-value -->
4535   <listitem>
4536    <para>Multi-value.</para>
4537   </listitem>
4538  </varlistentry>
4539
4540  <varlistentry>
4541   <term>Parameter:</term>
4542   <listitem>
4543    <para>
4544     A string of the form <quote><replaceable class="option">name</replaceable>=<replaceable
4545     class="parameter">value</replaceable></quote>.
4546    </para>
4547   </listitem>
4548  </varlistentry>
4549  
4550  <varlistentry>
4551   <term>Notes:</term>
4552   <listitem>
4553    <para>
4554     Being multi-valued, multiple instances of this action can apply to the same request,
4555     resulting in multiple cookies being sent.
4556    </para>
4557    <para>
4558     This action is rarely used and not enabled in the default configuration.
4559    </para>
4560   </listitem>
4561  </varlistentry>
4562  <varlistentry>
4563   <term>Example usage (section):</term>
4564   <listitem>
4565    <para>
4566     <screen>{+send-wafer{UsingPrivoxy=true}}
4567 my-internal-testing-server.void</screen>
4568    </para>
4569   </listitem>
4570  </varlistentry>
4571 </variablelist>
4572 </sect3>
4573
4574
4575 <!--   ~~~~~       New section      ~~~~~     -->
4576 <sect3 renderas="sect4" id="session-cookies-only">
4577 <title><emphasis>session-cookies-only</emphasis></title>
4578
4579 <variablelist>
4580  <varlistentry>
4581   <term>Typical use:</term>
4582   <listitem>
4583    <para>
4584     Allow only temporary <quote>session</quote> cookies (for the current browser session <emphasis>only</emphasis>).
4585    </para>
4586   </listitem>
4587  </varlistentry>
4588
4589  <varlistentry>
4590   <term>Effect:</term>
4591   <listitem>
4592    <para>
4593     Deletes the <quote>expires</quote> field from <quote>Set-Cookie:</quote> server headers.
4594     Most browsers will not store such cookies permanently and forget them in between sessions.
4595    </para>
4596   </listitem>
4597  </varlistentry>
4598
4599 <varlistentry>
4600   <term>Type:</term>
4601   <!-- Boolean, Parameterized, Multi-value -->
4602   <listitem>
4603    <para>Boolean.</para>
4604   </listitem>
4605  </varlistentry>
4606
4607  <varlistentry>
4608   <term>Parameter:</term>
4609   <listitem>
4610    <para>
4611     N/A
4612    </para>
4613   </listitem>
4614  </varlistentry>
4615  
4616  <varlistentry>
4617   <term>Notes:</term>
4618   <listitem>
4619    <para>
4620     This is less strict than <literal><link linkend="crunch-incoming-cookies">crunch-incoming-cookies</link></literal> / 
4621     <literal><link linkend="crunch-outgoing-cookies">crunch-outgoing-cookies</link></literal> and allows you to browse
4622     websites that insist or rely on setting cookies, without compromising your privacy too badly.
4623    </para>
4624    <para>
4625     Most browsers will not permanently store cookies that have been processed by
4626     <literal>session-cookies-only</literal> and will forget about them between sessions.
4627     This makes profiling cookies useless, but won't break sites which require cookies so
4628     that you can log in for transactions. This is generally turned on for all 
4629     sites, and is the recommended setting.
4630    </para>
4631    <para>
4632     It makes <emphasis>no sense at all</emphasis> to use <literal>session-cookies-only</literal>
4633     together with <literal><link linkend="crunch-incoming-cookies">crunch-incoming-cookies</link></literal> or
4634     <literal><link linkend="crunch-outgoing-cookies">crunch-outgoing-cookies</link></literal>. If you do, cookies
4635     will be plainly killed.
4636    </para>
4637    <para>
4638     Note that it is up to the browser how it handles such cookies without an <quote>expires</quote>
4639     field. If you use an exotic browser, you might want to try it out to be sure.
4640    </para>
4641   </listitem>
4642  </varlistentry>
4643
4644  <varlistentry>
4645   <term>Example usage:</term>
4646   <listitem>
4647    <para>
4648      <screen>+session-cookies-only</screen>
4649    </para>
4650   </listitem>
4651  </varlistentry>
4652 </variablelist>
4653 </sect3>
4654
4655
4656 <!--   ~~~~~       New section      ~~~~~     -->
4657 <sect3 renderas="sect4" id="set-image-blocker">
4658 <title><emphasis>set-image-blocker</emphasis></title>
4659
4660 <variablelist>
4661  <varlistentry>
4662   <term>Typical use:</term>
4663   <listitem>
4664    <para>Choose the replacement for blocked images</para>
4665   </listitem>
4666  </varlistentry>
4667
4668  <varlistentry>
4669   <term>Effect:</term>
4670   <listitem>
4671    <para>
4672      This action alone doesn't do anything noticeable. If <emphasis>both</emphasis>
4673      <literal><link linkend="block">block</link></literal> <emphasis>and</emphasis> <literal><link
4674      linkend="handle-as-image">handle-as-image</link></literal> <emphasis>also</emphasis>
4675      apply, i.e. if the request is to be blocked as an image,
4676      <emphasis>then</emphasis> the parameter of this action decides what will be
4677      sent as a replacement.
4678    </para>
4679   </listitem>
4680  </varlistentry>
4681
4682  <varlistentry>
4683   <term>Type:</term>
4684   <!-- Boolean, Parameterized, Multi-value -->
4685   <listitem>
4686    <para>Parameterized.</para>
4687   </listitem>
4688  </varlistentry>
4689
4690  <varlistentry>
4691   <term>Parameter:</term>
4692   <listitem>
4693    <itemizedlist>
4694     <listitem>
4695      <para>
4696       <quote>pattern</quote> to send a built-in checkerboard pattern image. The image is visually
4697       decent, scales very well, and makes it obvious where banners were busted.
4698      </para>
4699     </listitem>
4700     <listitem>
4701      <para>
4702       <quote>blank</quote> to send a built-in transparent image. This makes banners disappear
4703       completely, but makes it hard to detect where <application>Privoxy</application> has blocked
4704       images on a given page and complicates troubleshooting if <application>Privoxy</application>
4705       has blocked innocent images, like navigation icons.
4706      </para>
4707     </listitem>
4708     <listitem>
4709      <para>
4710       <quote><replaceable class="parameter">target-url</replaceable></quote> to
4711       send a redirect to <replaceable class="parameter">target-url</replaceable>. You can redirect
4712       to any image anywhere, even in your local filesystem (via <quote>file:///</quote> URL).
4713      </para>
4714      <para>
4715       A good application of redirects is to use special <application>Privoxy</application>-built-in
4716       URLs, which send the built-in images, as <replaceable class="parameter">target-url</replaceable>.
4717       This has the same visual effect as specifying <quote>blank</quote> or <quote>pattern</quote> in
4718       the first place, but enables your browser to cache the replacement image, instead of requesting
4719       it over and over again.
4720      </para>
4721     </listitem>
4722    </itemizedlist>
4723   </listitem>
4724  </varlistentry>
4725
4726  <varlistentry>
4727   <term>Notes:</term>
4728   <listitem>
4729    <para>
4730     The URLs for the built-in images are <quote>http://config.privoxy.org/send-banner?type=<replaceable
4731     class="parameter">type</replaceable></quote>, where <replaceable class="parameter">type</replaceable> is
4732     either <quote>blank</quote> or <quote>pattern</quote>.
4733    </para>
4734    <para>
4735     There is a third (advanced) type, called <quote>auto</quote>. It is <emphasis>NOT</emphasis> to be
4736     used in <literal>set-image-blocker</literal>, but meant for use from <link linkend="filter-file">filters</link>.
4737     Auto will select the type of image that would have applied to the referring page, had it been an image.
4738    </para>
4739   </listitem>
4740  </varlistentry>
4741
4742  <varlistentry>
4743   <term>Example usage:</term>
4744   <listitem>
4745    <para>
4746     Built-in pattern:
4747    </para>
4748    <para>
4749     <screen>+set-image-blocker{pattern}</screen>
4750    </para>
4751    <para>
4752     Redirect to the BSD devil:
4753    </para>
4754    <para>
4755     <screen>+set-image-blocker{http://www.freebsd.org/gifs/dae_up3.gif}</screen>
4756    </para>
4757    <para>
4758     Redirect to the built-in pattern for better caching:
4759    </para>
4760    <para>
4761     <screen>+set-image-blocker{http://config.privoxy.org/send-banner?type=pattern}</screen>
4762    </para>
4763   </listitem>
4764  </varlistentry>
4765 </variablelist>
4766 </sect3>
4767
4768
4769 <!--   ~~~~~       New section      ~~~~~     -->
4770 <sect3>
4771 <title>Summary</title>
4772 <para>
4773  Note that many of these actions have the potential to cause a page to
4774  misbehave, possibly even not to display at all. There are many ways 
4775  a site designer may choose to design his site, and what HTTP header 
4776  content, and other criteria, he may depend on. There is no way to have hard
4777  and fast rules for all sites. See the <link
4778  linkend="ACTIONSANAT">Appendix</link> for a brief example on troubleshooting
4779  actions.
4780 </para>
4781 </sect3>
4782 </sect2>
4783
4784 <!--   ~~~~~       New section      ~~~~~     -->
4785 <sect2 id="aliases">
4786 <title>Aliases</title>
4787 <para>
4788  Custom <quote>actions</quote>, known to <application>Privoxy</application>
4789  as <quote>aliases</quote>, can be defined by combining other actions.
4790  These can in turn be invoked just like the built-in actions.
4791  Currently, an alias name can contain any character except space, tab,
4792  <quote>=</quote>,
4793  <quote>{</quote> and <quote>}</quote>, but we <emphasis>strongly 
4794  recommend</emphasis> that you only use <quote>a</quote> to <quote>z</quote>,
4795  <quote>0</quote> to <quote>9</quote>, <quote>+</quote>, and <quote>-</quote>.
4796  Alias names are not case sensitive, and are not required to start with a
4797  <quote>+</quote> or <quote>-</quote> sign, since they are merely textually
4798  expanded.
4799 </para>
4800 <para>
4801  Aliases can be used throughout the actions file, but they <emphasis>must be
4802  defined in a special section at the top of the file!</emphasis>
4803  And there can only be one such section per actions file. Each actions file may
4804  have its own alias section, and the aliases defined in it are only visible
4805  within that file.
4806 </para>
4807 <para>
4808  There are two main reasons to use aliases: One is to save typing for frequently
4809  used combinations of actions, the other one is a gain in flexibility: If you
4810  decide once how you want to handle shops by defining an alias called
4811  <quote>shop</quote>, you can later change your policy on shops in
4812  <emphasis>one</emphasis> place, and your changes will take effect everywhere
4813  in the actions file where the <quote>shop</quote> alias is used. Calling aliases
4814  by their purpose also makes your actions files more readable.
4815 </para>
4816 <para>
4817  Currently, there is one big drawback to using aliases, though:
4818  <application>Privoxy</application>'s built-in web-based action file
4819  editor honors aliases when reading the actions files, but it expands
4820  them before writing. So the effects of your aliases are of course preserved,
4821  but the aliases themselves are lost when you edit sections that use aliases
4822  with it.
4823  This is likely to change in future versions of <application>Privoxy</application>.
4824 </para>
4825
4826 <para>
4827  Now let's define some aliases...
4828 </para>
4829
4830 <para>
4831  <screen>
4832  # Useful custom aliases we can use later.
4833  #
4834  # Note the (required!) section header line and that this section
4835  # must be at the top of the actions file!
4836  #
4837  {{alias}}
4838
4839  # These aliases just save typing later:
4840  # (Note that some already use other aliases!)
4841  #
4842  +crunch-all-cookies = +crunch-incoming-cookies +crunch-outgoing-cookies
4843  -crunch-all-cookies = -crunch-incoming-cookies -crunch-outgoing-cookies
4844  block-as-image      = +block +handle-as-image
4845  mercy-for-cookies   = -crunch-all-cookies -session-cookies-only
4846
4847  # These aliases define combinations of actions
4848  # that are useful for certain types of sites:
4849  #
4850  fragile     = -block -crunch-all-cookies -filter -fast-redirects -hide-referer -kill-popups
4851  shop        = -crunch-all-cookies -filter{popups} -kill-popups
4852
4853  # Short names for other aliases, for really lazy people ;-)
4854  #
4855  c0 = +crunch-all-cookies
4856  c1 = -crunch-all-cookies</screen>
4857 </para>
4858
4859 <para>
4860  ...and put them to use. These sections would appear in the lower part of an 
4861  actions file and define exceptions to the default actions (as specified further
4862  up for the <quote>/</quote> pattern):
4863 </para>
4864
4865 <para>
4866  <screen>
4867  # These sites are either very complex or very keen on
4868  # user data and require minimal interference to work:
4869  #
4870  {fragile}
4871  .office.microsoft.com
4872  .windowsupdate.microsoft.com
4873  .nytimes.com
4874
4875  # Shopping sites:
4876  # Allow cookies (for setting and retrieving your customer data)
4877  #           
4878  {shop}
4879  .quietpc.com
4880  .worldpay.com   # for quietpc.com
4881  .scan.co.uk
4882
4883  # These shops require pop-ups:
4884  #
4885  {shop -kill-popups -filter{popups}}
4886   .dabs.com
4887   .overclockers.co.uk</screen>
4888 </para>
4889
4890 <para>
4891  Aliases like <quote>shop</quote> and <quote>fragile</quote> are often used for 
4892  <quote>problem</quote> sites that require some actions to be disabled 
4893  in order to function properly.
4894 </para>
4895 </sect2>
4896
4897 <!--   ~~~~~       New section      ~~~~~     -->
4898 <sect2 id="act-examples">
4899 <title>Actions Files Tutorial</title>
4900 <para>
4901  The above chapters have shown <link linkend="actions-file">which actions files
4902  there are and how they are organized</link>, how actions are <link
4903  linkend="actions">specified</link> and <link linkend="actions-apply">applied
4904  to URLs</link>, how <link linkend="af-patterns">patterns</link> work, and how to
4905  define and use <link linkend="aliases">aliases</link>. Now, let's look at an
4906  example <filename>default.action</filename> and <filename>user.action</filename>
4907  file and see how all these pieces come together:
4908 </para>
4909
4910 <sect3><title>default.action</title>
4911
4912 <para>
4913 Every config file should start with a short comment stating its purpose:
4914 </para>
4915
4916 <para>
4917  <screen># Sample default.action file &lt;developers@privoxy.org&gt;</screen>
4918 </para>
4919
4920 <para>
4921 Then, since this is the <filename>default.action</filename> file, the
4922 first section is a special section for internal use that you needn't
4923 change or worry about:
4924 </para>
4925
4926 <para>
4927  <screen>
4928 ##########################################################################
4929 # Settings -- Don't change! For internal Privoxy use ONLY.
4930 ##########################################################################
4931
4932 {{settings}}
4933 for-privoxy-version=3.0</screen>
4934 </para>
4935
4936 <para>
4937 After that comes the (optional) alias section. We'll use the example
4938 section from the above <link linkend="aliases">chapter on aliases</link>,
4939 that also explains why and how aliases are used:
4940 </para>
4941
4942 <para>
4943  <screen>
4944 ##########################################################################
4945 # Aliases
4946 ##########################################################################
4947 {{alias}}
4948
4949 # These aliases just save typing later:
4950 # (Note that some already use other aliases!)
4951 #
4952 +crunch-all-cookies = +crunch-incoming-cookies +crunch-outgoing-cookies
4953 -crunch-all-cookies = -crunch-incoming-cookies -crunch-outgoing-cookies
4954 block-as-image      = +block +handle-as-image
4955 mercy-for-cookies   = -crunch-all-cookies -session-cookies-only
4956
4957 # These aliases define combinations of actions
4958 # that are useful for certain types of sites:
4959 #
4960 fragile     = -block -crunch-all-cookies -filter -fast-redirects -hide-referer -kill-popups
4961 shop        = mercy-for-cookies -filter{popups} -kill-popups</screen>
4962 </para>
4963
4964 <para>
4965  Now come the regular sections, i.e. sets of actions, accompanied
4966  by URL patterns to which they apply. Remember <emphasis>all actions
4967  are disabled when matching starts</emphasis>, so we have to explicitly
4968  enable the ones we want.
4969 </para>
4970
4971 <para>
4972  The first regular section is probably the most important. It has only
4973  one pattern, <quote><literal>/</literal></quote>, but this pattern
4974  <link linkend="af-patterns">matches all URLs.</link>. Therefore, the
4975  set of actions used in this <quote>default</quote> section <emphasis>will
4976  be applied to all requests as a start</emphasis>. It can  be partly or
4977  wholly overridden by later matches further down this file, or in user.action,
4978  but it will still be largely responsible for your overall browsing
4979  experience.
4980 </para>
4981
4982 <para>
4983  Again, at the start of matching, all actions are disabled, so there is
4984  no real need to disable any actions here, but we will do that nonetheless,
4985  to have a complete listing for your reference. (Remember: A <quote>+</quote>
4986  preceding the action name enables the action, a <quote>-</quote> disables!).
4987  Also note how this long line has been made more readable by splitting it into
4988  multiple lines with line continuation.
4989 </para> 
4990
4991 <para>
4992  <screen>
4993 ##########################################################################
4994 # "Defaults" section:
4995 ##########################################################################
4996  { \
4997  -<link linkend="ADD-HEADER">add-header</link> \
4998  -<link linkend="BLOCK">block</link> \
4999  -<link linkend="CRUNCH-INCOMING-COOKIES">crunch-incoming-cookies</link> \
5000  -<link linkend="CRUNCH-OUTGOING-COOKIES">crunch-outgoing-cookies</link> \
5001  +<link linkend="DEANIMATE-GIFS">deanimate-gifs</link> \
5002  -<link linkend="DOWNGRADE-HTTP-VERSION">downgrade-http-version</link> \
5003  +<link linkend="FAST-REDIRECTS">fast-redirects</link> \
5004  +<link linkend="FILTER-HTML-ANNOYANCES">filter{html-annoyances}</link> \
5005  +<link linkend="FILTER-JS-ANNOYANCES">filter{js-annoyances}</link> \
5006  -<link linkend="FILTER-CONTENT-COOKIES">filter{content-cookies}</link> \
5007  +<link linkend="FILTER-POPUPS">filter{popups}</link> \
5008  +<link linkend="FILTER-WEBBUGS">filter{webbugs}</link> \
5009  -<link linkend="FILTER-REFRESH-TAGS">filter{refresh-tags}</link> \
5010  -<link linkend="FILTER-FUN">filter{fun}</link> \
5011  +<link linkend="FILTER-NIMDA">filter{nimda}</link> \
5012  +<link linkend="FILTER-BANNERS-BY-SIZE">filter{banners-by-size}</link> \
5013  -<link linkend="FILTER-SHOCKWAVE-FLASH">filter{shockwave-flash}</link> \
5014  -<link linkend="FILTER-CRUDE-PARENTAL">filter{crude-parental}</link> \
5015  -<link linkend="HANDLE-AS-IMAGE">handle-as-image</link> \
5016  +<link linkend="HIDE-FORWARDED-FOR-HEADERS">hide-forwarded-for-headers</link> \
5017  +<link linkend="HIDE-FROM-HEADER">hide-from-header{block}</link> \
5018  +<link linkend="HIDE-REFERER">hide-referrer{forge}</link> \
5019  -<link linkend="HIDE-USER-AGENT">hide-user-agent</link> \
5020  -<link linkend="KILL-POPUPS">kill-popups</link> \
5021  -<link linkend="LIMIT-CONNECT">limit-connect</link> \
5022  +<link linkend="PREVENT-COMPRESSION">prevent-compression</link> \
5023  -<link linkend="SEND-VANILLA-WAFER">send-vanilla-wafer</link> \
5024  -<link linkend="SEND-WAFER">send-wafer</link> \
5025  +<link linkend="SESSION-COOKIES-ONLY">session-cookies-only</link> \
5026  +<link linkend="SET-IMAGE-BLOCKER">set-image-blocker{pattern}</link> \
5027  }
5028  / # forward slash will match *all* potential URL patterns.</screen>
5029 </para>
5030
5031 <para>
5032  The default behavior is now set. Note that some actions, like not hiding
5033  the user agent, are part of a <quote>general policy</quote> that applies
5034  universally and won't get any exceptions defined later. Other choices,
5035  like not blocking (which is <emphasis>understandably</emphasis> the
5036  default!) need exceptions, i.e. we need to specify explicitly what we
5037  want to block in later sections.
5038  We will also want to make exceptions from our general pop-up-killing,
5039  and use our defined aliases for that.
5040 </para>
5041
5042 <para>
5043  The first of our specialized sections is concerned with <quote>fragile</quote>
5044  sites, i.e. sites that require minimum interference, because they are either
5045  very complex or very keen on tracking you (and have mechanisms in place that
5046  make them unusable for people who avoid being tracked). We will simply use
5047  our pre-defined <literal>fragile</literal> alias instead of stating the list
5048  of actions explicitly:
5049 </para>
5050
5051 <para>
5052  <screen>
5053 ##########################################################################
5054 # Exceptions for sites that'll break under the default action set:
5055 ##########################################################################
5056
5057 # "Fragile" Use a minimum set of actions for these sites (see alias above):
5058 #
5059 { fragile }
5060 .office.microsoft.com           # surprise, surprise!
5061 .windowsupdate.microsoft.com</screen>
5062 </para>
5063
5064 <para>
5065  Shopping sites are not as fragile, but they typically
5066  require cookies to log in, and pop-up windows for shopping
5067  carts or item details. Again, we'll use a pre-defined alias:
5068 </para>
5069  
5070 <para>
5071  <screen>
5072 # Shopping sites:
5073 #
5074 { shop }
5075 .quietpc.com 
5076 .worldpay.com   # for quietpc.com
5077 .jungle.com
5078 .scan.co.uk</screen>
5079 </para>
5080
5081 <para>
5082  Then, there are sites which rely on pop-up windows (yuck!) to work.
5083  Since we made pop-up-killing our default above, we need to make exceptions
5084  now. <ulink url="http://www.mozilla.org/">Mozilla</ulink> users, who
5085  can turn on smart handling of unwanted pop-ups in their browsers, can
5086  safely choose
5087  -<literal><link linkend="FILTER-POPUPS">filter{popups}</link></literal> (and
5088  -<literal><link linkend="KILL-POPUPS">kill-popups</link></literal>) above
5089  and hence don't need this section. Anyway, disabling an already disabled
5090  action doesn't hurt, so we'll define our exceptions regardless of what was
5091  chosen in the defaults section:
5092 </para>
5093
5094 <para>
5095  <screen>
5096 # These sites require pop-ups too :( 
5097 #
5098 { -<link linkend="KILL-POPUPS">kill-popups</link> -<link linkend="FILTER-POPUPS">filter{popups}</link> }
5099 .dabs.com
5100 .overclockers.co.uk
5101 .deutsche-bank-24.de</screen>
5102 </para>
5103
5104 <para>
5105  The <literal><link linkend="FAST-REDIRECTS">fast-redirects</link></literal>
5106  action, which we enabled per default above,  breaks some sites. So disable
5107  it for popular sites where we know it misbehaves:
5108 </para>
5109
5110 <para>
5111  <screen>
5112 { -<link linkend="FAST-REDIRECTS">fast-redirects</link> }
5113 login.yahoo.com
5114 edit.*.yahoo.com
5115 .google.com
5116 .altavista.com/.*(like|url|link):http
5117 .altavista.com/trans.*urltext=http
5118 .nytimes.com</screen>
5119 </para>
5120
5121 <para>
5122  It is important that <application>Privoxy</application> knows which
5123  URLs belong to images, so that <emphasis>if</emphasis> they are to
5124  be blocked, a substitute image can be sent, rather than an HTML page.
5125  Contacting the remote site to find out is not an option, since it
5126  would destroy the loading time advantage of banner blocking, and it
5127  would feed the advertisers (in terms of money <emphasis>and</emphasis>
5128  information). We can mark any URL as an image with the <literal><link
5129  linkend="handle-as-image">handle-as-image</link></literal> action,
5130  and marking all URLs that end in a known image file extension is a
5131  good start:
5132 </para>
5133
5134 <para>
5135  <screen>
5136 ##########################################################################
5137 # Images:
5138 ##########################################################################
5139
5140 # Define which file types will be treated as images, in case they get
5141 # blocked further down this file:
5142 #
5143 { +<link linkend="HANDLE-AS-IMAGE">handle-as-image</link> }
5144 /.*\.(gif|jpe?g|png|bmp|ico)$</screen>
5145 </para>
5146
5147 <para>
5148  And then there are known banner sources. They often use scripts to
5149  generate the banners, so it won't be visible from the URL that the
5150  request is for an image. Hence we block them <emphasis>and</emphasis>
5151  mark them as images in one go, with the help of our
5152  <literal>block-as-image</literal> alias defined above. (We could of
5153  course just as well use <literal>+<link linkend="block">block</link>
5154  +<link linkend="handle-as-image">handle-as-image</link></literal> here.)
5155  Remember that the type of the replacement image is chosen by the
5156  <literal><link linkend="set-image-blocker">set-image-blocker</link></literal>
5157  action. Since all URLs have matched the default section with its
5158  <literal>+<link linkend="set-image-blocker">set-image-blocker</link>{pattern}</literal>
5159  action before, it still applies and needn't be repeated:
5160 </para>
5161
5162 <para>
5163  <screen>
5164 # Known ad generators:
5165 #
5166 { block-as-image }
5167 ar.atwola.com 
5168 .ad.doubleclick.net
5169 .ad.*.doubleclick.net
5170 .a.yimg.com/(?:(?!/i/).)*$
5171 .a[0-9].yimg.com/(?:(?!/i/).)*$
5172 bs*.gsanet.com
5173 bs*.einets.com
5174 .qkimg.net</screen>
5175 </para>
5176
5177 <para>
5178  One of the most important jobs of <application>Privoxy</application>
5179  is to block banners. A huge bunch of them are already <quote>blocked</quote>
5180  by the <literal><link linkend="filter">filter</link>{banners-by-size}</literal>
5181  action, which we enabled above, and which deletes the references to banner
5182  images from the pages while they are loaded, so the browser doesn't request
5183  them anymore, and hence they don't need to be blocked here. But this naturally
5184  doesn't catch all banners, and some people choose not to use filters, so we
5185  need a comprehensive list of patterns for banner URLs here, and apply the
5186  <literal><link linkend="block">block</link></literal> action to them.
5187 </para>
5188 <para>
5189  First comes a bunch of generic patterns, which do most of the work, by
5190  matching typical domain and path name components of banners. Then comes
5191  a list of individual patterns for specific sites, which is omitted here
5192  to keep the example short:
5193 </para>
5194
5195 <para>
5196  <screen>
5197 ##########################################################################
5198 # Block these fine banners:
5199 ##########################################################################
5200 { <link linkend="BLOCK">+block</link> }
5201
5202 # Generic patterns:
5203
5204 ad*.
5205 .*ads.
5206 banner?.
5207 count*.
5208 /.*count(er)?\.(pl|cgi|exe|dll|asp|php[34]?)
5209 /(?:.*/)?(publicite|werbung|rekla(ma|me|am)|annonse|maino(kset|nta|s)?)/
5210
5211 # Site-specific patterns (abbreviated):
5212 #
5213 .hitbox.com</screen>
5214 </para>
5215
5216 <para>
5217  You wouldn't believe how many advertisers actually call their banner
5218  servers ads.<replaceable>company</replaceable>.com, or call the directory
5219  in which the banners are stored simply <quote>banners</quote>. So the above
5220  generic patterns are surprisingly effective.
5221 </para>
5222 <para>
5223  But being very generic, they necessarily also catch URLs that we don't want
5224  to block. The pattern <literal>.*ads.</literal> e.g. catches 
5225  <quote>nasty-<emphasis>ads</emphasis>.nasty-corp.com</quote> as intended,
5226  but also <quote>downlo<emphasis>ads</emphasis>.sourcefroge.net</quote> or
5227  <quote><emphasis>ads</emphasis>l.some-provider.net.</quote> So here come some
5228  well-known exceptions to the <literal>+<link linkend="BLOCK">block</link></literal>
5229  section above.
5230 </para>
5231 <para>
5232  Note that these are exceptions to exceptions from the default! Consider the URL
5233  <quote>downloads.sourcefroge.net</quote>: Initially, all actions are deactivated,
5234  so it wouldn't get blocked. Then comes the defaults section, which matches the
5235  URL, but just deactivates the <literal><link linkend="BLOCK">block</link></literal>
5236  action once again. Then it matches <literal>.*ads.</literal>, an exception to the
5237  general non-blocking policy, and suddenly
5238  <literal><link linkend="BLOCK">+block</link></literal> applies. And now, it'll match
5239  <literal>.*loads.</literal>, where <literal><link linkend="BLOCK">-block</link></literal>
5240  applies, so (unless it matches <emphasis>again</emphasis> further down) it ends up
5241  with no <literal><link linkend="BLOCK">block</link></literal> action applying.
5242 </para>
5243
5244 <para>
5245  <screen>
5246 ##########################################################################
5247 # Save some innocent victims of the above generic block patterns:
5248 ##########################################################################
5249
5250 # By domain:
5251
5252 { -<link linkend="BLOCK">block</link> }
5253 adv[io]*.  # (for advogato.org and advice.*)
5254 adsl.      # (has nothing to do with ads)
5255 ad[ud]*.   # (adult.* and add.*)
5256 .edu       # (universities don't host banners (yet!))
5257 .*loads.   # (downloads, uploads etc)
5258
5259 # By path:
5260 #
5261 /.*loads/
5262
5263 # Site-specific:
5264 #
5265 www.globalintersec.com/adv # (adv = advanced)
5266 www.ugu.com/sui/ugu/adv</screen>
5267 </para>
5268
5269 <para>
5270  Filtering source code can have nasty side effects,
5271  so make an exception for our friends at sourceforge.net,
5272  and all paths with <quote>cvs</quote> in them. Note that
5273  <literal>-<link linkend="FILTER">filter</link></literal>
5274  disables <emphasis>all</emphasis> filters in one fell swoop!
5275 </para>
5276
5277 <para>
5278  <screen>
5279 # Don't filter code!
5280 #
5281 { -<link linkend="FILTER">filter</link> }
5282 /.*cvs
5283 .sourceforge.net</screen>
5284 </para>
5285
5286 <para>
5287  The actual <filename>default.action</filename> is of course more
5288  comprehensive, but we hope this example made clear how it works.
5289 </para>
5290
5291 </sect3>
5292
5293 <sect3><title>user.action</title>
5294
5295 <para>
5296  So far we are painting with a broad brush by setting general policies,
5297  which would be a reasonable starting point for many people. Now, 
5298  you'd maybe want to be more specific and have customized rules that
5299  are more suitable to your personal habits and preferences. These would
5300  be for narrowly defined situations like your ISP or your bank, and should
5301  be placed in <filename>user.action</filename>, which is parsed after all other 
5302  actions files and hence has the last word, over-riding any previously
5303  defined actions. <filename>user.action</filename> is also a 
5304  <emphasis>safe</emphasis> place for your personal settings, since
5305  <filename>default.action</filename> is actively maintained by the
5306  <application>Privoxy</application> developers and you'll probably want
5307  to install updated versions from time to time.
5308 </para>
5309
5310 <para>
5311  So let's look at a few examples of things that one might typically do in
5312  <filename>user.action</filename>: 
5313 </para>
5314
5315
5316 <!-- brief sample user.action here -->
5317
5318 <para>
5319  <screen>
5320 # My user.action file. &lt;fred@foobar.com&gt;</screen>
5321 </para>
5322
5323 <para>
5324  As <link linkend="aliases">aliases</link> are local to the actions
5325  file that they are defined in, you can't use the ones from
5326  <filename>default.action</filename>, unless you repeat them here:
5327 </para>
5328
5329 <para>
5330  <screen>
5331 # (Re-)define aliases for this file:
5332 #
5333 {{alias}}
5334 -crunch-all-cookies = -crunch-incoming-cookies -crunch-outgoing-cookies
5335 mercy-for-cookies   = -crunch-all-cookies -session-cookies-only
5336 fragile     = -block -crunch-all-cookies -filter -fast-redirects -hide-referer -kill-popups
5337 shop        = mercy-for-cookies -filter{popups} -kill-popups
5338 allow-ads   = -block -filter{banners-by-size} # (see below)</screen>
5339  
5340 </para>
5341
5342 <para>
5343  Say you have accounts on some sites that you visit regularly, and
5344  you don't want to have to log in manually each time. So you'd like
5345  to allow persistent cookies for these sites. The
5346  <literal>mercy-for-cookies</literal> alias defined above does exactly
5347  that, i.e. it disables crunching of cookies in any direction, and
5348  processing of cookies to make them temporary.
5349 </para>
5350
5351 <para>
5352  <screen>
5353 { mercy-for-cookies }
5354 sunsolve.sun.com
5355 slashdot.org
5356 .yahoo.com
5357 .msdn.microsoft.com
5358 .redhat.com</screen>
5359 </para>
5360
5361 <para>
5362  Your bank needs popups and is allergic to some filter, but you don't
5363  know which, so you disable them all:
5364 </para>
5365
5366 <para>
5367  <screen>
5368 { -<link linkend="FILTER">filter</link> -<link linkend="KILL-POPUPS">kill-popups</link> }
5369 .your-home-banking-site.com</screen>
5370 </para>
5371
5372 <para>
5373  While browsing the web with <application>Privoxy</application> you
5374  noticed some ads that sneaked through, but you were too lazy to
5375  report them through our fine and easy <link linkend="contact">feedback</link>
5376  system, so you have added them here:
5377 </para>
5378
5379 <para>
5380  <screen>
5381 { +<link linkend="BLOCK">block</link> }
5382 www.a-popular-site.com/some/unobvious/path
5383 another.popular.site.net/more/junk/here/</screen>
5384 </para>
5385
5386 <para>
5387  Note that, assuming the banners in the above example have regular image
5388  extensions (most do),
5389  <literal>+<link linkend="HANDLE-AS-IMAGE">handle-as-image</link></literal>
5390  need not be specified, since all URLs ending in these extensions will
5391  already have been tagged as images in the relevant section of 
5392  <filename>default.action</filename> by now.
5393 </para>
5394
5395 <para>
5396  Then you noticed that the default configuration breaks Forbes Magazine,
5397  but you were too lazy to find out which action is the culprit, and you
5398  were again too lazy to give <link linkend="contact">feedback</link>, so
5399  you just used the <literal>fragile</literal> alias on the site, and
5400  -- whoa! -- it worked:
5401 </para>
5402
5403 <para>
5404 <screen>
5405 { fragile }
5406 .forbes.com</screen>
5407 </para>
5408
5409 <para>
5410  You like the <quote>fun</quote> text replacements in <filename>default.filter</filename>,
5411  but it is disabled in the distributed actions file. (My colleagues on the team just
5412  don't have a sense of humour, that's why! ;-). So you'd like to turn it on in your private,
5413  update-safe config, once and for all:
5414 </para>
5415
5416 <para>
5417 <screen>
5418 { +<link linkend="filter-fun">filter{fun}</link> }
5419 / # For ALL sites!</screen>
5420 </para>
5421
5422 <para>
5423  Note that the above is not really a good idea: There are exceptions
5424  to the filters in <filename>default.action</filename> for things that
5425  really shouldn't be filtered, like code on CVS->Web interfaces. Since
5426  <filename>user.action</filename> has the last word, these exceptions
5427  won't be valid for the <quote>fun</quote> filtering specified here.
5428 </para>
5429
5430 <para>
5431  Finally, you might think about how your favourite free websites are
5432  funded, and find that they rely on displaying banner advertisements
5433  to survive. So you might want to specifically allow banners for those
5434  sites that you feel provide value to you:
5435 </para>
5436
5437 <para>
5438 <screen>
5439 { allow-ads }
5440 .sourceforge.net
5441 .slashdot.org
5442 .osdn.net</screen>   
5443 </para>
5444
5445 <para>
5446  Note that <literal>allow-ads</literal> has been aliased to 
5447  <literal>-<link linkend="block">block</link></literal>
5448  <literal>-<link linkend="filter-banners-by-size">filter{banners-by-size}</link></literal>
5449  above.
5450 </para>
5451 </sect3>
5452 </sect2>
5453
5454 <!--  ~  End section  ~  -->
5455
5456 </sect1>
5457
5458 <!--  ~  End section  ~  -->
5459
5460 <!--   ~~~~~~~~       New section Header    ~~~~~~~~~     -->
5461
5462 <sect1 id="filter-file">
5463 <title>The Filter File</title>
5464
5465 <para>
5466  All text substitutions that can be invoked through the
5467  <literal><link linkend="filter">filter</link></literal> action
5468  must first be defined in the filter file, which is typically
5469  called <filename>default.filter</filename> and which can be
5470  selected through the <literal>
5471  <link linkend="filterfile">filterfile</link></literal> config
5472  option.
5473 </para>
5474
5475 <para>
5476  Typical reasons for doing such substitutions are to eliminate
5477  common annoyances in HTML and JavaScript, such as pop-up windows,
5478  exit consoles, crippled windows without navigation tools, the
5479  infamous &lt;BLINK&gt; tag etc, to suppress images with certain
5480  width and height attributes (standard banner sizes or web-bugs),
5481  or just to have fun. The possibilities are endless.
5482 </para>
5483
5484 <para>
5485  Filtering works on any text-based document type, including plain
5486  text, HTML, JavaScript, CSS etc. (all <literal>text/*</literal>
5487  MIME types). Substitutions are made at the source level, so if
5488  you want to <quote>roll your own</quote> filters, you should be
5489  familiar with HTML syntax.
5490 </para>
5491
5492 <para>
5493  Just like the <link linkend="actions-file">actions files</link>, the
5494  filter file is organized in sections, which are called <emphasis>filters</emphasis>
5495  here. Each filter consists of a heading line, that starts with the
5496  <emphasis>keyword</emphasis> <literal>FILTER:</literal>, followed by
5497  the filter's <emphasis>name</emphasis>, and a short (one line) 
5498  <emphasis>description</emphasis> of what it does. Below that line
5499  come the <emphasis>jobs</emphasis>, i.e. lines that define the actual
5500  text substitutions. By convention, the name of a filter
5501  should describe what the filter <emphasis>eliminates</emphasis>. The
5502  comment is used in the <ulink url="http://config.privoxy.org/">web-based
5503  user interface</ulink>.
5504 </para>
5505
5506 <para>
5507  Once a filter called <replaceable>name</replaceable> has been defined
5508  in the filter file, it can be invoked by using an action of the form
5509  +<literal><link linkend="filter">filter</link>{<replaceable>name</replaceable>}</literal>
5510  in any <link linkend="actions-file">actions file</link>.
5511 </para>
5512  
5513 <para>
5514  A filter header line for a filter called <quote>foo</quote> could look
5515  like this:
5516 </para>
5517
5518 <para>
5519  <screen>FILTER: foo Replace all "foo" with "bar"</screen>
5520 </para>
5521
5522 <para>
5523  Below that line, and up to the next header line, come the jobs that
5524  define what text replacements the filter executes. They are specified
5525  in a syntax that imitates <ulink url="http://www.perl.org/">Perl</ulink>'s
5526  <literal>s///</literal> operator. If you are familiar with Perl, you
5527  will find this to be quite intuitive, and may want to look at the
5528  <ulink url="http://www.oesterhelt.org/pcrs/pcrs.1.html">PCRS man page</ulink>
5529  for the subtle differences to Perl behaviour. Most notably, the non-standard
5530  option letter <literal>U</literal> is supported, which turns the default
5531  to ungreedy matching.
5532 </para>
5533
5534 <para>
5535  If you are new to regular expressions, you might want to take a look at
5536  the <link linkend="regex">Appendix on regular expressions</link>, and
5537  see the <ulink url="http://perldoc.com/perl5.6.1/pod/perl.html">Perl
5538  manual</ulink> for
5539  <ulink url="http://perldoc.com/perl5.6.1/pod/perlop.html#s-PATTERN-REPLACEMENT-egimosx">the 
5540  <literal>s///</literal> operator's syntax</ulink> and <ulink
5541  url="http://perldoc.com/perl5.6.1/pod/perlre.html">Perl-style regular
5542  expressions</ulink> in general.
5543  The below examples might also help to get you started.
5544 </para>
5545
5546 <!--   ~~~~~~~~       New section Header    ~~~~~~~~~     -->
5547
5548 <sect2><title>Filter File Tutorial</title>
5549 <para>
5550  Now, let's complete our <quote>foo</quote> filter. We have already defined
5551  the heading, but the jobs are still missing. Since all it does is to replace
5552  <quote>foo</quote> with <quote>bar</quote>, there is only one (trivial) job
5553  needed:
5554 </para>
5555
5556 <para>
5557  <screen>s/foo/bar/</screen>
5558 </para>
5559
5560 <para>
5561  But wait! Didn't the comment say that <emphasis>all</emphasis> occurrences
5562  of <quote>foo</quote> should be replaced? Our current job will only take
5563  care of the first <quote>foo</quote> on each page. For global substitution,
5564  we'll need to add the <literal>g</literal> option:
5565 </para>
5566
5567 <para>
5568  <screen>s/foo/bar/g</screen>
5569 </para>
5570
5571 <para>
5572  Our complete filter now looks like this:
5573 </para>
5574 <para>
5575  <screen>FILTER: foo Replace all "foo" with "bar"
5576 s/foo/bar/g</screen>
5577 </para>
5578
5579 <para>
5580  Let's look at some real filters for more interesting examples. Here you see
5581  a filter that protects against some common annoyances that arise from JavaScript
5582  abuse. Let's look at its jobs one after the other:
5583 </para>
5584
5585
5586 <para>
5587  <screen>
5588 FILTER: js-annoyances Get rid of particularly annoying JavaScript abuse
5589
5590 # Get rid of JavaScript referrer tracking. Test page: http://www.randomoddness.com/untitled.htm
5591 #
5592 s|(&lt;script.*)document\.referrer(.*&lt;/script&gt;)|$1"Not Your Business!"$2|Usg</screen>
5593 </para>
5594
5595 <para>
5596  Following the header line and a comment, you see the job. Note that it uses
5597  <literal>|</literal> as the delimiter instead of <literal>/</literal>, because
5598  the pattern contains a forward slash, which would otherwise have to be escaped
5599  by a backslash (<literal>\</literal>).
5600 </para>
5601
5602 <para>
5603  Now, let's examine the pattern: it starts with the text <literal>&lt;script.*</literal>
5604  enclosed in parentheses. Since the dot matches any character, and <literal>*</literal>
5605  means: <quote>Match an arbitrary number of the element left of myself</quote>, this
5606  matches <quote>&lt;script</quote>, followed by <emphasis>any</emphasis> text, i.e.
5607  it matches the whole page, from the start of the first &lt;script&gt; tag.
5608 </para>
5609
5610 <para>
5611  That's more than we want, but the pattern continues: <literal>document\.referrer</literal>
5612  matches only the exact string <quote>document.referrer</quote>. The dot needed to
5613  be <emphasis>escaped</emphasis>, i.e. preceded by a backslash, to take away its
5614  special meaning as a joker, and make it just a regular dot. So far, the meaning is:
5615  Match from the start of the first &lt;script&gt; tag in a the page, up to, and including,
5616  the text <quote>document.referrer</quote>, if <emphasis>both</emphasis> are present
5617  in the page (and appear in that order).
5618 </para>
5619
5620 <para>
5621  But there's still more pattern to go. The next element, again enclosed in parentheses,
5622  is <literal>.*&lt;/script&gt;</literal>. You already know what <literal>.*</literal>
5623  means, so the whole pattern translates to: Match from the start of the first  &lt;script&gt;
5624  tag in a page to the end of the last &lt;script&gt; tag, provided that the text
5625  <quote>document.referrer</quote> appears somewhere in between.
5626 </para>
5627
5628 <para>
5629  This is still not the whole story, since we have ignored the options and the parentheses:
5630  The portions of the page matched by sub-patterns that are enclosed in parentheses, will be
5631  remembered and be available through the variables <literal>$1, $2, ...</literal> in
5632  the substitute. The <literal>U</literal> option switches to ungreedy matching, which means
5633  that the first <literal>.*</literal> in the pattern will only <quote>eat up</quote> all
5634  text in between <quote>&lt;script</quote> and the <emphasis>first</emphasis> occurrence
5635  of <quote>document.referrer</quote>, and that the second <literal>.*</literal> will
5636  only span the text up to the <emphasis>first</emphasis> <quote>&lt;/script&gt;</quote>
5637  tag. Furthermore, the <literal>s</literal> option says that the match may span
5638  multiple lines in the page, and the <literal>g</literal> option again means that the
5639  substitution is global.
5640 </para>
5641
5642 <para>
5643  So, to summarize, the pattern means: Match all scripts that contain the text
5644  <quote>document.referrer</quote>. Remember the parts of the script from
5645  (and including) the start tag up to (and excluding) the string
5646  <quote>document.referrer</quote> as <literal>$1</literal>, and the part following
5647  that string, up to and including the closing tag, as <literal>$2</literal>.
5648 </para>
5649
5650 <para>
5651  Now the pattern is deciphered, but wasn't this about substituting things? So
5652  lets look at the substitute: <literal>$1"Not Your Business!"$2</literal> is
5653  easy to read: The text remembered as <literal>$1</literal>, followed by 
5654  <literal>"Not Your Business!"</literal> (<emphasis>including</emphasis>
5655  the quotation marks!), followed by the text remembered as <literal>$2</literal>.
5656  This produces an exact copy of the original string, with the middle part
5657  (the <quote>document.referrer</quote>) replaced by <literal>"Not Your
5658  Business!"</literal>.
5659 </para>
5660
5661 <para>
5662  The whole job now reads: Replace <quote>document.referrer</quote> by
5663  <literal>"Not Your Business!"</literal> wherever it appears inside a
5664  &lt;script&gt tag. Note that this job won't break JavaScript syntax,
5665  since both the original and the replacement are syntactically valid
5666  string objects. The script just won't have access to the referrer
5667  information anymore.
5668 </para>
5669
5670 <para>
5671  We'll show you two other jobs from the JavaScript taming department, but
5672  this time only point out the constructs of special interest:
5673 </para>
5674
5675 <para>
5676  <screen>
5677 # The status bar is for displaying link targets, not pointless blahblah
5678 #
5679 s/window\.status\s*=\s*['"].*?['"]/dUmMy=1/ig</screen>
5680 </para>
5681
5682 <para>
5683  <literal>\s</literal> stands for whitespace characters (space, tab, newline,
5684  carriage return, form feed), so that <literal>\s*</literal> means: <quote>zero
5685  or more whitespace</quote>. The <literal>?</literal> in <literal>.*?</literal>
5686  makes this matching of arbitrary text ungreedy. (Note that the <literal>U</literal>
5687  option is not set). The <literal>['"]</literal> construct means: <quote>a single
5688  <emphasis>or</emphasis> a double quote</quote>.
5689 </para>
5690
5691 <para>
5692  So what does this job do? It replaces assignments of single- or double-quoted
5693  strings to the <quote>window.status</quote> object with a dummy assignment
5694  (using a variable name that is hopefully odd enough not to conflict with
5695  real variables in scripts). Thus, it catches many cases where e.g. pointless
5696  descriptions are displayed in the status bar instead of the link target when
5697  you move your mouse over links.
5698 </para>
5699
5700 <para>
5701  <screen>
5702 # Kill OnUnload popups. Yummy. Test: http://www.zdnet.com/zdsubs/yahoo/tree/yfs.html
5703 #
5704 s/(&lt;body .*)onunload(.*&gt;)/$1never$2/iU</screen>
5705 </para>
5706
5707 <para>
5708  Including the
5709  <ulink url="http://www.w3.org/TR/2000/REC-DOM-Level-2-Events-20001113/events.html#Events-eventgroupings-htmlevents">OnUnload
5710  event binding</ulink> in the HTML DOM was a <emphasis>CRIME</emphasis>.
5711  When I close a browser window, I want it to close and die. Basta.
5712  This job replaces the <quote>onunload</quote> attribute in
5713  <quote>&lt;body&gt</quote> tags with the dummy word <literal>never</literal>.
5714  Note that the <literal>i</literal> option makes the pattern matching
5715  case-insensitive.
5716 </para>
5717
5718 <para>
5719  The last example is from the fun department:
5720 </para>
5721
5722 <para>
5723  <screen>
5724 FILTER: fun Fun text replacements
5725
5726 # Spice the daily news:
5727 #
5728 s/microsoft(?!\.com)/MicroSuck/ig</screen>
5729 </para>
5730
5731 <para>
5732  Note the <literal>(?!\.com)</literal> part (a so-called negative lookahead)
5733  in the job's pattern, which means: Don't match, if the string 
5734  <quote>.com</quote> appears directly following <quote>microsoft</quote>
5735  in the page. This prevents links to microsoft.com from being messed, while
5736  still replacing the word everywhere else.
5737 </para>
5738
5739 <para>
5740  <screen>
5741 # Buzzword Bingo (example for extended regex syntax)
5742 #
5743 s* industry[ -]leading \
5744 |  cutting[ -]edge \
5745 |  award[ -]winning # Comments are OK, too! \
5746 |  high[ -]performance \
5747 |  solutions[ -]based \
5748 |  unmatched \
5749 |  unparalleled \
5750 |  unrivalled \
5751 *&lt;font color="red"&gt;&lt;b&gt;BINGO!&lt;/b&gt;&lt;/font&gt; \
5752 *igx</screen>
5753 </para>
5754
5755 <para>
5756  The <literal>x</literal> option in this job turns on extended syntax, and allows for
5757  e.g. the liberal use of (non-interpreted!) whitespace for nicer formatting.
5758 </para>
5759
5760 <para>
5761  You get the idea?
5762 </para>
5763 </sect2>
5764 </sect1>
5765
5766 <!--  ~  End section  ~  -->
5767
5768
5769
5770 <!--   ~~~~~       New section      ~~~~~     -->
5771
5772 <sect1 id="templates">
5773 <title>Templates</title>
5774 <para>
5775  When <application>Privoxy</application> displays one of its internal 
5776  pages, such as a <ulink url="http://bogus_404_page.com">404 Not Found error page</ulink>
5777  (<application>Privoxy</application> must be running for link to work as
5778  intended), it uses the appropriate template. On Linux, BSD, and Unix, these
5779  are located in <filename>/etc/privoxy/templates</filename> by default. These
5780  may be customized, if desired. <filename>cgi-style.css</filename> is used to
5781  control the HTML attributes (fonts, etc).
5782 </para>
5783 <para>
5784  The default 
5785  <ulink
5786  url="http://ads.bannerserver.example.com/nasty-ads/sponsor.html">Blocked
5787  </ulink> (<application>Privoxy</application> needs to be running for page to
5788  display) banner page with the bright red top banner, is called just
5789  <quote><filename>blocked</filename></quote>. This may be customized or
5790  replaced with something else if desired (not recommended for the casual
5791  user).
5792 </para>
5793
5794 </sect1>
5795
5796 <!--  ~  End section  ~  -->
5797
5798
5799
5800 <!--   ~~~~~       New section      ~~~~~     -->
5801
5802 <sect1 id="contact"><title>Contacting the Developers, Bug Reporting and Feature
5803 Requests</title>
5804
5805 <!-- Include contacting.sgml boilerplate: -->
5806  &contacting;
5807 <!-- end boilerplate -->
5808
5809 </sect1>
5810
5811 <!--  ~  End section  ~  -->
5812
5813
5814 <!--   ~~~~~       New section      ~~~~~     -->
5815 <sect1 id="copyright"><title><application>Privoxy</application> Copyright, License and History</title>
5816
5817 <!-- Include copyright.sgml: -->
5818  &copyright;
5819 <!-- end copyright -->
5820
5821 <!--   ~~~~~       New section      ~~~~~     -->
5822 <sect2><title>License</title>
5823 <!-- Include copyright.sgml: -->
5824  &license;
5825 <!-- end copyright -->
5826 </sect2>
5827 <!--  ~  End section  ~  -->
5828
5829
5830 <!--   ~~~~~       New section      ~~~~~     -->
5831
5832 <sect2 id="history"><title>History</title>
5833 <!-- Include history.sgml: -->
5834  &history;
5835 <!-- end history -->
5836 </sect2>
5837 </sect1>
5838
5839 <!--  ~  End section  ~  -->
5840
5841
5842 <!--   ~~~~~       New section      ~~~~~     -->
5843 <sect1 id="seealso"><title>See Also</title>
5844 <!-- Include seealso.sgml: -->
5845  &seealso;
5846 <!-- end seealso -->
5847 </sect1>
5848
5849
5850
5851 <!--   ~~~~~       New section      ~~~~~     -->
5852 <sect1 id="appendix"><title>Appendix</title>
5853
5854
5855 <!--   ~~~~~       New section      ~~~~~     -->
5856 <sect2 id="regex">
5857 <title>Regular Expressions</title>
5858 <para>
5859  <application>Privoxy</application> can use <quote>regular expressions</quote> 
5860  in various config files. Assuming support for <quote>pcre</quote> (Perl
5861  Compatible Regular Expressions) is compiled in, which is the default. Such
5862  configuration directives do not require regular expressions, but they can be
5863  used to increase flexibility by matching a pattern with wild-cards against
5864  URLs.
5865 </para>
5866
5867 <para>
5868  If you are reading this, you probably don't understand what <quote>regular
5869  expressions</quote> are, or what they can do. So this will be a very brief
5870  introduction only. A full explanation would require a book ;-)
5871 </para>
5872
5873 <para>
5874  <quote>Regular expressions</quote> is a way of matching one character
5875  expression against another to see if it matches or not. One of the
5876  <quote>expressions</quote> is a literal string of readable characters
5877  (letter, numbers, etc), and the other is a complex string of literal
5878  characters combined with wild-cards, and other special characters, called
5879  meta-characters. The <quote>meta-characters</quote> have special meanings and
5880  are used to build the complex pattern to be matched against. Perl Compatible
5881  Regular Expressions is an enhanced form of the regular expression language
5882  with backward compatibility.
5883 </para>
5884
5885 <para>
5886  To make a simple analogy, we do something similar when we use wild-card
5887  characters when listing files with the <command>dir</command> command in DOS. 
5888  <literal>*.*</literal> matches all filenames. The <quote>special</quote>
5889  character here is the asterisk which matches any and all characters. We can be
5890  more specific and use <literal>?</literal> to match just individual
5891  characters. So <quote>dir file?.text</quote> would match
5892  <quote>file1.txt</quote>, <quote>file2.txt</quote>, etc. We are pattern
5893  matching, using a similar technique to <quote>regular expressions</quote>!
5894 </para>
5895
5896 <para>
5897  Regular expressions do essentially the same thing, but are much, much more
5898  powerful. There are many more <quote>special characters</quote> and ways of 
5899  building complex patterns however. Let's look at a few of the common ones,
5900  and then some examples:
5901 </para>
5902
5903 <para><simplelist>
5904  <member>
5905   <emphasis>.</emphasis> - Matches any single character, e.g. <quote>a</quote>,
5906   <quote>A</quote>, <quote>4</quote>, <quote>:</quote>, or <quote>@</quote>.
5907  </member>
5908 </simplelist></para>
5909
5910 <para><simplelist>
5911  <member>
5912   <emphasis>?</emphasis> - The preceding character or expression is matched ZERO or ONE
5913   times. Either/or.
5914  </member>
5915 </simplelist></para>
5916
5917 <para><simplelist>
5918  <member>
5919   <emphasis>+</emphasis> - The preceding character or expression is matched ONE or MORE
5920   times.
5921  </member>
5922 </simplelist></para>
5923
5924 <para><simplelist>
5925  <member>
5926   <emphasis>*</emphasis> - The preceding character or expression is matched ZERO or MORE
5927   times.
5928  </member>
5929 </simplelist></para>
5930
5931 <para><simplelist>
5932  <member>
5933   <emphasis>\</emphasis> - The <quote>escape</quote> character denotes that
5934   the following character should be taken literally. This is used where one of the 
5935   special characters (e.g. <quote>.</quote>) needs to be taken literally and
5936   not as a special meta-character. Example: <quote>example\.com</quote>, makes 
5937   sure the period is recognized only as a period (and not expanded to its 
5938   meta-character meaning of any single character).
5939  </member>
5940 </simplelist></para>
5941
5942 <para><simplelist>
5943  <member>
5944   <emphasis>[]</emphasis> - Characters enclosed in brackets will be matched if
5945   any of the enclosed characters are encountered. For instance, <quote>[0-9]</quote>
5946   matches any numeric digit (zero through nine). As an example, we can combine 
5947   this with <quote>+</quote> to match any digit one of more times: <quote>[0-9]+</quote>.
5948  </member>
5949 </simplelist></para>
5950
5951 <para><simplelist>
5952  <member>
5953   <emphasis>()</emphasis> - parentheses are used to group a sub-expression,
5954   or multiple sub-expressions.
5955  </member>
5956 </simplelist></para>
5957
5958 <para><simplelist>
5959  <member>
5960   <emphasis>|</emphasis> - The <quote>bar</quote> character works like an
5961   <quote>or</quote> conditional statement. A match is successful if the
5962   sub-expression on either side of <quote>|</quote> matches. As an example:
5963   <quote>/(this|that) example/</quote> uses grouping and the bar character 
5964   and would match either <quote>this example</quote> or <quote>that
5965   example</quote>, and nothing else.
5966  </member>
5967 </simplelist></para>
5968
5969 <para><simplelist>
5970  <member>
5971   <emphasis>s/string1/string2/g</emphasis> - This is used to rewrite strings of text. 
5972   <quote>string1</quote> is replaced by <quote>string2</quote> in this
5973   example. There must of course be a match on <quote>string1</quote> first.
5974  </member>
5975 </simplelist></para>
5976
5977 <para>
5978  These are just some of the ones you are likely to use when matching URLs with 
5979  <application>Privoxy</application>, and is a long way from a definitive
5980  list. This is enough to get us started with a few simple examples which may
5981  be more illuminating:
5982 </para>
5983
5984 <para>
5985  <emphasis><literal>/.*/banners/.*</literal></emphasis> - A  simple example
5986  that uses the common combination of <quote>.</quote> and <quote>*</quote> to 
5987  denote any character, zero or more times. In other words, any string at all.
5988  So we start with a literal forward slash, then our regular expression pattern 
5989  (<quote>.*</quote>) another literal forward slash, the string
5990  <quote>banners</quote>, another forward slash, and lastly another
5991  <quote>.*</quote>. We are building 
5992  a directory path here. This will match any file with the path that has a
5993  directory named <quote>banners</quote> in it. The <quote>.*</quote> matches
5994  any characters, and this could conceivably be more forward slashes, so it
5995  might expand into a much longer looking path. For example, this could match:
5996  <quote>/eye/hate/spammers/banners/annoy_me_please.gif</quote>, or just
5997  <quote>/banners/annoying.html</quote>, or almost an infinite number of other
5998  possible combinations, just so it has <quote>banners</quote> in the path
5999  somewhere.
6000 </para>
6001
6002 <para>
6003  A now something a little more complex:
6004 </para>
6005
6006 <para>
6007  <emphasis><literal>/.*/adv((er)?ts?|ertis(ing|ements?))?/</literal></emphasis> - 
6008  We have several literal forward slashes again (<quote>/</quote>), so we are
6009  building another expression that is a file path statement. We have another 
6010  <quote>.*</quote>, so we are matching against any conceivable sub-path, just so
6011  it matches our expression. The only true literal that <emphasis>must
6012  match</emphasis> our pattern is <application>adv</application>, together with
6013  the forward slashes. What comes after the <quote>adv</quote> string is the
6014  interesting part. 
6015 </para>
6016
6017 <para>
6018  Remember the <quote>?</quote> means the preceding expression (either a
6019  literal character or anything grouped with <quote>(...)</quote> in this case)
6020  can exist or not, since this means either zero or one match. So
6021  <quote>((er)?ts?|ertis(ing|ements?))</quote> is optional, as are the
6022  individual sub-expressions: <quote>(er)</quote>,
6023  <quote>(ing|ements?)</quote>, and the <quote>s</quote>. The <quote>|</quote>
6024  means <quote>or</quote>. We have two of those. For instance, 
6025  <quote>(ing|ements?)</quote>, can expand to match either <quote>ing</quote> 
6026  <emphasis>OR</emphasis> <quote>ements?</quote>. What is being done here, is an
6027  attempt at matching as many variations of <quote>advertisement</quote>, and 
6028  similar, as possible. So this would expand to match just <quote>adv</quote>,
6029  or <quote>advert</quote>, or <quote>adverts</quote>, or
6030  <quote>advertising</quote>, or <quote>advertisement</quote>, or
6031  <quote>advertisements</quote>. You get the idea. But it would not match 
6032  <quote>advertizements</quote> (with a <quote>z</quote>). We could fix that by
6033  changing our regular expression to: 
6034  <quote>/.*/adv((er)?ts?|erti(s|z)(ing|ements?))?/</quote>, which would then match
6035  either spelling.
6036 </para>
6037
6038 <para>
6039  <emphasis><literal>/.*/advert[0-9]+\.(gif|jpe?g)</literal></emphasis> - Again 
6040  another path statement with forward slashes. Anything in the square brackets 
6041  <quote>[]</quote> can be matched. This is using <quote>0-9</quote> as a
6042  shorthand expression to mean any digit one through nine. It is the same as
6043  saying <quote>0123456789</quote>. So any digit matches. The <quote>+</quote>
6044  means one or more of the preceding expression must be included. The preceding 
6045  expression here is what is in the square brackets -- in this case, any digit 
6046  one through nine. Then, at the end, we have a grouping: <quote>(gif|jpe?g)</quote>. 
6047  This includes a <quote>|</quote>, so this needs to match the expression on
6048  either side of that bar character also. A simple <quote>gif</quote> on one side, and the other
6049  side will in turn match either <quote>jpeg</quote> or <quote>jpg</quote>,
6050  since the <quote>?</quote> means the letter <quote>e</quote> is optional and
6051  can be matched once or not at all. So we are building an expression here to
6052  match image GIF or JPEG type image file. It must include the literal
6053  string <quote>advert</quote>, then one or more digits, and a <quote>.</quote>
6054  (which is now a literal, and not a special character, since it is escaped
6055  with <quote>\</quote>), and lastly either <quote>gif</quote>, or
6056  <quote>jpeg</quote>, or <quote>jpg</quote>. Some possible matches would
6057  include: <quote>//advert1.jpg</quote>,
6058  <quote>/nasty/ads/advert1234.gif</quote>,
6059  <quote>/banners/from/hell/advert99.jpg</quote>. It would not match
6060  <quote>advert1.gif</quote> (no leading slash), or
6061  <quote>/adverts232.jpg</quote> (the expression does not include an
6062  <quote>s</quote>), or <quote>/advert1.jsp</quote> (<quote>jsp</quote> is not
6063  in the expression anywhere).
6064 </para>
6065
6066 <para>
6067  <emphasis><literal>s/microsoft(?!.com)/MicroSuck/i</literal></emphasis> - This is 
6068  a substitution. <quote>MicroSuck</quote> will replace any occurrence of 
6069  <quote>microsoft</quote>.  The <quote>i</quote> at the end of the expression
6070  means ignore case. The <quote>(?!.com)</quote> means 
6071  the match should fail if <quote>microsoft</quote> is followed by
6072  <quote>.com</quote>. In other words, this acts like a <quote>NOT</quote>
6073  modifier. In case this is a hyperlink, we don't want to break it ;-).
6074 </para>
6075
6076 <para>
6077  We are barely scratching the surface of regular expressions here so that you
6078  can understand the default <application>Privoxy</application>
6079  configuration files, and maybe use this knowledge to customize your own
6080  installation. There is much, much more that can be done with regular
6081  expressions. Now that you know enough to get started, you can learn more on
6082  your own :/
6083 </para>
6084
6085 <para>
6086  More reading on Perl Compatible Regular expressions: 
6087  <ulink url="http://www.perldoc.com/perl5.6/pod/perlre.html">http://www.perldoc.com/perl5.6/pod/perlre.html</ulink>
6088 </para>
6089
6090 </sect2>
6091
6092 <!--  ~  End section  ~  -->
6093
6094
6095 <!--   ~~~~~       New section      ~~~~~     -->
6096 <sect2>
6097 <title><application>Privoxy</application>'s Internal Pages</title>
6098
6099 <para>
6100  Since <application>Privoxy</application> proxies each requested 
6101  web page, it is easy for <application>Privoxy</application> to 
6102  trap certain special URLs. In this way, we can talk directly to
6103  <application>Privoxy</application>, and see how it is 
6104  configured, see how our rules are being applied, change these 
6105  rules and other configuration options, and even turn
6106  <application>Privoxy's</application> filtering off, all with 
6107  a web browser.
6108
6109 </para>
6110
6111 <para>
6112  The URLs listed below are the special ones that allow direct access 
6113  to <application>Privoxy</application>. Of course,
6114  <application>Privoxy</application> must be running to access these. If 
6115  not, you will get a friendly error message. Internet access is not 
6116  necessary either.
6117 </para>
6118
6119 <para>
6120  <itemizedlist>
6121
6122  <listitem>
6123   <para>  
6124    Privoxy main page: 
6125   </para>
6126   <blockquote>
6127    <para> 
6128      <ulink url="http://config.privoxy.org/">http://config.privoxy.org/</ulink>
6129    </para>
6130   </blockquote>
6131   <para>
6132    Alternately, this may be reached at <ulink
6133    url="http://p.p/">http://p.p/</ulink>, but this
6134    variation may not work as reliably as the above in some configurations.
6135   </para>
6136  </listitem>
6137
6138  <listitem>
6139   <para>  
6140     Show information about the current configuration, including viewing and 
6141     editing of actions files:
6142   </para>
6143    <blockquote>
6144    <para> 
6145     <ulink url="http://config.privoxy.org/show-status">http://config.privoxy.org/show-status</ulink>
6146    </para>
6147   </blockquote>
6148  </listitem>
6149  
6150  <listitem>
6151   <para>  
6152     Show the source code version numbers:
6153   </para>
6154   <blockquote>
6155    <para> 
6156     <ulink url="http://config.privoxy.org/show-version">http://config.privoxy.org/show-version</ulink>
6157    </para>
6158   </blockquote>
6159  </listitem>
6160  
6161  <listitem>
6162   <para>  
6163    Show the browser's request headers:
6164   </para>
6165   <blockquote>
6166    <para> 
6167     <ulink url="http://config.privoxy.org/show-request">http://config.privoxy.org/show-request</ulink>
6168    </para>
6169   </blockquote>
6170  </listitem>
6171  
6172  <listitem>
6173   <para>  
6174    Show which actions apply to a URL and why:
6175   </para>
6176    <blockquote>
6177    <para> 
6178     <ulink url="http://config.privoxy.org/show-url-info">http://config.privoxy.org/show-url-info</ulink>
6179    </para>
6180   </blockquote>
6181  </listitem>
6182  
6183  <listitem>
6184   <para>  
6185    Toggle Privoxy on or off. In this case, <quote>Privoxy</quote> continues 
6186    to run, but only as a pass-through proxy, with no actions taking place:
6187   </para>
6188    <blockquote>
6189    <para> 
6190     <ulink url="http://config.privoxy.org/toggle">http://config.privoxy.org/toggle</ulink>
6191    </para>
6192   </blockquote>
6193   <para>
6194    Short cuts. Turn off, then on: 
6195   </para>
6196    <blockquote>
6197    <para> 
6198      <ulink url="http://config.privoxy.org/toggle?set=disable">http://config.privoxy.org/toggle?set=disable</ulink>
6199    </para>
6200   </blockquote>
6201    <blockquote>
6202    <para> 
6203      <ulink url="http://config.privoxy.org/toggle?set=enable">http://config.privoxy.org/toggle?set=enable</ulink>
6204    </para>
6205   </blockquote>
6206  </listitem>
6207  
6208  </itemizedlist>
6209 </para>
6210
6211 <para>
6212  These may be bookmarked for quick reference. See next.
6213
6214 </para>
6215
6216 <sect3 id="bookmarklets">
6217 <title>Bookmarklets</title>
6218 <para>
6219  Below are some <quote>bookmarklets</quote> to allow you to easily access a
6220  <quote>mini</quote> version of some of <application>Privoxy's</application>
6221  special pages. They are designed for MS Internet Explorer, but should work
6222  equally well in Netscape, Mozilla, and other browsers which support
6223  JavaScript. They are designed to run directly from your bookmarks - not by
6224  clicking the links below (although that should work for testing).
6225 </para>
6226 <para>
6227  To save them, right-click the link and choose <quote>Add to Favorites</quote>
6228  (IE) or <quote>Add Bookmark</quote> (Netscape). You will get a warning that
6229  the bookmark <quote>may not be safe</quote> - just click OK. Then you can run the
6230  Bookmarklet directly from your favorites/bookmarks. For even faster access,
6231  you can put them on the <quote>Links</quote> bar (IE) or the <quote>Personal
6232  Toolbar</quote> (Netscape), and run them with a single click. 
6233 </para>
6234
6235 <para>
6236  <itemizedlist>
6237
6238   <listitem>
6239    <para>
6240     <ulink
6241     url="javascript:void(window.open('http://config.privoxy.org/toggle?mini=y&#38;set=enabled','ijbstatus','width=250,height=100,resizable=yes,scrollbars=no,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());">Privoxy - Enable</ulink>
6242    </para>
6243   </listitem> 
6244
6245   <listitem>
6246    <para>
6247     <ulink
6248     url="javascript:void(window.open('http://config.privoxy.org/toggle?mini=y&#38;set=disabled','ijbstatus','width=250,height=100,resizable=yes,scrollbars=no,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());">Privoxy - Disable</ulink>
6249    </para>
6250   </listitem> 
6251
6252   <listitem>
6253    <para>
6254     <ulink
6255     url="javascript:void(window.open('http://config.privoxy.org/toggle?mini=y&#38;set=toggle','ijbstatus','width=250,height=100,resizable=yes,scrollbars=no,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());">Privoxy - Toggle Privoxy</ulink> (Toggles between enabled and disabled)
6256    </para>
6257   </listitem> 
6258
6259   <listitem>
6260    <para>
6261     <ulink
6262     url="javascript:void(window.open('http://config.privoxy.org/toggle?mini=y','ijbstatus','width=250,height=2,resizable=yes,scrollbars=no,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());">Privoxy- View Status</ulink>
6263    </para>
6264   </listitem> 
6265
6266   <listitem>
6267    <para>
6268     <ulink url="javascript:w=Math.floor(screen.width/2);h=Math.floor(screen.height*0.9);void(window.open('http://www.privoxy.org/actions','Feedback','screenx='+w+',width='+w+',height='+h+',scrollbars=yes,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());">Privoxy - Submit Filter Feedback</ulink>
6269    </para>
6270   </listitem> 
6271
6272  </itemizedlist>
6273 </para>
6274
6275
6276
6277 <para>
6278  Credit: The site which gave me the general idea for these bookmarklets is
6279  <ulink url="http://www.bookmarklets.com">www.bookmarklets.com</ulink>. They
6280  have more information about bookmarklets. 
6281 </para>
6282
6283
6284 </sect3>
6285
6286 </sect2>
6287
6288
6289 <!--   ~~~~~       New section      ~~~~~     -->
6290 <sect2 id="chain">
6291 <title>Chain of Events</title>
6292 <para>
6293  Let's take a quick look at the basic sequence of events when a web page is 
6294  requested by your browser and <application>Privoxy</application> is on duty:
6295 </para>
6296
6297 <para>
6298  <itemizedlist>
6299  <listitem>
6300   <para>
6301    First, your web browser requests a web page. The browser knows to send 
6302    the request to <application>Privoxy</application>, which will in turn, 
6303    relay the request to the remote web server after passing the following 
6304    tests: 
6305   </para>
6306  </listitem> 
6307  <listitem>
6308   <para>
6309    <application>Privoxy</application> traps any request for its own internal CGI 
6310    pages (e.g http://p.p/) and sends the CGI page back to the browser.
6311   </para>
6312  </listitem> 
6313  <listitem>
6314   <para>
6315    Next, <application>Privoxy</application> checks to see if the URL 
6316    matches any <link
6317    linkend="BLOCK"><quote>+block</quote></link> patterns. If
6318    so, the URL is then blocked, and the remote web server will not be contacted.
6319    <link linkend="HANDLE-AS-IMAGE"><quote>+handle-as-image</quote></link> 
6320    is then checked and if it does not match, an 
6321    HTML <quote>BLOCKED</quote> page is sent back. Otherwise, if it does match,
6322    an image is returned. The type of image depends on the setting of <link
6323    linkend="SET-IMAGE-BLOCKER"><quote>+set-image-blocker</quote></link>
6324    (blank, checkerboard pattern, or an HTTP redirect to an image elsewhere).
6325   </para>
6326  </listitem> 
6327  <listitem>
6328   <para>
6329    Untrusted URLs are blocked. If URLs are being added to the
6330    <filename>trust</filename> file, then that is done.
6331   </para>
6332  </listitem> 
6333  <listitem>
6334   <para>
6335    If the URL pattern matches the <link
6336    linkend="FAST-REDIRECTS"><quote>+fast-redirects</quote></link> action,
6337    it is then processed. Unwanted parts of the requested URL are stripped.
6338   </para>
6339  </listitem> 
6340  <listitem>
6341   <para>
6342    Now the rest of the client browser's request headers are processed. If any
6343    of these match any of the relevant actions (e.g. <link
6344    linkend="HIDE-USER-AGENT"><quote>+hide-user-agent</quote></link>,
6345    etc.), headers are suppressed or forged as determined by these actions and
6346    their parameters.
6347   </para>
6348  </listitem> 
6349  <listitem>
6350   <para>
6351    Now the web server starts sending its response back (i.e. typically a web page and related 
6352    data).
6353   </para>
6354  </listitem> 
6355  <listitem>
6356   <para>
6357    First, the server headers are read and processed to determine, among other
6358    things, the MIME type (document type) and encoding. The headers are then
6359    filtered as deterimed by the 
6360    <link linkend="CRUNCH-INCOMING-COOKIES"><quote>+crunch-incoming-cookies</quote></link>,
6361    <link linkend="SESSION-COOKIES-ONLY"><quote>+session-cookies-only</quote></link>,
6362    and <link linkend="DOWNGRADE-HTTP-VERSION"><quote>+downgrade-http-version</quote></link>
6363    actions.
6364   </para>
6365  </listitem> 
6366  <listitem>
6367   <para>
6368    If the <link linkend="KILL-POPUPS"><quote>+kill-popups</quote></link>
6369    action applies, and it is an HTML or JavaScript document, the popup-code in the
6370    response is filtered on-the-fly as it is received.
6371   </para>
6372  </listitem> 
6373  <listitem>
6374   <para>
6375    If a <link linkend="FILTER"><quote>+filter</quote></link>
6376    or <link
6377    linkend="DEANIMATE-GIFS"><quote>+deanimate-gifs</quote></link>
6378    action applies (and the document type fits the action), the rest of the page is
6379    read into memory (up to a configurable limit). Then the filter rules (from
6380    <filename>default.filter</filename>) are processed against the buffered
6381    content. Filters are applied in the order they are specified in the
6382    <filename>default.filter</filename> file. Animated GIFs, if present, are
6383    reduced to either the first or last frame, depending on the action
6384    setting.The entire page, which is now filtered, is then sent by
6385    <application>Privoxy</application> back to your browser. 
6386   </para>
6387   <para>
6388    If neither <link linkend="FILTER"><quote>+filter</quote></link>
6389    or <link
6390    linkend="DEANIMATE-GIFS"><quote>+deanimate-gifs</quote></link>
6391    matches, then <application>Privoxy</application> passes the raw data through 
6392    to the client browser as it becomes available.
6393   </para>
6394  </listitem> 
6395  <listitem>
6396   <para>
6397    As the browser receives the now (probably filtered) page content, it 
6398    reads and then requests any URLs that may be embedded within the page
6399    source, e.g. ad images, stylesheets, JavaScript, other HTML documents (e.g.
6400    frames), sounds, etc. For each of these objects, the browser issues a new
6401    request. And each such request is in turn processed as above. Note that a
6402    complex web page may have many such embedded URLs.
6403   </para>
6404  </listitem> 
6405  
6406  </itemizedlist>
6407 </para>
6408
6409 </sect2>
6410
6411
6412 <!--   ~~~~~       New section      ~~~~~     -->
6413 <sect2 id="actionsanat">
6414 <title>Anatomy of an Action</title>
6415
6416 <para>
6417  The way <application>Privoxy</application> applies 
6418  <link linkend="ACTIONS"><quote>actions</quote></link>
6419  and <link linkend="FILTER"><quote>filters</quote></link>
6420  to any given URL can be complex, and not always so
6421  easy to understand what is happening. And sometimes we need to be able to
6422  <emphasis>see</emphasis> just what <application>Privoxy</application> is
6423  doing. Especially, if something <application>Privoxy</application> is doing
6424  is causing us a problem inadvertently. It can be a little daunting to look at
6425  the actions and filters files themselves, since they tend to be filled with
6426  <quote>regular expressions</quote> whose consequences are not always 
6427  so obvious. 
6428 </para>
6429
6430 <para>
6431  One quick test to see if <application>Privoxy</application> is causing a problem 
6432  or not, is to disable it temporarily. This should be the first troubleshooting 
6433  step. See <link linkend="bookmarklets">the Bookmarklets</link> section on a quick 
6434  and easy way to do this (be sure to flush caches afterward!).
6435 </para>
6436
6437 <para>
6438  <application>Privoxy</application> also provides the 
6439  <ulink url="http://config.privoxy.org/show-url-info">http://config.privoxy.org/show-url-info</ulink>
6440  page that can show us very specifically how <application>actions</application>
6441  are being applied to any given URL. This is a big help for troubleshooting.
6442 </para>
6443
6444 <para>
6445  First, enter one URL (or partial URL) at the prompt, and then
6446  <application>Privoxy</application> will tell us 
6447  how the current configuration will handle it. This will not
6448  help with filtering effects (i.e. the <link
6449  linkend="FILTER"><quote>+filter</quote></link> action) from
6450  the <filename>default.filter</filename> file since this is handled very
6451  differently and not so easy to trap! It also will not tell you about any other
6452  URLs that may be embedded within the URL you are testing. For instance, images
6453  such as ads are expressed as URLs within the raw page source of HTML pages. So
6454  you will only get info for the actual URL that is pasted into the prompt area
6455  -- not any sub-URLs. If you want to know about embedded URLs like ads, you
6456  will have to dig those out of the HTML source. Use your browser's <quote>View
6457  Page Source</quote> option for this. Or right click on the ad, and grab the
6458  URL.
6459 </para>
6460
6461 <para>
6462  Let's try an example, <ulink url="http://google.com">google.com</ulink>, 
6463  and look at it one section at a time:
6464 </para>
6465
6466 <para>
6467  <screen>
6468  Matches for http://google.com:
6469
6470 --- File standard ---
6471 (no matches in this file)
6472
6473 --- File default ---
6474
6475 { -add-header -block +deanimate-gifs{last} -downgrade-http-version +fast-redirects 
6476  -filter{popups} -filter{fun} -filter{shockwave-flash} -filter{crude-parental} 
6477  +filter{html-annoyances} +filter{js-annoyances} +filter{content-cookies} 
6478  +filter{webbugs} +filter{refresh-tags} +filter{nimda} +filter{banners-by-size} 
6479  +hide-forwarded-for-headers +hide-from-header{block} +hide-referer{forge} 
6480  -hide-user-agent -handle-as-image +set-image-blocker{pattern} -limit-connect 
6481  +prevent-compression +session-cookies-only -crunch-outgoing-cookies 
6482  -crunch-incoming-cookies -kill-popups -send-vanilla-wafer -send-wafer }
6483 /
6484
6485  { -session-cookies-only }
6486  .google.com
6487
6488  { -fast-redirects }
6489  .google.com
6490
6491 --- File user ---
6492 (no matches in this file)  
6493 </screen>
6494 </para>
6495
6496 <para>
6497  This tells us how we have defined our 
6498  <link linkend="ACTIONS"><quote>actions</quote></link>, and
6499  which ones match for our example, <quote>google.com</quote>. The first listing
6500  is any matches for the <filename>standard.action</filename> file. No hits at
6501  all here on <quote>standard</quote>. Then next is <quote>default</quote>, or
6502  our <filename>default.action</filename> file. The large, multi-line listing,
6503  is how the actions are set to match for all URLs, i.e. our default settings.
6504  If you look at your <quote>actions</quote> file, this would be the section
6505  just below the <quote>aliases</quote> section near the top. This will apply to
6506  all URLs as signified by the single forward slash at the end of the listing
6507  -- <quote>/</quote>.
6508 </para>
6509
6510 <para>
6511  But we can define additional actions that would be exceptions to these general
6512  rules, and then list specific URLs (or patterns) that these exceptions would
6513  apply to. Last match wins. Just below this then are two explicit matches for
6514  <quote>.google.com</quote>. The first is negating our previous cookie setting, 
6515  which was for <link
6516  linkend="SESSION-COOKIES-ONLY"><quote>+session-cookies-only</quote></link>
6517  (i.e. not persistent). So we will allow persistent cookies for google. The
6518  second turns <emphasis>off</emphasis> any 
6519  <link
6520  linkend="FAST-REDIRECTS"><quote>+fast-redirects</quote></link>
6521  action, allowing this to take place unmolested. Note that there is a leading
6522  dot here -- <quote>.google.com</quote>. This will match any hosts and
6523  sub-domains, in the google.com domain also, such as
6524  <quote>www.google.com</quote>. So, apparently, we have these two actions
6525  defined somewhere in the lower part of our <filename>default.action</filename>
6526  file, and <quote>google.com</quote> is referenced somewhere in these latter
6527  sections.
6528 </para>
6529
6530 <para>
6531  Then, for our <filename>user.action</filename> file, we again have no hits.
6532 </para>
6533
6534 <para>
6535  And finally we pull it all together in the bottom section and summarize how
6536  <application>Privoxy</application> is applying all its <quote>actions</quote> 
6537  to <quote>google.com</quote>:
6538
6539 </para>
6540
6541 <para>
6542  <screen>
6543
6544  Final results:
6545  -add-header -block +deanimate-gifs{last} -downgrade-http-version -fast-redirects 
6546  -filter{popups} -filter{fun} -filter{shockwave-flash} -filter{crude-parental} 
6547  +filter{html-annoyances} +filter{js-annoyances} +filter{content-cookies} 
6548  +filter{webbugs} +filter{refresh-tags} +filter{nimda} +filter{banners-by-size} 
6549  +hide-forwarded-for-headers +hide-from-header{block} +hide-referer{forge} 
6550  -hide-user-agent -handle-as-image +set-image-blocker{pattern} -limit-connect 
6551  +prevent-compression -session-cookies-only -crunch-outgoing-cookies 
6552  -crunch-incoming-cookies -kill-popups -send-vanilla-wafer -send-wafer
6553 </screen>
6554 </para>
6555
6556 <para>
6557  Notice the only difference here to the previous listing, is to 
6558  <quote>fast-redirects</quote> and <quote>session-cookies-only</quote>.
6559 </para>
6560
6561 <para>
6562  Now another example, <quote>ad.doubleclick.net</quote>:
6563 </para>
6564
6565 <para>
6566  <screen>
6567
6568  { +block +handle-as-image }
6569   .ad.doubleclick.net
6570
6571  { +block +handle-as-image }
6572   ad*.
6573
6574  { +block +handle-as-image }
6575   .doubleclick.net
6576 </screen>
6577 </para>
6578
6579 <para>
6580  We'll just show the interesting part here, the explicit matches. It is 
6581  matched three different times. Each as an <quote>+block +handle-as-image</quote>,
6582  which is the expanded form of one of our aliases that had been defined as: 
6583  <quote>+imageblock</quote>. (<link
6584  linkend="ALIASES"><quote>Aliases</quote></link> are defined in
6585  the first section of the actions file and typically used to combine more 
6586  than one action.)
6587 </para>
6588
6589 <para>
6590  Any one of these would have done the trick and blocked this as an unwanted 
6591  image. This is unnecessarily redundant since the last case effectively 
6592  would also cover the first. No point in taking chances with these guys 
6593  though ;-) Note that if you want an ad or obnoxious 
6594  URL to be invisible, it should be defined as <quote>ad.doubleclick.net</quote>
6595  is done here -- as both a <link
6596  linkend="BLOCK"><quote>+block</quote></link>
6597  <emphasis>and</emphasis> an 
6598  <link
6599  linkend="HANDLE-AS-IMAGE"><quote>+handle-as-image</quote></link>.
6600  The custom alias <quote>+imageblock</quote> just simplifies the process and make 
6601  it more readable.
6602 </para>
6603
6604 <para>
6605  One last example. Let's try <quote>http://www.rhapsodyk.net/adsl/HOWTO/</quote>.
6606  This one is giving us problems. We are getting a blank page. Hmmm...
6607 </para>
6608
6609 <para>
6610  <screen>
6611
6612  Matches for http://www.rhapsodyk.net/adsl/HOWTO/:
6613
6614  { -add-header -block +deanimate-gifs -downgrade-http-version +fast-redirects 
6615    +filter{html-annoyances} +filter{js-annoyances} +filter{kill-popups} 
6616    +filter{webbugs} +filter{nimda} +filter{banners-by-size} +filter{hal} 
6617    +filter{fun} +hide-forwarded-for-headers +hide-from-header{block} 
6618    +hide-referer{forge} -hide-user-agent -handle-as-image +set-image-blocker{blank} 
6619    +prevent-compression +session-cookies-only -crunch-incoming-cookies 
6620    -crunch-outgoing-cookies +kill-popups -send-vanilla-wafer -send-wafer }
6621    /
6622
6623  { +block +handle-as-image }
6624   /ads
6625 </screen>
6626 </para>
6627
6628 <para>
6629  Ooops, the <quote>/adsl/</quote> is matching <quote>/ads</quote>! But 
6630  we did not want this at all! Now we see why we get the blank page. We could
6631  now add a new action below this that explicitly does <emphasis>not</emphasis>
6632  block (<quote>{-block}</quote>) paths with <quote>adsl</quote>. There are
6633  various ways to handle such exceptions. Example:
6634 </para>
6635
6636 <para>
6637  <screen>
6638
6639  { -block }
6640   /adsl
6641 </screen>
6642 </para>
6643
6644 <para>
6645  Now the page displays ;-) Be sure to flush your browser's caches when 
6646  making such changes. Or, try using <literal>Shift+Reload</literal>.
6647 </para>
6648
6649 <para>
6650  But now what about a situation where we get no explicit matches like 
6651  we did with:
6652 </para>
6653
6654 <para>
6655  <screen>
6656
6657  { +block +handle-as-image }
6658  /ads
6659 </screen>
6660 </para>
6661
6662 <para>
6663  That actually was very telling and pointed us quickly to where the problem
6664  was. If you don't get this kind of match, then it means one of the default 
6665  rules in the first section is causing the problem. This would require some 
6666  guesswork, and maybe a little trial and error to isolate the offending rule.
6667  One likely cause would be one of the <quote>{+filter}</quote> actions. Try 
6668  adding the URL for the site to one of aliases that turn off <quote>+filter</quote>:
6669 </para>
6670
6671 <para>
6672  <screen>
6673
6674  {shop}
6675  .quietpc.com
6676  .worldpay.com   # for quietpc.com
6677  .jungle.com
6678  .scan.co.uk
6679  .forbes.com
6680 </screen>
6681 </para>
6682
6683 <para>
6684  <quote>{shop}</quote> is an <quote>alias</quote> that expands to 
6685  <quote>{ -filter -session-cookies-only }</quote>.
6686  Or you could do your own exception to negate filtering:
6687
6688 </para>
6689
6690 <para>
6691  <screen>
6692
6693  {-filter}
6694  .forbes.com
6695 </screen>
6696 </para>
6697
6698 <para>
6699  This would probably be most appropriately put in <filename>user.action</filename>, 
6700  for local site exceptions.
6701 </para>
6702
6703 <para>
6704  <quote>{fragile}</quote> is an alias that disables most actions. This can be 
6705  used as a last resort for problem sites. Remember to flush caches! If this 
6706  still does not work, you will have to go through the remaining actions one by
6707  one to find which one(s) is causing the problem.
6708 </para>
6709
6710 </sect2>
6711
6712 </sect1>
6713
6714  <!--
6715
6716  This program is free software; you can redistribute it 
6717  and/or modify it under the terms of the GNU General
6718  Public License as published by the Free Software
6719  Foundation; either version 2 of the License, or (at
6720  your option) any later version.
6721
6722  This program is distributed in the hope that it will
6723  be useful, but WITHOUT ANY WARRANTY; without even the
6724  implied warranty of MERCHANTABILITY or FITNESS FOR A
6725  PARTICULAR PURPOSE.  See the GNU General Public
6726  License for more details.
6727
6728  The GNU General Public License should be included with
6729  this file.  If not, you can view it at
6730  http://www.gnu.org/copyleft/gpl.html
6731  or write to the Free Software Foundation, Inc., 59
6732  Temple Place - Suite 330, Boston, MA  02111-1307, USA.
6733
6734  $Log: user-manual.sgml,v $
6735  Revision 1.114  2002/05/16 09:42:50  oes
6736  More ulink->link, added some hints to Quickstart section
6737
6738  Revision 1.113  2002/05/15 21:07:25  oes
6739  Extended and further commented the example actions files
6740
6741  Revision 1.112  2002/05/15 03:57:14  hal9
6742  Spell check. A few minor edits here and there for better syntax and
6743  clarification.
6744
6745  Revision 1.111  2002/05/14 23:01:36  oes
6746  Fixing the fixes   
6747
6748  Revision 1.110  2002/05/14 19:10:45  oes
6749  Restored alphabetical order of actions
6750
6751  Revision 1.109  2002/05/14 17:23:11  oes
6752  Renamed the prevent-*-cookies actions, extended aliases section and moved it before the example AFs
6753
6754  Revision 1.108  2002/05/14 15:29:12  oes
6755  Completed proofreading the actions chapter
6756
6757  Revision 1.107  2002/05/12 03:20:41  hal9
6758  Small clarifications for 127.0.0.1 vs localhost for listen-address since this
6759  apparently an important distinction for some OS's.
6760
6761  Revision 1.106  2002/05/10 01:48:20  hal9
6762  This is mostly proposed copyright/licensing additions and changes. Docs
6763  are still GPL, but licensing and copyright are more visible. Also, copyright
6764  changed in doc header comments (eliminate references to JB except FAQ).
6765
6766  Revision 1.105  2002/05/05 20:26:02  hal9
6767  Sorting out license vs copyright in these docs.
6768
6769  Revision 1.104  2002/05/04 08:44:45  swa
6770  bumped version
6771
6772  Revision 1.103  2002/05/04 00:40:53  hal9
6773  -Remove the TOC first page kludge. It's fixed proper now in ldp.dsl.in.
6774  -Some minor additions to Quickstart.
6775
6776  Revision 1.102  2002/05/03 17:46:00  oes
6777  Further proofread & reactivated short build instructions
6778
6779  Revision 1.101  2002/05/03 03:58:30  hal9
6780  Move the user-manual config directive to top of section. Add note about
6781  Privoxy needing read permissions for configs, and write for logs.
6782
6783  Revision 1.100  2002/04/29 03:05:55  hal9
6784  Add clarification on differences of new actions files.
6785
6786  Revision 1.99  2002/04/28 16:59:05  swa
6787  more structure in starting section
6788
6789  Revision 1.98  2002/04/28 05:43:59  hal9
6790  This is the break up of configuration.html into multiple files. This
6791  will probably break links elsewhere :(
6792
6793  Revision 1.97  2002/04/27 21:04:42  hal9
6794  -Rewrite of Actions File example.
6795  -Add section for user-manual directive in config.
6796
6797  Revision 1.96  2002/04/27 05:32:00  hal9
6798  -Add short section to Filter Files to tie in with +filter action.
6799  -Start rewrite of examples in Actions Examples (not finished).
6800
6801  Revision 1.95  2002/04/26 17:23:29  swa
6802  bookmarks cleaned, changed structure of user manual, screen and programlisting cleanups, and numerous other changes that I forgot
6803
6804  Revision 1.94  2002/04/26 05:24:36  hal9
6805  -Add most of Andreas suggestions to Chain of Events section.
6806  -A few other minor corrections and touch up.
6807
6808  Revision 1.92  2002/04/25 18:55:13  hal9
6809  More catchups on new actions files, and new actions names.
6810  Other assorted cleanups, and minor modifications.
6811
6812  Revision 1.91  2002/04/24 02:39:31  hal9
6813  Add 'Chain of Events' section.
6814
6815  Revision 1.90  2002/04/23 21:41:25  hal9
6816  Linuxconf is deprecated on RH, substitute chkconfig.
6817
6818  Revision 1.89  2002/04/23 21:05:28  oes
6819  Added hint for startup on Red Hat
6820
6821  Revision 1.88  2002/04/23 05:37:54  hal9
6822  Add AmigaOS install stuff.
6823
6824  Revision 1.87  2002/04/23 02:53:15  david__schmidt
6825  Updated OSX installation section
6826  Added a few English tweaks here an there
6827
6828  Revision 1.86  2002/04/21 01:46:32  hal9
6829  Re-write actions section.
6830
6831  Revision 1.85  2002/04/18 21:23:23  hal9
6832  Fix ugly typo (mine).
6833
6834  Revision 1.84  2002/04/18 21:17:13  hal9
6835  Spell Redhat correctly (ie Red Hat). A few minor grammar corrections.
6836
6837  Revision 1.83  2002/04/18 18:21:12  oes
6838  Added RPM install detail
6839
6840  Revision 1.82  2002/04/18 12:04:50  oes
6841  Cosmetics
6842
6843  Revision 1.81  2002/04/18 11:50:24  oes
6844  Extended Install section - needs fixing by packagers
6845
6846  Revision 1.80  2002/04/18 10:45:19  oes
6847  Moved text to buildsource.sgml, renamed some filters, details
6848
6849  Revision 1.79  2002/04/18 03:18:06  hal9
6850  Spellcheck, and minor touchups.
6851
6852  Revision 1.78  2002/04/17 18:04:16  oes
6853  Proofreading part 2
6854
6855  Revision 1.77  2002/04/17 13:51:23  oes
6856  Proofreading, part one
6857
6858  Revision 1.76  2002/04/16 04:25:51  hal9
6859  -Added 'Note to Upgraders' and re-ordered the 'Quickstart' section.
6860  -Note about proxy may need requests to re-read config files.
6861
6862  Revision 1.75  2002/04/12 02:08:48  david__schmidt
6863  Remove OS/2 building info... it is already in the developer-manual
6864
6865  Revision 1.74  2002/04/11 00:54:38  hal9
6866  Add small section on submitting actions.
6867
6868  Revision 1.73  2002/04/10 18:45:15  swa
6869  generated
6870
6871  Revision 1.72  2002/04/10 04:06:19  hal9
6872  Added actions feedback  to Bookmarklets section
6873
6874  Revision 1.71  2002/04/08 22:59:26  hal9
6875  Version update. Spell chkconfig correctly :)
6876
6877  Revision 1.70  2002/04/08 20:53:56  swa
6878  ?
6879
6880  Revision 1.69  2002/04/06 05:07:29  hal9
6881  -Add privoxy-man-page.sgml, for man page.
6882  -Add authors.sgml for AUTHORS (and p-authors.sgml)
6883  -Reworked various aspects of various docs.
6884  -Added additional comments to sub-docs.
6885
6886  Revision 1.68  2002/04/04 18:46:47  swa
6887  consistent look. reuse of copyright, history et. al.
6888
6889  Revision 1.67  2002/04/04 17:27:57  swa
6890  more single file to be included at multiple points. make maintaining easier
6891
6892  Revision 1.66  2002/04/04 06:48:37  hal9
6893  Structural changes to allow for conditional inclusion/exclusion of content
6894  based on entity toggles, e.g. 'entity % p-not-stable  "INCLUDE"'. And
6895  definition of internal entities, e.g. 'entity p-version "2.9.13"' that will
6896  eventually be set by Makefile.
6897  More boilerplate text for use across multiple docs.
6898
6899  Revision 1.65  2002/04/03 19:52:07  swa
6900  enhance squid section due to user suggestion
6901
6902  Revision 1.64  2002/04/03 03:53:43  hal9
6903  A few minor bug fixes, and touch ups. Ready for review.
6904
6905  Revision 1.63  2002/04/01 16:24:49  hal9
6906  Define entities to include boilerplate text. See doc/source/*.
6907
6908  Revision 1.62  2002/03/30 04:15:53  hal9
6909  - Fix privoxy.org/config links.
6910  - Paste in Bookmarklets from Toggle page.
6911  - Move Quickstart nearer top, and minor rework.
6912
6913  Revision 1.61  2002/03/29 01:31:08  hal9
6914  Minor update.
6915
6916  Revision 1.60  2002/03/27 01:57:34  hal9
6917  Added more to Anatomy section.
6918
6919  Revision 1.59  2002/03/27 00:54:33  hal9
6920  Touch up intro for new name.
6921
6922  Revision 1.58  2002/03/26 22:29:55  swa
6923  we have a new homepage!
6924
6925  Revision 1.57  2002/03/24 20:33:30  hal9
6926  A few minor catch ups with name change.
6927
6928  Revision 1.56  2002/03/24 16:17:06  swa
6929  configure needs to be generated.
6930
6931  Revision 1.55  2002/03/24 16:08:08  swa
6932  we are too lazy to make a block-built
6933  privoxy logo. hence removed the option.
6934
6935  Revision 1.54  2002/03/24 15:46:20  swa
6936  name change related issue.
6937
6938  Revision 1.53  2002/03/24 11:51:00  swa
6939  name change. changed filenames.
6940
6941  Revision 1.52  2002/03/24 11:01:06  swa
6942  name change
6943
6944  Revision 1.51  2002/03/23 15:13:11  swa
6945  renamed every reference to the old name with foobar.
6946  fixed "application foobar application" tag, fixed
6947  "the foobar" with "foobar". left junkbustser in cvs
6948  comments and remarks to history untouched.
6949
6950  Revision 1.50  2002/03/23 05:06:21  hal9
6951  Touch up.
6952
6953  Revision 1.49  2002/03/21 17:01:05  hal9
6954  New section in Appendix.
6955
6956  Revision 1.48  2002/03/12 06:33:01  hal9
6957  Catching up to Andreas and re_filterfile changes.
6958
6959  Revision 1.47  2002/03/11 13:13:27  swa
6960  correct feedback channels
6961
6962  Revision 1.46  2002/03/10 00:51:08  hal9
6963  Added section on JB internal pages in Appendix.
6964
6965  Revision 1.45  2002/03/09 17:43:53  swa
6966  more distros
6967
6968  Revision 1.44  2002/03/09 17:08:48  hal9
6969  New section on Jon's actions file editor, and move some stuff around.
6970
6971  Revision 1.43  2002/03/08 00:47:32  hal9
6972  Added imageblock{pattern}.
6973
6974  Revision 1.42  2002/03/07 18:16:55  swa
6975  looks better
6976
6977  Revision 1.41  2002/03/07 16:46:43  hal9
6978  Fix a few markup problems for jade.
6979
6980  Revision 1.40  2002/03/07 16:28:39  swa
6981  provide correct feedback channels
6982
6983  Revision 1.39  2002/03/06 16:19:28  hal9
6984  Note on perceived filtering slowdown per FR.
6985
6986  Revision 1.38  2002/03/05 23:55:14  hal9
6987  Stupid I did it again. Double hyphen in comment breaks jade.
6988
6989  Revision 1.37  2002/03/05 23:53:49  hal9
6990  jade barfs on '- -' embedded in comments. - -user option broke it.
6991
6992  Revision 1.36  2002/03/05 22:53:28  hal9
6993  Add new - - user option.
6994
6995  Revision 1.35  2002/03/05 00:17:27  hal9
6996  Added section on command line options.
6997
6998  Revision 1.34  2002/03/04 19:32:07  oes
6999  Changed default port to 8118
7000
7001  Revision 1.33  2002/03/03 19:46:13  hal9
7002  Emphasis on where/how to report bugs, etc
7003
7004  Revision 1.32  2002/03/03 09:26:06  joergs
7005  AmigaOS changes, config is now loaded from PROGDIR: instead of
7006  AmiTCP:db/junkbuster/ if no configuration file is specified on the
7007  command line.
7008
7009  Revision 1.31  2002/03/02 22:45:52  david__schmidt
7010  Just tweaking
7011
7012  Revision 1.30  2002/03/02 22:00:14  hal9
7013  Updated 'New Features' list. Ran through spell-checker.
7014
7015  Revision 1.29  2002/03/02 20:34:07  david__schmidt
7016  Update OS/2 build section
7017
7018  Revision 1.28  2002/02/24 14:34:24  jongfoster
7019  Formatting changes.  Now changing the doctype to DocBook XML 4.1
7020  will work - no other changes are needed.
7021
7022  Revision 1.27  2002/01/11 14:14:32  hal9
7023  Added a very short section on Templates
7024
7025  Revision 1.26  2002/01/09 20:02:50  hal9
7026  Fix bug re: auto-detect config file changes.
7027
7028  Revision 1.25  2002/01/09 18:20:30  hal9
7029  Touch ups for *.action files.
7030
7031  Revision 1.24  2001/12/02 01:13:42  hal9
7032  Fix typo.
7033
7034  Revision 1.23  2001/12/02 00:20:41  hal9
7035  Updates for recent changes.
7036
7037  Revision 1.22  2001/11/05 23:57:51  hal9
7038  Minor update for startup now daemon mode.
7039
7040  Revision 1.21  2001/10/31 21:11:03  hal9
7041  Correct 2 minor errors
7042
7043  Revision 1.18  2001/10/24 18:45:26  hal9
7044  *** empty log message ***
7045
7046  Revision 1.17  2001/10/24 17:10:55  hal9
7047  Catching up with Jon's recent work, and a few other things.
7048
7049  Revision 1.16  2001/10/21 17:19:21  swa
7050  wrong url in documentation
7051
7052  Revision 1.15  2001/10/14 23:46:24  hal9
7053  Various minor changes. Fleshed out SEE ALSO section.
7054
7055  Revision 1.13  2001/10/10 17:28:33  hal9
7056  Very minor changes.
7057
7058  Revision 1.12  2001/09/28 02:57:04  hal9
7059  Ditto :/
7060
7061  Revision 1.11  2001/09/28 02:25:20  hal9
7062  Ditto.
7063
7064  Revision 1.9  2001/09/27 23:50:29  hal9
7065  A few changes. A short section on regular expression in appendix.
7066
7067  Revision 1.8  2001/09/25 00:34:59  hal9
7068  Some additions, and re-arranging.
7069
7070  Revision 1.7  2001/09/24 14:31:36  hal9
7071  Diddling.
7072
7073  Revision 1.6  2001/09/24 14:10:32  hal9
7074  Including David's OS/2 installation instructions.
7075
7076  Revision 1.2  2001/09/13 15:27:40  swa
7077  cosmetics
7078
7079  Revision 1.1  2001/09/12 15:36:41  swa
7080  source files for junkbuster documentation
7081
7082  Revision 1.3  2001/09/10 17:43:59  swa
7083  first proposal of a structure.
7084
7085  Revision 1.2  2001/06/13 14:28:31  swa
7086  docs should have an author.
7087
7088  Revision 1.1  2001/06/13 14:20:37  swa
7089  first import of project's documentation for the webserver.
7090
7091  -->
7092
7093 </article>