generated
[privoxy.git] / doc / webserver / user-manual / appendix.html
index b84606d..e38d503 100644 (file)
@@ -65,7 +65,7 @@ CLASS="SECT1"
 CLASS="SECT1"
 ><A
 NAME="APPENDIX"
->9. Appendix</A
+>14. Appendix</A
 ></H1
 ><DIV
 CLASS="SECT2"
@@ -73,7 +73,7 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="REGEX"
->9.1. Regular Expressions</A
+>14.1. Regular Expressions</A
 ></H2
 ><P
 > <SPAN
@@ -159,6 +159,7 @@ CLASS="QUOTE"
  building complex patterns however. Let's look at a few of the common ones,
  and then some examples:</P
 ><P
+><P
 ></P
 ><TABLE
 BORDER="0"
@@ -191,6 +192,8 @@ CLASS="QUOTE"
 ></TABLE
 ><P
 ></P
+></P
+><P
 ><P
 ></P
 ><TABLE
@@ -209,6 +212,8 @@ CLASS="EMPHASIS"
 ></TABLE
 ><P
 ></P
+></P
+><P
 ><P
 ></P
 ><TABLE
@@ -227,6 +232,8 @@ CLASS="EMPHASIS"
 ></TABLE
 ><P
 ></P
+></P
+><P
 ><P
 ></P
 ><TABLE
@@ -245,6 +252,8 @@ CLASS="EMPHASIS"
 ></TABLE
 ><P
 ></P
+></P
+><P
 ><P
 ></P
 ><TABLE
@@ -264,13 +273,20 @@ CLASS="QUOTE"
 CLASS="QUOTE"
 >"."</SPAN
 >) needs to be taken literally and
-  not as a special meta-character.
+  not as a special meta-character. Example: <SPAN
+CLASS="QUOTE"
+>"example\.com"</SPAN
+>, makes 
+  sure the period is recognized only as a period (and not expanded to its 
+  meta-character meaning of any single character).
  </TD
 ></TR
 ></TBODY
 ></TABLE
 ><P
 ></P
+></P
+><P
 ><P
 ></P
 ><TABLE
@@ -282,13 +298,26 @@ BORDER="0"
 CLASS="EMPHASIS"
 >[]</I
 > - Characters enclosed in brackets will be matched if
-  any of the enclosed characters are encountered.
+  any of the enclosed characters are encountered. For instance, <SPAN
+CLASS="QUOTE"
+>"[0-9]"</SPAN
+>
+  matches any numeric digit (zero through nine). As an example, we can combine 
+  this with <SPAN
+CLASS="QUOTE"
+>"+"</SPAN
+> to match any digit one of more times: <SPAN
+CLASS="QUOTE"
+>"[0-9]+"</SPAN
+>.
  </TD
 ></TR
 ></TBODY
 ></TABLE
 ><P
 ></P
+></P
+><P
 ><P
 ></P
 ><TABLE
@@ -307,6 +336,8 @@ CLASS="EMPHASIS"
 ></TABLE
 ><P
 ></P
+></P
+><P
 ><P
 ></P
 ><TABLE
@@ -328,13 +359,27 @@ CLASS="QUOTE"
   sub-expression on either side of <SPAN
 CLASS="QUOTE"
 >"|"</SPAN
-> matches.
+> matches. As an example:
+  <SPAN
+CLASS="QUOTE"
+>"/(this|that) example/"</SPAN
+> uses grouping and the bar character 
+  and would match either <SPAN
+CLASS="QUOTE"
+>"this example"</SPAN
+> or <SPAN
+CLASS="QUOTE"
+>"that
+  example"</SPAN
+>, and nothing else.
  </TD
 ></TR
 ></TBODY
 ></TABLE
 ><P
 ></P
+></P
+><P
 ><P
 ></P
 ><TABLE
@@ -353,13 +398,17 @@ CLASS="QUOTE"
 CLASS="QUOTE"
 >"string2"</SPAN
 > in this
-  example.
+  example. There must of course be a match on <SPAN
+CLASS="QUOTE"
+>"string1"</SPAN
+> first.
  </TD
 ></TR
 ></TBODY
 ></TABLE
 ><P
 ></P
+></P
 ><P
 > These are just some of the ones you are likely to use when matching URLs with 
  <SPAN
@@ -702,8 +751,8 @@ CLASS="SECT2"
 ><H2
 CLASS="SECT2"
 ><A
-NAME="AEN1587"
->9.2. <SPAN
+NAME="AEN2718"
+>14.2. <SPAN
 CLASS="APPLICATION"
 >Privoxy</SPAN
 >'s Internal Pages</A
@@ -751,7 +800,7 @@ CLASS="APPLICATION"
    Privoxy main page: 
   </P
 ><A
-NAME="AEN1602"
+NAME="AEN2733"
 ></A
 ><BLOCKQUOTE
 CLASS="BLOCKQUOTE"
@@ -776,10 +825,11 @@ TARGET="_top"
 ><LI
 ><P
 >  
-    Show information about the current configuration: 
+    Show information about the current configuration, including viewing and 
+    editing of actions files:
   </P
 ><A
-NAME="AEN1609"
+NAME="AEN2740"
 ></A
 ><BLOCKQUOTE
 CLASS="BLOCKQUOTE"
@@ -799,7 +849,7 @@ TARGET="_top"
     Show the source code version numbers:
   </P
 ><A
-NAME="AEN1614"
+NAME="AEN2745"
 ></A
 ><BLOCKQUOTE
 CLASS="BLOCKQUOTE"
@@ -816,10 +866,10 @@ TARGET="_top"
 ><LI
 ><P
 >  
-   Show the client's request headers:
+   Show the browser's request headers:
   </P
 ><A
-NAME="AEN1619"
+NAME="AEN2750"
 ></A
 ><BLOCKQUOTE
 CLASS="BLOCKQUOTE"
@@ -839,7 +889,7 @@ TARGET="_top"
    Show which actions apply to a URL and why:
   </P
 ><A
-NAME="AEN1624"
+NAME="AEN2755"
 ></A
 ><BLOCKQUOTE
 CLASS="BLOCKQUOTE"
@@ -863,7 +913,7 @@ CLASS="QUOTE"
    to run, but only as a pass-through proxy, with no actions taking place:
   </P
 ><A
-NAME="AEN1630"
+NAME="AEN2761"
 ></A
 ><BLOCKQUOTE
 CLASS="BLOCKQUOTE"
@@ -880,7 +930,7 @@ TARGET="_top"
 >   Short cuts. Turn off, then on: 
   </P
 ><A
-NAME="AEN1634"
+NAME="AEN2765"
 ></A
 ><BLOCKQUOTE
 CLASS="BLOCKQUOTE"
@@ -894,7 +944,7 @@ TARGET="_top"
    </P
 ></BLOCKQUOTE
 ><A
-NAME="AEN1637"
+NAME="AEN2768"
 ></A
 ><BLOCKQUOTE
 CLASS="BLOCKQUOTE"
@@ -908,48 +958,34 @@ TARGET="_top"
    </P
 ></BLOCKQUOTE
 ></LI
-><LI
-><P
->  
-   Edit the actions list file:
-  </P
-><A
-NAME="AEN1642"
-></A
-><BLOCKQUOTE
-CLASS="BLOCKQUOTE"
-><P
-> 
-    <A
-HREF="http://config.privoxy.org/edit-actions"
-TARGET="_top"
->http://config.privoxy.org/edit-actions</A
->
-   </P
-></BLOCKQUOTE
-></LI
 ></UL
 ></P
 ><P
-> These may be bookmarked for quick reference.&#13;</P
+> These may be bookmarked for quick reference. See next.&#13;</P
 ><DIV
 CLASS="SECT3"
 ><H3
 CLASS="SECT3"
 ><A
 NAME="BOOKMARKLETS"
->9.2.1. Bookmarklets</A
+>14.2.1. Bookmarklets</A
 ></H3
 ><P
-> Here are some bookmarklets to allow you to easily access a
+> Below are some <SPAN
+CLASS="QUOTE"
+>"bookmarklets"</SPAN
+> to allow you to easily access a
  <SPAN
 CLASS="QUOTE"
 >"mini"</SPAN
-> version of this page. They are designed for MS Internet
- Explorer, but should work equally well in Netscape, Mozilla, and other
- browsers which support JavaScript. They are designed to run directly from
- your bookmarks - not by clicking the links below (although that will work for
- testing).</P
+> version of some of <SPAN
+CLASS="APPLICATION"
+>Privoxy's</SPAN
+>
+ special pages. They are designed for MS Internet Explorer, but should work
+ equally well in Netscape, Mozilla, and other browsers which support
+ JavaScript. They are designed to run directly from your bookmarks - not by
+ clicking the links below (although that should work for testing).</P
 ><P
 > To save them, right-click the link and choose <SPAN
 CLASS="QUOTE"
@@ -963,7 +999,7 @@ CLASS="QUOTE"
 CLASS="QUOTE"
 >"may not be safe"</SPAN
 > - just click OK. Then you can run the
- Bookmarklet directly from your favourites/bookmarks. For even faster access,
+ Bookmarklet directly from your favorites/bookmarks. For even faster access,
  you can put them on the <SPAN
 CLASS="QUOTE"
 >"Links"</SPAN
@@ -981,7 +1017,7 @@ CLASS="QUOTE"
 >    <A
 HREF="javascript:void(window.open('http://config.privoxy.org/toggle?mini=y&set=enabled','ijbstatus','width=250,height=100,resizable=yes,scrollbars=no,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());"
 TARGET="_top"
->Enable Privoxy</A
+>Privoxy - Enable</A
 >
    </P
 ></LI
@@ -990,7 +1026,7 @@ TARGET="_top"
 >    <A
 HREF="javascript:void(window.open('http://config.privoxy.org/toggle?mini=y&set=disabled','ijbstatus','width=250,height=100,resizable=yes,scrollbars=no,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());"
 TARGET="_top"
->Disable Privoxy</A
+>Privoxy - Disable</A
 >
    </P
 ></LI
@@ -999,7 +1035,7 @@ TARGET="_top"
 >    <A
 HREF="javascript:void(window.open('http://config.privoxy.org/toggle?mini=y&set=toggle','ijbstatus','width=250,height=100,resizable=yes,scrollbars=no,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());"
 TARGET="_top"
->Toggle Privoxy</A
+>Privoxy - Toggle Privoxy</A
 > (Toggles between enabled and disabled)
    </P
 ></LI
@@ -1008,7 +1044,16 @@ TARGET="_top"
 >    <A
 HREF="javascript:void(window.open('http://config.privoxy.org/toggle?mini=y','ijbstatus','width=250,height=2,resizable=yes,scrollbars=no,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());"
 TARGET="_top"
->View Privoxy Status</A
+>Privoxy- View Status</A
+>
+   </P
+></LI
+><LI
+><P
+>    <A
+HREF="javascript:w=Math.floor(screen.width/2);h=Math.floor(screen.height*0.9);void(window.open('http://www.privoxy.org/actions','Feedback','screenx='+w+',width='+w+',height='+h+',scrollbars=yes,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());"
+TARGET="_top"
+>Privoxy - Submit Filter Feedback</A
 >
    </P
 ></LI
@@ -1029,21 +1074,270 @@ CLASS="SECT2"
 ><H2
 CLASS="SECT2"
 ><A
+NAME="CHAIN"
+>14.3. Chain of Events</A
+></H2
+><P
+> Let's take a quick look at the basic sequence of events when a web page is 
+ requested by your browser and <SPAN
+CLASS="APPLICATION"
+>Privoxy</SPAN
+> is on duty:</P
+><P
+> <P
+></P
+><UL
+><LI
+><P
+>   First, your web browser requests a web page. The browser knows to send 
+   the request to <SPAN
+CLASS="APPLICATION"
+>Privoxy</SPAN
+>, which will in turn, 
+   relay the request to the remote web server after passing the following 
+   tests: 
+  </P
+></LI
+><LI
+><P
+>   <SPAN
+CLASS="APPLICATION"
+>Privoxy</SPAN
+> traps any request for its own internal CGI 
+   pages (e.g http://p.p/) and sends the CGI page back to the browser.
+  </P
+></LI
+><LI
+><P
+>   Next, <SPAN
+CLASS="APPLICATION"
+>Privoxy</SPAN
+> checks to see if the URL 
+   matches any <A
+HREF="actions-file.html#BLOCK"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+block"</SPAN
+></A
+> patterns. If
+   so, the URL is then blocked, and the remote web server will not be contacted.
+   <A
+HREF="actions-file.html#HANDLE-AS-IMAGE"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+handle-as-image"</SPAN
+></A
+> 
+   is then checked and if it does not match, an 
+   HTML <SPAN
+CLASS="QUOTE"
+>"BLOCKED"</SPAN
+> page is sent back. Otherwise, if it does match,
+   an image is returned. The type of image depends on the setting of <A
+HREF="actions-file.html#SET-IMAGE-BLOCKER"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+set-image-blocker"</SPAN
+></A
+>
+   (blank, checkerboard pattern, or an HTTP redirect to an image elsewhere).
+  </P
+></LI
+><LI
+><P
+>   Untrusted URLs are blocked. If URLs are being added to the
+   <TT
+CLASS="FILENAME"
+>trust</TT
+> file, then that is done.
+  </P
+></LI
+><LI
+><P
+>   If the URL pattern matches the <A
+HREF="actions-file.html#FAST-REDIRECTS"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+fast-redirects"</SPAN
+></A
+> action,
+   it is then processed. Unwanted parts of the requested URL are stripped.
+  </P
+></LI
+><LI
+><P
+>   Now the rest of the client browser's request headers are processed. If any
+   of these match any of the relevant actions (e.g. <A
+HREF="actions-file.html#HIDE-USER-AGENT"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+hide-user-agent"</SPAN
+></A
+>,
+   etc.), headers are suppressed or forged as determined by these actions and
+   their parameters.
+  </P
+></LI
+><LI
+><P
+>   Now the web server starts sending its response back (i.e. typically a web page and related 
+   data).
+  </P
+></LI
+><LI
+><P
+>   First, the server headers are read and processed to determine, among other
+   things, the MIME type (document type) and encoding. The headers are then
+   filtered as deterimed by the 
+   <A
+HREF="actions-file.html#PREVENT-SETTING-COOKIES"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+prevent-setting-cookies"</SPAN
+></A
+>,
+   <A
+HREF="actions-file.html#SESSION-COOKIES-ONLY"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+session-cookies-only"</SPAN
+></A
+>,
+   and <A
+HREF="actions-file.html#DOWNGRADE-HTTP-VERSION"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+downgrade-http-version"</SPAN
+></A
+>
+   actions.
+  </P
+></LI
+><LI
+><P
+>   If the <A
+HREF="actions-file.html#KILL-POPUPS"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+kill-popups"</SPAN
+></A
+>
+   action applies, and it is an HTML or JavaScript document, the popup-code in the
+   response is filtered on-the-fly as it is received.
+  </P
+></LI
+><LI
+><P
+>   If a <A
+HREF="actions-file.html#FILTER"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+filter"</SPAN
+></A
+>
+   or <A
+HREF="actions-file.html#DEANIMATE-GIFS"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+deanimate-gifs"</SPAN
+></A
+>
+   action applies (and the document type fits the action), the rest of the page is
+   read into memory (up to a configurable limit). Then the filter rules (from
+   <TT
+CLASS="FILENAME"
+>default.filter</TT
+>) are processed against the buffered
+   content. Filters are applied in the order they are specified in the
+   <TT
+CLASS="FILENAME"
+>default.filter</TT
+> file. Animated GIFs, if present, are
+   reduced to either the first or last frame, depending on the action
+   setting.The entire page, which is now filtered, is then sent by
+   <SPAN
+CLASS="APPLICATION"
+>Privoxy</SPAN
+> back to your browser. 
+  </P
+><P
+>   If neither <A
+HREF="actions-file.html#FILTER"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+filter"</SPAN
+></A
+>
+   or <A
+HREF="actions-file.html#DEANIMATE-GIFS"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+deanimate-gifs"</SPAN
+></A
+>
+   matches, then <SPAN
+CLASS="APPLICATION"
+>Privoxy</SPAN
+> passes the raw data through 
+   to the client browser as it becomes available.
+  </P
+></LI
+><LI
+><P
+>   As the browser receives the now (probably filtered) page content, it 
+   reads and then requests any URLs that may be embedded within the page
+   source, e.g. ad images, stylesheets, JavaScript, other HTML documents (e.g.
+   frames), sounds, etc. For each of these objects, the browser issues a new
+   request. And each such request is in turn processed as above. Note that a
+   complex web page may have many such embedded URLs.
+  </P
+></LI
+></UL
+></P
+></DIV
+><DIV
+CLASS="SECT2"
+><H2
+CLASS="SECT2"
+><A
 NAME="ACTIONSANAT"
->9.3. Anatomy of an Action</A
+>14.4. Anatomy of an Action</A
 ></H2
 ><P
 > The way <SPAN
 CLASS="APPLICATION"
 >Privoxy</SPAN
-> applies <SPAN
+> applies 
+ <A
+HREF="actions-file.html#ACTIONS"
+TARGET="_top"
+><SPAN
 CLASS="QUOTE"
 >"actions"</SPAN
+></A
 >
- and <SPAN
+ and <A
+HREF="actions-file.html#FILTER"
+TARGET="_top"
+><SPAN
 CLASS="QUOTE"
 >"filters"</SPAN
-> to any given URL can be complex, and not always so
+></A
+>
+ to any given URL can be complex, and not always so
  easy to understand what is happening. And sometimes we need to be able to
  <I
 CLASS="EMPHASIS"
@@ -1056,16 +1350,29 @@ CLASS="APPLICATION"
 CLASS="APPLICATION"
 >Privoxy</SPAN
 > is doing
- is causing us a problem inadvertantly. It can be a little daunting to look at
+ is causing us a problem inadvertently. It can be a little daunting to look at
  the actions and filters files themselves, since they tend to be filled with
  <SPAN
 CLASS="QUOTE"
 >"regular expressions"</SPAN
 > whose consequences are not always 
- so obvious. <SPAN
+ so obvious. </P
+><P
+> One quick test to see if <SPAN
 CLASS="APPLICATION"
 >Privoxy</SPAN
-> provides the 
+> is causing a problem 
+ or not, is to disable it temporarily. This should be the first troubleshooting 
+ step. See <A
+HREF="appendix.html#BOOKMARKLETS"
+>the Bookmarklets</A
+> section on a quick 
+ and easy way to do this (be sure to flush caches afterward!).</P
+><P
+> <SPAN
+CLASS="APPLICATION"
+>Privoxy</SPAN
+> also provides the 
  <A
 HREF="http://config.privoxy.org/show-url-info"
 TARGET="_top"
@@ -1075,8 +1382,7 @@ TARGET="_top"
 CLASS="APPLICATION"
 >actions</SPAN
 >
- are being applied to any given URL. This is a big help for troubleshooting.
- </P
+ are being applied to any given URL. This is a big help for troubleshooting.</P
 ><P
 > First, enter one URL (or partial URL) at the prompt, and then
  <SPAN
@@ -1084,27 +1390,36 @@ CLASS="APPLICATION"
 >Privoxy</SPAN
 > will tell us 
  how the current configuration will handle it. This will not
- help with filtering effects from the <TT
+ help with filtering effects (i.e. the <A
+HREF="actions-file.html#FILTER"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+filter"</SPAN
+></A
+> action) from
+ the <TT
 CLASS="FILENAME"
 >default.filter</TT
-> file! It
- also will not tell you about any other URLs that may be embedded within the
- URL you are testing. For instance, images such as ads are expressed as URLs
- within the raw page source of HTML pages. So you will only get info for the
- actual URL that is pasted into the prompt area -- not any sub-URLs. If you
- want to know about embedded URLs like ads, you will have to dig those out of
- the HTML source. Use your browser's <SPAN
-CLASS="QUOTE"
->"View Page Source"</SPAN
-> option
- for this. Or right click on the ad, and grab the URL.</P
-><P
-> Let's look at an example, <A
+> file since this is handled very
+ differently and not so easy to trap! It also will not tell you about any other
+ URLs that may be embedded within the URL you are testing. For instance, images
+ such as ads are expressed as URLs within the raw page source of HTML pages. So
+ you will only get info for the actual URL that is pasted into the prompt area
+ -- not any sub-URLs. If you want to know about embedded URLs like ads, you
+ will have to dig those out of the HTML source. Use your browser's <SPAN
+CLASS="QUOTE"
+>"View
+ Page Source"</SPAN
+> option for this. Or right click on the ad, and grab the
+ URL.</P
+><P
+> Let's try an example, <A
 HREF="http://google.com"
 TARGET="_top"
 >google.com</A
 >, 
- one section at a time:</P
and look at it one section at a time:</P
 ><P
 > <TABLE
 BORDER="0"
@@ -1114,118 +1429,137 @@ WIDTH="100%"
 ><TD
 ><PRE
 CLASS="SCREEN"
-> System default actions:
+> Matches for http://google.com:
 
- { -add-header -block -deanimate-gifs -downgrade -fast-redirects -filter 
-   -hide-forwarded -hide-from -hide-referer -hide-user-agent -image 
-   -image-blocker -limit-connect -no-compression -no-cookies-keep 
-   -no-cookies-read -no-cookies-set -no-popups -vanilla-wafer -wafer }
- </PRE
-></TD
-></TR
-></TABLE
-></P
-><P
-> This is the top section, and only tells us of the compiled in defaults. This 
- is basically what <SPAN
-CLASS="APPLICATION"
->Privoxy</SPAN
-> would do if there 
- were not any <SPAN
-CLASS="QUOTE"
->"actions"</SPAN
-> defined, i.e. it does nothing. Every action 
- is disabled. This is not particularly informative for our purposes here. OK,
- next section:</P
-><P
-> <TABLE
-BORDER="0"
-BGCOLOR="#E0E0E0"
-WIDTH="100%"
-><TR
-><TD
-><PRE
-CLASS="SCREEN"
->&#13; Matches for http://google.com:
+--- File standard ---
+(no matches in this file)
 
- { -add-header -block +deanimate-gifs -downgrade +fast-redirects 
-   +filter{html-annoyances} +filter{js-annoyances} +filter{no-popups} 
-   +filter{webbugs} +filter{nimda} +filter{banners-by-size} +filter{hal} 
-   +filter{fun} +hide-forwarded +hide-from{block} +hide-referer{forge} 
-   -hide-user-agent -image +image-blocker{blank} +no-compression 
-   +no-cookies-keep -no-cookies-read -no-cookies-set +no-popups 
-   -vanilla-wafer -wafer }
-   /
+--- File default ---
+
+{ -add-header -block +deanimate-gifs{last} -downgrade-http-version +fast-redirects 
+ -filter{popups} -filter{fun} -filter{shockwave-flash} -filter{crude-parental} 
+ +filter{html-annoyances} +filter{js-annoyances} +filter{content-cookies} 
+ +filter{webbugs} +filter{refresh-tags} +filter{nimda} +filter{banners-by-size} 
+ +hide-forwarded-for-headers +hide-from-header{block} +hide-referer{forge} 
+ -hide-user-agent -handle-as-image +set-image-blocker{pattern} -limit-connect 
+ +prevent-compression +session-cookies-only -prevent-reading-cookies 
+ -prevent-setting-cookies -kill-popups -send-vanilla-wafer -send-wafer }
+/
 
- { -no-cookies-keep -no-cookies-read -no-cookies-set }
 .google.com
+ { -session-cookies-only }
+ .google.com
 
  { -fast-redirects }
 .google.com
+ .google.com
 
- </PRE
+--- File user ---
+(no matches in this file)  </PRE
 ></TD
 ></TR
 ></TABLE
 ></P
 ><P
-> This is much more informative, and tells us how we have defined our 
- <SPAN
+> This tells us how we have defined our 
+ <A
+HREF="actions-file.html#ACTIONS"
+TARGET="_top"
+><SPAN
 CLASS="QUOTE"
 >"actions"</SPAN
->, and which ones match for our example, 
- <SPAN
+></A
+>, and
+ which ones match for our example, <SPAN
 CLASS="QUOTE"
 >"google.com"</SPAN
->. The first grouping shows our default 
- settings, which would apply to all URLs. If you look at your <SPAN
+>. The first listing
+ is any matches for the <TT
+CLASS="FILENAME"
+>standard.action</TT
+> file. No hits at
+ all here on <SPAN
+CLASS="QUOTE"
+>"standard"</SPAN
+>. Then next is <SPAN
+CLASS="QUOTE"
+>"default"</SPAN
+>, or
+ our <TT
+CLASS="FILENAME"
+>default.action</TT
+> file. The large, multi-line listing,
+ is how the actions are set to match for all URLs, i.e. our default settings.
+ If you look at your <SPAN
 CLASS="QUOTE"
 >"actions"</SPAN
->
file, this would be the section just below the <SPAN
+> file, this would be the section
+ just below the <SPAN
 CLASS="QUOTE"
 >"aliases"</SPAN
-> section 
- near the top. This applies to all URLs as signified by the single forward
slash -- <SPAN
+> section near the top. This will apply to
+ all URLs as signified by the single forward slash at the end of the listing
+ -- <SPAN
 CLASS="QUOTE"
 >"/"</SPAN
->.
- </P
+>.</P
 ><P
-> These are the default actions we have enabled. But we can define additional
- actions that would be exceptions to these general rules, and then list 
- specific URLs that these exceptions would apply to. Last match wins.
Just below this then are two explict matches for <SPAN
+> But we can define additional actions that would be exceptions to these general
+ rules, and then list specific URLs (or patterns) that these exceptions would
+ apply to. Last match wins. Just below this then are two explicit matches for
+ <SPAN
 CLASS="QUOTE"
 >".google.com"</SPAN
->.
- The first is negating our various cookie blocking actions (i.e. we will allow
- cookies here). The second is allowing <SPAN
+>. The first is negating our previous cookie setting, 
+ which was for <A
+HREF="actions-file.html#SESSION-COOKIES-ONLY"
+TARGET="_top"
+><SPAN
 CLASS="QUOTE"
->"fast-redirects"</SPAN
->. Note
- that there is a leading dot here -- <SPAN
+>"+session-cookies-only"</SPAN
+></A
+>
+ (i.e. not persistent). So we will allow persistent cookies for google. The
+ second turns <I
+CLASS="EMPHASIS"
+>off</I
+> any 
+ <A
+HREF="actions-file.html#FAST-REDIRECTS"
+TARGET="_top"
+><SPAN
+CLASS="QUOTE"
+>"+fast-redirects"</SPAN
+></A
+>
+ action, allowing this to take place unmolested. Note that there is a leading
+ dot here -- <SPAN
 CLASS="QUOTE"
 >".google.com"</SPAN
->. This will
match any hosts and sub-domains, in the google.com domain also, such as
+>. This will match any hosts and
+ sub-domains, in the google.com domain also, such as
  <SPAN
 CLASS="QUOTE"
 >"www.google.com"</SPAN
->. So, apparently, we have these actions defined
- somewhere in the lower part of our actions file, and
- <SPAN
+>. So, apparently, we have these two actions
+ defined somewhere in the lower part of our <TT
+CLASS="FILENAME"
+>default.action</TT
+>
+ file, and <SPAN
 CLASS="QUOTE"
 >"google.com"</SPAN
-> is referenced in these sections.&#13;</P
+> is referenced somewhere in these latter
+ sections.</P
 ><P
-> And now we pull it altogether in the bottom section and summarize how
+> Then, for our <TT
+CLASS="FILENAME"
+>user.action</TT
+> file, we again have no hits.</P
+><P
+> And finally we pull it all together in the bottom section and summarize how
  <SPAN
 CLASS="APPLICATION"
 >Privoxy</SPAN
-> is appying all its <SPAN
+> is applying all its <SPAN
 CLASS="QUOTE"
 >"actions"</SPAN
 > 
@@ -1243,21 +1577,28 @@ WIDTH="100%"
 ><PRE
 CLASS="SCREEN"
 >&#13; Final results:
-
- -add-header -block -deanimate-gifs -downgrade -fast-redirects 
- +filter{html-annoyances} +filter{js-annoyances} +filter{no-popups} 
- +filter{webbugs} +filter{nimda} +filter{banners-by-size} +filter{hal} 
- +filter{fun} +hide-forwarded +hide-from{block} +hide-referer{forge} 
- -hide-user-agent -image +image-blocker{blank} -limit-connect +no-compression 
- -no-cookies-keep -no-cookies-read -no-cookies-set +no-popups -vanilla-wafer 
- -wafer
-
- </PRE
+ -add-header -block +deanimate-gifs{last} -downgrade-http-version -fast-redirects 
+ -filter{popups} -filter{fun} -filter{shockwave-flash} -filter{crude-parental} 
+ +filter{html-annoyances} +filter{js-annoyances} +filter{content-cookies} 
+ +filter{webbugs} +filter{refresh-tags} +filter{nimda} +filter{banners-by-size} 
+ +hide-forwarded-for-headers +hide-from-header{block} +hide-referer{forge} 
+ -hide-user-agent -handle-as-image +set-image-blocker{pattern} -limit-connect 
+ +prevent-compression -session-cookies-only -prevent-reading-cookies 
+ -prevent-setting-cookies -kill-popups -send-vanilla-wafer -send-wafer</PRE
 ></TD
 ></TR
 ></TABLE
 ></P
 ><P
+> Notice the only difference here to the previous listing, is to 
+ <SPAN
+CLASS="QUOTE"
+>"fast-redirects"</SPAN
+> and <SPAN
+CLASS="QUOTE"
+>"session-cookies-only"</SPAN
+>.</P
+><P
 > Now another example, <SPAN
 CLASS="QUOTE"
 >"ad.doubleclick.net"</SPAN
@@ -1271,16 +1612,14 @@ WIDTH="100%"
 ><TD
 ><PRE
 CLASS="SCREEN"
->&#13; { +block +image }
+>&#13; { +block +handle-as-image }
   .ad.doubleclick.net
 
- { +block +image }
+ { +block +handle-as-image }
   ad*.
 
- { +block +image }
-  .doubleclick.net
-
- </PRE
+ { +block +handle-as-image }
+  .doubleclick.net</PRE
 ></TD
 ></TR
 ></TABLE
@@ -1289,17 +1628,21 @@ CLASS="SCREEN"
 > We'll just show the interesting part here, the explicit matches. It is 
  matched three different times. Each as an <SPAN
 CLASS="QUOTE"
->"+block +image"</SPAN
+>"+block +handle-as-image"</SPAN
 >,
  which is the expanded form of one of our aliases that had been defined as: 
  <SPAN
 CLASS="QUOTE"
 >"+imageblock"</SPAN
->. (<SPAN
+>. (<A
+HREF="actions-file.html#ALIASES"
+TARGET="_top"
+><SPAN
 CLASS="QUOTE"
 >"Aliases"</SPAN
-> are defined in the 
- first section of the actions file and typically used to combine more 
+></A
+> are defined in
+ the first section of the actions file and typically used to combine more 
  than one action.)</P
 ><P
 > Any one of these would have done the trick and blocked this as an unwanted 
@@ -1310,21 +1653,31 @@ CLASS="QUOTE"
 CLASS="QUOTE"
 >"ad.doubleclick.net"</SPAN
 >
- is done here -- as both a <SPAN
+ is done here -- as both a <A
+HREF="actions-file.html#BLOCK"
+TARGET="_top"
+><SPAN
 CLASS="QUOTE"
 >"+block"</SPAN
-> <I
+></A
+>
+ <I
 CLASS="EMPHASIS"
 >and</I
-> an
- <SPAN
+> an 
+ <A
+HREF="actions-file.html#HANDLE-AS-IMAGE"
+TARGET="_top"
+><SPAN
 CLASS="QUOTE"
->"+image"</SPAN
->. The custom alias <SPAN
+>"+handle-as-image"</SPAN
+></A
+>.
+ The custom alias <SPAN
 CLASS="QUOTE"
 >"+imageblock"</SPAN
-> does this
for us.</P
+> just simplifies the process and make 
it more readable.</P
 ><P
 > One last example. Let's try <SPAN
 CLASS="QUOTE"
@@ -1342,19 +1695,17 @@ WIDTH="100%"
 CLASS="SCREEN"
 >&#13; Matches for http://www.rhapsodyk.net/adsl/HOWTO/:
 
- { -add-header -block +deanimate-gifs -downgrade +fast-redirects 
-   +filter{html-annoyances} +filter{js-annoyances} +filter{no-popups} 
+ { -add-header -block +deanimate-gifs -downgrade-http-version +fast-redirects 
+   +filter{html-annoyances} +filter{js-annoyances} +filter{kill-popups} 
    +filter{webbugs} +filter{nimda} +filter{banners-by-size} +filter{hal} 
-   +filter{fun} +hide-forwarded +hide-from{block} +hide-referer{forge
-   -hide-user-agent -image +image-blocker{blank} +no-compression 
-   +no-cookies-keep -no-cookies-read -no-cookies-set +no-popup
-   -vanilla-wafer -wafer }
+   +filter{fun} +hide-forwarded-for-headers +hide-from-header{block
+   +hide-referer{forge} -hide-user-agent -handle-as-image +set-image-blocker{blank} 
+   +prevent-compression +session-cookies-only -prevent-setting-cookie
+   -prevent-reading-cookies +kill-popups -send-vanilla-wafer -send-wafer }
    /
 
- { +block +image }
-  /ads
-
- </PRE
+ { +block +handle-as-image }
+  /ads</PRE
 ></TD
 ></TR
 ></TABLE
@@ -1368,15 +1719,18 @@ CLASS="QUOTE"
 >"/ads"</SPAN
 >! But 
  we did not want this at all! Now we see why we get the blank page. We could
- now add a new action below this that explictly does <I
+ now add a new action below this that explicitly does <I
 CLASS="EMPHASIS"
 >not</I
 >
- block (-block) pages with <SPAN
+ block (<SPAN
+CLASS="QUOTE"
+>"{-block}"</SPAN
+>) paths with <SPAN
 CLASS="QUOTE"
 >"adsl"</SPAN
->. There are various ways to
- handle such exceptions. Example:</P
+>. There are
various ways to handle such exceptions. Example:</P
 ><P
 > <TABLE
 BORDER="0"
@@ -1387,9 +1741,7 @@ WIDTH="100%"
 ><PRE
 CLASS="SCREEN"
 >&#13; { -block }
-  /adsl
- </PRE
+  /adsl</PRE
 ></TD
 ></TR
 ></TABLE
@@ -1412,10 +1764,8 @@ WIDTH="100%"
 ><TD
 ><PRE
 CLASS="SCREEN"
->&#13; { -block }
-  /adsl
- </PRE
+>&#13; { +block +handle-as-image }
+ /ads</PRE
 ></TD
 ></TR
 ></TABLE
@@ -1447,9 +1797,7 @@ CLASS="SCREEN"
  .worldpay.com   # for quietpc.com
  .jungle.com
  .scan.co.uk
- .forbes.com
- </PRE
+ .forbes.com</PRE
 ></TD
 ></TR
 ></TABLE
@@ -1464,9 +1812,9 @@ CLASS="QUOTE"
 > that expands to 
  <SPAN
 CLASS="QUOTE"
->"{ -filter -no-cookies -no-cookies-keep }"</SPAN
->. Or you could do 
- your own exception to negate filtering:&#13;</P
+>"{ -filter -session-cookies-only }"</SPAN
+>.
Or you could do your own exception to negate filtering:&#13;</P
 ><P
 > <TABLE
 BORDER="0"
@@ -1477,14 +1825,18 @@ WIDTH="100%"
 ><PRE
 CLASS="SCREEN"
 >&#13; {-filter}
- .forbes.com
- </PRE
+ .forbes.com</PRE
 ></TD
 ></TR
 ></TABLE
 ></P
 ><P
+> This would probably be most appropriately put in <TT
+CLASS="FILENAME"
+>user.action</TT
+>, 
+ for local site exceptions.</P
+><P
 > <SPAN
 CLASS="QUOTE"
 >"{fragile}"</SPAN