Minor revisions and rebuild
[privoxy.git] / doc / webserver / faq / trouble.html
index 9c9adb5..b96157c 100644 (file)
@@ -1,11 +1,11 @@
+<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN""http://www.w3.org/TR/html4/loose.dtd">
 <HTML
 ><HEAD
 ><TITLE
 >Troubleshooting</TITLE
 ><META
 NAME="GENERATOR"
-CONTENT="Modular DocBook HTML Stylesheet Version 1.76b+
-"><LINK
+CONTENT="Modular DocBook HTML Stylesheet Version 1.79"><LINK
 REL="HOME"
 TITLE="Privoxy Frequently Asked Questions"
 HREF="index.html"><LINK
@@ -74,68 +74,96 @@ CLASS="SECT1"
 CLASS="SECT1"
 ><A
 NAME="TROUBLE"
-></A
->5. Troubleshooting</H1
+>5. Troubleshooting</A
+></H1
 ><DIV
 CLASS="SECT2"
 ><H3
 CLASS="SECT2"
 ><A
-NAME="AEN967"
-></A
->5.1. I am getting <SPAN
+NAME="AEN1064"
+>5.1. I cannot connect to any websites. Or, I am getting
+<SPAN
 CLASS="QUOTE"
 >"connection refused"</SPAN
->
-with every web page?</H3
+> message with every web page. Why?</A
+></H3
+><P
+> There are several possibilities:</P
 ><P
-> Either <SPAN
+><P
+></P
+><UL
+><LI
+><P
+><SPAN
 CLASS="APPLICATION"
 >Privoxy</SPAN
-> is not running, or your 
- browser is configured for a different port than what
- <SPAN
+> is not running. Solution: verify 
+ that <SPAN
 CLASS="APPLICATION"
 >Privoxy</SPAN
-> is using.</P
+> is installed correctly, has not crashed, and is indeed running.
+ Turn on <SPAN
+CLASS="APPLICATION"
+>Privoxy's</SPAN
+> logging, and look at the logs to see what they say.</P
+></LI
+><LI
 ><P
-> Early <SPAN
+>Or your browser is configured for a different port than what
+ <SPAN
 CLASS="APPLICATION"
 >Privoxy</SPAN
-> 2.x versions (and also
- <SPAN
+> is using. Solution: verify that <SPAN
 CLASS="APPLICATION"
->Junkbuster</SPAN
->) used port 8000 by 
- default. This has been changed to port 8118 now, due to a conflict 
- with NAS (Network Audio Service), which uses port 8000. If you haven't, 
- you need to change your browser to the new port number, or alternately 
- change the <A
-HREF="../user-manual/config.html#LISTEN-ADDRESS"
-TARGET="_top"
-><TT
+>Privoxy</SPAN
+>
+ and your browser are set to the same port (<TT
 CLASS="LITERAL"
 >listen-address</TT
->
- option</A
-> in <SPAN
-CLASS="APPLICATION"
->Privoxy's</SPAN
-> <A
-HREF="../user-manual/config.html"
-TARGET="_top"
->main configuration file</A
->.</P
+>).</P
+></LI
+><LI
+><P
+>Or if using a forwarding rule, you have a configuration problem or a
+ problem with a host in the forwarding chain. Solution: temporarily alter your
+ configuration and take the forwarders out of the equation.</P
+></LI
+><LI
+><P
+>  Or you have a firewall that is interfering and blocking you. Solution: 
+  try disabling or removing the firewall as a simple test.
+ </P
+></LI
+></UL
+></P
 ></DIV
 ><DIV
 CLASS="SECT2"
 ><H3
 CLASS="SECT2"
 ><A
-NAME="AEN980"
-></A
->5.2. I just added a new rule, but the steenkin ad is 
-still getting through. How?</H3
+NAME="ERROR503"
+>5.2. Why am I getting a 503 Error (WSAECONNREFUSED) on every page?</A
+></H3
+><P
+>  More than likely this is a problem with your TCP/IP networking. ZoneAlarm has
+  been reported to cause this symptom -- even if not running! The solution is
+  to either fight the ZA configuration, or uninstall ZoneAlarm, and then find
+  something better behaved in its place. Other personal firewall type products
+  may cause similar type problems if not configured correctly.
+ </P
+></DIV
+><DIV
+CLASS="SECT2"
+><H3
+CLASS="SECT2"
+><A
+NAME="AEN1087"
+>5.3. I just added a new rule, but the steenkin ad is 
+still getting through. How?</A
+></H3
 ><P
 > If the ad had been displayed before you added its URL, it will probably be
  held in the browser's cache for some time, so it will be displayed without
@@ -143,8 +171,7 @@ still getting through. How?</H3
 CLASS="APPLICATION"
 >Privoxy</SPAN
 >
- will not be in the picture. The best thing to do is try flushing the browser's
- caches. And then try again.</P
+ will not be involved. Flush the browser's caches, and then try again.</P
 ><P
 > If this doesn't help, you probably have an error in the rule you
  applied. Try pasting the full URL of the offending ad into <A
@@ -153,7 +180,99 @@ TARGET="_top"
 >http://config.privoxy.org/show-url-info</A
 >
  and see if it really matches your new rule. Blocking ads is like blocking
- spam: a lot of tinkering is required to stay ahead of the game.</P
+ spam: a lot of tinkering is required to stay ahead of the game. And 
+ remember you need to block the URL of the ad in question, which may be 
+ entirely different from the site URL itself. Most ads are hosted on different
+ servers than the main site itself. If you right-click on the ad, you should
+ be able to get all the relevant information you need. Alternately, you can 
+ find the correct URL by looking at <SPAN
+CLASS="APPLICATION"
+>Privoxy's</SPAN
+> logs
+ (you may need to enable logging in the main config file if its disabled).</P
+><P
+> Below is a slightly modified real-life log snippet that originates with one 
+ requested URL: <TT
+CLASS="LITERAL"
+>www.example.com</TT
+> (name of site was changed
+ for this example, the number of requests is real). You can see in this the
+ complexity of what goes into making up this one <SPAN
+CLASS="QUOTE"
+>"page"</SPAN
+>. There
+ are eight different domains involved here, with thirty two separate URLs
+ requested in all, making up all manner of images, Shockwave Flash,
+ JavaScript, CSS stylesheets, scripts, and other related content. Some of this
+ content is obviously <SPAN
+CLASS="QUOTE"
+>"good"</SPAN
+> or <SPAN
+CLASS="QUOTE"
+>"bad"</SPAN
+>, but not all.
+ Many of the more questionable looking requests, are going to outside domains
+ that seem to be identifying themselves with suspicious looking names, making
+ our job a little easier. <SPAN
+CLASS="APPLICATION"
+>Privoxy</SPAN
+> has <SPAN
+CLASS="QUOTE"
+>"crunched"</SPAN
+> (meaning caught 
+ and BLOCKED) quite a few items in this example, but perhaps missed a few as well. </P
+><P
+><TABLE
+BORDER="0"
+BGCOLOR="#E0E0E0"
+WIDTH="100%"
+><TR
+><TD
+><PRE
+CLASS="SCREEN"
+>Request: www.example.com/
+Request: www.example.com/favicon.ico
+Request: img.example.com/main.css
+Request: img.example.com/sr.js
+Request: example.betamarker.com/example.html
+Request: www.lik-sang.com/Banners/bestsellers/skyscraper.php?likref=BSellers
+Request: img.example.com/pb.png
+Request: www.google-analytics.com/urchin.js crunch! (Blocked)
+Request: www.advertising-department.com/ats/switch.ps.php?26856 crunch! (Blocked)
+Request: img.example.com/p.gif
+Request: www.popuptraffic.com/assign.php?l=example&#38;mode=behind crunch! (Blocked)
+Request: www.popuptraffic.com/scripts/popup.php?hid=5c3cf&#38;tmpl=PBa.tmpl crunch! (Blocked)
+Request: www.popuptraffic.com/assign.php?l=example crunch! (Blocked)
+Request: www.lik-sang.com/Banners/best_sellers/best_sellers.css
+Request: www.adtrak.net/adx.js crunch! (Blocked)
+Request: img.example.com/hbg.gif
+Request: img.example.com/example.jpg
+Request: img.example.com/mt.png
+Request: img.example.com/mm.png
+Request: img.example.com/mb.png
+Request: www.popuptraffic.com/scripts/popup.php?hid=a71b91fa5&#38;tmpl=Ua.tmp crunch! (Blocked)
+Request: www.example.com/tracker.js
+Request: www.lik-sang.com/Banners/best_sellers/lsi_head.gif
+Request: www.adtrak.net/adjs.php?n=020548130&#38;what=zone:61 crunch! (Blocked)
+Request: www.adtrak.net/adjs.php?n=463594413&#38;what=zone:58&#38;source=Ua crunch! (Blocked)
+Request: www.lik-sang.com/Banners/best_sellers/bottomani.swf
+Request: mmm.elitemediagroup.net/install.php?allowpop=no&#38;popupmincook=0&#38;allowsp2=1 crunch! (Blocked)
+Request: www.example.com/tracker.js?screen=1400x1050&#38;win=962x693
+Request: www.adtrak.net/adlog.php?bannerid=1309&#38;clientid=439&#38;zoneid=61 crunch! (Blocked)
+Request: 66.70.21.80/scripts/click.php?hid=5c3cf599a9efd0320d26&#38;si
+Request: 66.70.21.80/img/pixel.gif
+Request: www.adtrak.net/adlog.php?bannerid=1309&#38;clientid=439&#38;zoneid=58&#38;source=Ua&#38;block=86400 crunch! (Blocked)
+Request: 66.70.21.80/scripts/click.php?hid=a71b9f6504b0c5681fa5&#38;si=Ua</PRE
+></TD
+></TR
+></TABLE
+></P
+><P
+> Despite 12 out of 32 requests being blocked, the page looked, and seemed to
+ behave perfectly <SPAN
+CLASS="QUOTE"
+>"normal"</SPAN
+> (minus some ads, of course).</P
 ></DIV
 ><DIV
 CLASS="SECT2"
@@ -161,9 +280,9 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="BADSITE"
-></A
->5.3. One of my favorite sites does not work with Privoxy.
-What can I do?</H3
+>5.4. One of my favorite sites does not work with Privoxy.
+What can I do?</A
+></H3
 ><P
 > First verify that it is indeed a <SPAN
 CLASS="APPLICATION"
@@ -176,24 +295,43 @@ CLASS="APPLICATION"
 HREF="http://config.privoxy.org/toggle"
 TARGET="_top"
 >http://config.privoxy.org/toggle</A
->,
+>
+ (the toggle feature may need to be enabled in the main
+ <TT
+CLASS="FILENAME"
+>config</TT
+>),
  and then shift-reloading the problem page (i.e. holding down the shift key
  while clicking reload. Alternatively, flush your browser's disk and memory
  caches).</P
 ><P
-> If still a problem, go to <A
+> If the problem went away, we know we have a configuration related problem.
+ Now go to <A
 HREF="http://config.privoxy.org/show-url-info"
 TARGET="_top"
 >http://config.privoxy.org/show-url-info</A
 >
- and paste the full URL of the page in question into the prompt. See which actions
- are being applied to the URL, and which matches in which actions files are
- responsible for that. Now, armed with this information, go to <A
+ and paste the full URL of the page in question into the prompt. See which
+ actions are being applied to the URL, and which matches in which actions
+ files are responsible for that. It might be helpful also to look at your logs
+ for this site too, to see what else might be happening (note: logging may need
+ to be enabled in the main config file). Many sites are
+ complex and require a number of related pages to help present their content.
+ Look at what else might be used by the page in question, and what of that
+ might be <SPAN
+CLASS="emphasis"
+><I
+CLASS="EMPHASIS"
+>required</I
+></SPAN
+>.
+ Now, armed with this information, go to
+ <A
 HREF="http://config.privoxy.org/show-status"
 TARGET="_top"
 >http://config.privoxy.org/show-status</A
 >
- and select the appropriate actions files for editing.</P
+ and select the appropriate actions files for editing. </P
 ><P
 > You can now either look for a section which disables the actions that
  you suspect to cause the problem and add a pattern for your site there,
@@ -232,6 +370,9 @@ TARGET="_top"
 >actions tutorial</A
 >
  with general configuration information and examples.</P
+><P
+> As a last resort, you can always see if your browser has a setting that will 
+ bypass the proxy setting for selective sites. Modern browsers can do this.</P
 ></DIV
 ><DIV
 CLASS="SECT2"
@@ -239,9 +380,9 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="DUN"
-></A
->5.4. After installing Privoxy, I have to log in
-every time I start IE. What gives?</H3
+>5.5. After installing Privoxy, I have to log in
+every time I start IE. What gives?</A
+></H3
 ><P
 > This is a quirk that effects the installation of
  <SPAN
@@ -294,9 +435,9 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="FTP"
-></A
->5.5. I cannot connect to any FTP sites. Privoxy
- is blocking me.</H3
+>5.6. I cannot connect to any FTP sites. Privoxy
+ is blocking me.</A
+></H3
 ><P
 >  <SPAN
 CLASS="APPLICATION"
@@ -333,7 +474,7 @@ CLASS="APPLICATION"
 CLASS="QUOTE"
 >"proxy"</SPAN
 >
-  setting, which will silently enable various protocols, including
+  setting, which will enable various protocols, including
   <SPAN
 CLASS="emphasis"
 ><I
@@ -365,9 +506,9 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="OSXIE"
-></A
->5.6. In Mac OSX, I can't configure Microsoft Internet Explorer to use 
- Privoxy as the HTTP proxy.</H3
+>5.7. In Mac OSX, I can't configure Microsoft Internet Explorer to use 
+ Privoxy as the HTTP proxy.</A
+></H3
 ><P
 >  Microsoft Internet Explorer (in versions like 5.1) respects system-wide
   network settings.  In order to change the HTTP proxy, open System
@@ -390,10 +531,10 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="OSXUNINSTALL"
-></A
->5.7. In Mac OSX, I dragged the Privoxy folder to the trash in order to 
+>5.8. In Mac OSX, I dragged the Privoxy folder to the trash in order to 
  uninstall it.  Now the finder tells me I don't have sufficient privileges to
- empty the trash.</H3
+ empty the trash.</A
+></H3
 ><P
 >  Just dragging the <SPAN
 CLASS="APPLICATION"
@@ -425,13 +566,13 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="OSXIMAGES"
-></A
->5.8. In Mac OSX Panther (10.3), images often fail to load and/or I
+>5.9. In Mac OSX Panther (10.3), images often fail to load and/or I
  experience random delays in page loading. I'm using
  <TT
 CLASS="LITERAL"
 >localhost</TT
-> as my browser's proxy setting.</H3
+> as my browser's proxy setting.</A
+></H3
 ><P
 >  We believe this is due to an IPv6-related bug in OSX, but don't fully
   understand the issue yet. In any case, changing the proxy setting to 
@@ -451,8 +592,7 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="BLANKPAGE"
-></A
->5.9. I get a completely blank page at one site. <SPAN
+>5.10. I get a completely blank page at one site. <SPAN
 CLASS="QUOTE"
 >"View Source"</SPAN
 >
@@ -460,7 +600,8 @@ CLASS="QUOTE"
 CLASS="MARKUP"
 >&#60;html&#62;&#60;body&#62;&#60;/body&#62;&#60;/html&#62;</SPAN
 >. Without
- Privoxy the page loads fine.</H3
+ Privoxy the page loads fine.</A
+></H3
 ><P
 >  Chances are that the site suffers from a bug in
   <A
@@ -516,29 +657,13 @@ CLASS="SECT2"
 ><H3
 CLASS="SECT2"
 ><A
-NAME="ERROR503"
-></A
->5.10. Why am I getting a 503 Error (WSAECONNREFUSED) on every page?</H3
-><P
->  More than likely this is a problem with your TCP/IP networking. ZoneAlarm has
-  been reported to cause this symptom -- even if not running. The solution is
-  to either fight the ZA configuration, or uninstall ZoneAlarm, and then find
-  something better behaved in its place. Other personal firewall type products
-  may cause similar type problems if not configured correctly.
- </P
-></DIV
-><DIV
-CLASS="SECT2"
-><H3
-CLASS="SECT2"
-><A
 NAME="NOHOSTNAME"
-></A
 >5.11. My logs show many <SPAN
 CLASS="QUOTE"
 >"Unable to get my own hostname"</SPAN
 > lines.
-Why?</H3
+Why?</A
+></H3
 ><P
 > <SPAN
 CLASS="APPLICATION"
@@ -577,7 +702,8 @@ CLASS="FILENAME"
 >HOSTS</TT
 >
  file. If this file has been changed from the original, try reverting it to
- see if that helps.</P
+ see if that helps. Make sure whatever name(s) are used for the local system,
+ that they resolve both ways.</P
 ></DIV
 ><DIV
 CLASS="SECT2"
@@ -585,13 +711,13 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="INUSE"
-></A
 >5.12. When I try to launch Privoxy, I get an 
 error message <SPAN
 CLASS="QUOTE"
 >"port 8118 is already in use"</SPAN
 > (or similar wording).
-Why?</H3
+Why?</A
+></H3
 ><P
 > Port 8118 is <SPAN
 CLASS="APPLICATION"
@@ -605,14 +731,14 @@ CLASS="QUOTE"
 CLASS="APPLICATION"
 >Privoxy</SPAN
 > running, and
- you are actually trying to start a second <SPAN
+ your system is actually trying to start a second
+ <SPAN
 CLASS="APPLICATION"
 >Privoxy</SPAN
-> 
- on the same port, which will not work. (You can have multiple instances but
- they must be assigned different ports.) How and why this might happen varies
- from platform to platform, but you need to check your installation and
- start-up procedures.</P
+> on the same port, which will not work.
+ (You can have multiple instances but they must be assigned different ports.)
+ How and why this might happen varies from platform to platform, but you need
+ to check your installation and start-up procedures.</P
 ></DIV
 ><DIV
 CLASS="SECT2"
@@ -620,8 +746,8 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="DEMORONIZER"
-></A
->5.13. Pages with UTF-8 fonts are garbled.</H3
+>5.13. Pages with UTF-8 fonts are garbled.</A
+></H3
 ><P
 > This is caused by the <SPAN
 CLASS="QUOTE"
@@ -647,15 +773,15 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="DEMORONIZER2"
-></A
 >5.14. Why are binary files (such as images) corrupted when Privoxy
- is used?</H3
+ is used?</A
+></H3
 ><P
 > This may also be caused by the <SPAN
 CLASS="QUOTE"
 >"demoronizer"</SPAN
 > filter, 
- in conjunction with a web server that is misreporting a file type. Binary 
+ in conjunction with a web server that is misreporting the content type. Binary 
  files are exempted from <SPAN
 CLASS="APPLICATION"
 >Privoxy's</SPAN
@@ -680,11 +806,11 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="DEMORONIZER3"
-></A
 >5.15. What is the <SPAN
 CLASS="QUOTE"
 >"demoronizer"</SPAN
-> and why is it there?</H3
+> and why is it there?</A
+></H3
 ><P
 > The original demoronizer was a Perl script that cleaned up HTML pages which 
  were created with certain Microsoft products. MS has used proprietary extensions 
@@ -712,7 +838,7 @@ CLASS="EMPHASIS"
 >.</P
 ><P
 > On the other hand, if you use non-Microsoft products, and you occasionally 
- notice wierd characters on pages, you might want to try it.</P
+ notice weird characters on pages, you might want to try it.</P
 ></DIV
 ><DIV
 CLASS="SECT2"
@@ -720,11 +846,11 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="WINDOWOPEN"
-></A
 >5.16. Why do I keep seeing <SPAN
 CLASS="QUOTE"
 >"PrivoxyWindowOpen()"</SPAN
-> in raw source code?</H3
+> in raw source code?</A
+></H3
 ><P
 > <SPAN
 CLASS="APPLICATION"
@@ -763,12 +889,12 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="DNSERRORS"
-></A
 >5.17. I am getting too many DNS errors like <SPAN
 CLASS="QUOTE"
 >"404 No Such Domain"</SPAN
 >. Why
- can't Privoxy do this better?</H3
+ can't Privoxy do this better?</A
+></H3
 ><P
 > There are potentially several factors here. First of all, the DNS resolution
  is done by the underlying operating system -- not
@@ -806,7 +932,7 @@ CLASS="QUOTE"
 > which is reporting whatever problem occurred
  downstream, and not the root cause of the error.</P
 ><P
-> In any case, v. 3.0.4 includes various improvements to help
+> In any case, newer versions include various improvements to help
  <SPAN
 CLASS="APPLICATION"
 >Privoxy</SPAN
@@ -818,9 +944,9 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="ALLCPU"
-></A
 >5.18. At one site Privoxy just hangs, and starts taking 
- all CPU. Why is this?</H3
+ all CPU. Why is this?</A
+></H3
 ><P
 > This is probably a manifestation of the <SPAN
 CLASS="QUOTE"
@@ -850,9 +976,9 @@ CLASS="SECT2"
 CLASS="SECT2"
 ><A
 NAME="SLOWCRAWL"
-></A
 >5.19. I just installed Privoxy, and all my
-browsing has slowed to a crawl. What gives?</H3
+browsing has slowed to a crawl. What gives?</A
+></H3
 ><P
 > This should not happen, and for the overwhelming number of users world-wide,
  it does not happen. I would suspect some inadvertent interaction of software
@@ -860,6 +986,34 @@ browsing has slowed to a crawl. What gives?</H3
  firewalls or similar components. Try disabling (or uninstalling) these one
  at a time and see if that helps.</P
 ></DIV
+><DIV
+CLASS="SECT2"
+><H3
+CLASS="SECT2"
+><A
+NAME="PREVENTCOMP"
+>5.20. Why do my filters work on some sites but not on others?</A
+></H3
+><P
+> It's probably due to compression. It is a common practice for web servers to
+ send their content <SPAN
+CLASS="QUOTE"
+>"compressed"</SPAN
+> in order to speed things up, and
+ then let the browser <SPAN
+CLASS="QUOTE"
+>"uncompress"</SPAN
+> them. When compiled with zlib support
+ <SPAN
+CLASS="APPLICATION"
+>Privoxy</SPAN
+> can decompress content before filtering, otherwise you may want to enable
+<A
+HREF="../user-manual/actions-file.html#PREVENT-COMPRESSION"
+TARGET="_top"
+>prevent-compression</A
+>.</P
+></DIV
 ></DIV
 ><DIV
 CLASS="NAVFOOTER"