Reorganizing the repository: swapping out what was HEAD (the old 3.1 branch)
[privoxy.git] / doc / webserver / faq / misc.html
1 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
2 <HTML
3 ><HEAD
4 ><TITLE
5 >Miscellaneous</TITLE
6 ><META
7 NAME="GENERATOR"
8 CONTENT="Modular DocBook HTML Stylesheet Version 1.7"><LINK
9 REL="HOME"
10 TITLE="Privoxy Frequently Asked Questions"
11 HREF="index.html"><LINK
12 REL="PREVIOUS"
13 TITLE="Configuration"
14 HREF="configuration.html"><LINK
15 REL="NEXT"
16 TITLE="Troubleshooting"
17 HREF="trouble.html"><LINK
18 REL="STYLESHEET"
19 TYPE="text/css"
20 HREF="../p_doc.css"></HEAD
21 ><BODY
22 CLASS="SECT1"
23 BGCOLOR="#EEEEEE"
24 TEXT="#000000"
25 LINK="#0000FF"
26 VLINK="#840084"
27 ALINK="#0000FF"
28 ><DIV
29 CLASS="NAVHEADER"
30 ><TABLE
31 SUMMARY="Header navigation table"
32 WIDTH="100%"
33 BORDER="0"
34 CELLPADDING="0"
35 CELLSPACING="0"
36 ><TR
37 ><TH
38 COLSPAN="3"
39 ALIGN="center"
40 >Privoxy Frequently Asked Questions</TH
41 ></TR
42 ><TR
43 ><TD
44 WIDTH="10%"
45 ALIGN="left"
46 VALIGN="bottom"
47 ><A
48 HREF="configuration.html"
49 ACCESSKEY="P"
50 >Prev</A
51 ></TD
52 ><TD
53 WIDTH="80%"
54 ALIGN="center"
55 VALIGN="bottom"
56 ></TD
57 ><TD
58 WIDTH="10%"
59 ALIGN="right"
60 VALIGN="bottom"
61 ><A
62 HREF="trouble.html"
63 ACCESSKEY="N"
64 >Next</A
65 ></TD
66 ></TR
67 ></TABLE
68 ><HR
69 ALIGN="LEFT"
70 WIDTH="100%"></DIV
71 ><DIV
72 CLASS="SECT1"
73 ><H1
74 CLASS="SECT1"
75 ><A
76 NAME="MISC"
77 >4. Miscellaneous</A
78 ></H1
79 ><DIV
80 CLASS="SECT2"
81 ><H3
82 CLASS="SECT2"
83 ><A
84 NAME="AEN537"
85 >4.1. How much does <SPAN
86 CLASS="APPLICATION"
87 >Privoxy</SPAN
88 > slow my browsing down? This 
89 has to add extra time to browsing.</A
90 ></H3
91 ><P
92 > It should not slow you down any in real terms, and may actually help 
93  speed things up since ads, banners and other junk are not being displayed.
94  The actual processing time required by <SPAN
95 CLASS="APPLICATION"
96 >Privoxy</SPAN
97
98  itself for each page, is relatively small in the overall scheme of things,
99  and happens very quickly. This is typically more than offset by time saved
100  not downloading and rendering ad images.</P
101 ><P
102 > <SPAN
103 CLASS="QUOTE"
104 >"Filtering"</SPAN
105 > content via the <VAR
106 CLASS="LITERAL"
107 ><A
108 HREF="../user-manual/actions-file.html#FILTER"
109 TARGET="_top"
110 >filter</A
111 ></VAR
112 > or
113  <VAR
114 CLASS="LITERAL"
115 ><A
116 HREF="../user-manual/actions-file.html#DEANIMATE-GIFS"
117 TARGET="_top"
118 >deanimate-gifs</A
119 ></VAR
120 >
121  actions may cause a perceived slowdown, since the entire document needs to be buffered
122  before displaying. See below.</P
123 ></DIV
124 ><DIV
125 CLASS="SECT2"
126 ><H3
127 CLASS="SECT2"
128 ><A
129 NAME="LOADINGTIMES"
130 >4.2. I noticed considerable
131 delays in page requests compared to the old Junkbuster. What's wrong?</A
132 ></H3
133 ><P
134 > If you use any <VAR
135 CLASS="LITERAL"
136 ><A
137 HREF="../user-manual/actions-file.html#FILTER"
138 TARGET="_top"
139 >filter</A
140 ></VAR
141 > action,
142  such as filtering banners by size, web-bugs etc, or the <VAR
143 CLASS="LITERAL"
144 ><A
145 HREF="../user-manual/actions-file.html#DEANIMATE-GIFS"
146 TARGET="_top"
147 >deanimate-gifs</A
148 ></VAR
149 >
150  action, the entire document must be loaded into memory in order for the filtering 
151  mechanism to work, and nothing is sent to the browser during this time.</P
152 ><P
153 > The loading time does not really change in real numbers, but the feeling is
154  different, because most browsers are able to start rendering incomplete
155  content, giving the user a feeling of "it works". This effect is especially
156  noticeable on slow dialup connections.
157  </P
158 ><P
159 > Filtering is automatically disabled for inappropriate MIME types. But note 
160  that if the web server mis-reports the MIME type, then content that should
161  not be filtered, could be. <SPAN
162 CLASS="APPLICATION"
163 >Privoxy</SPAN
164 > only knows how
165  to differentiate filterable content because of the MIME type as reported by
166  the server, or because of some configuration setting that enables/disables
167  filtering.&#13;</P
168 ></DIV
169 ><DIV
170 CLASS="SECT2"
171 ><H3
172 CLASS="SECT2"
173 ><A
174 NAME="CONFIGURL"
175 >4.3. What are "http://config.privoxy.org/" and
176 "http://p.p/"?</A
177 ></H3
178 ><P
179 > <A
180 HREF="http://config.privoxy.org/"
181 TARGET="_top"
182 >http://config.privoxy.org/</A
183 > is the
184  address of <SPAN
185 CLASS="APPLICATION"
186 >Privoxy</SPAN
187 >'s built-in user interface, and 
188  <A
189 HREF="http://p.p/"
190 TARGET="_top"
191 >http://p.p/</A
192 > is a shortcut for it.</P
193 ><P
194 > Since <SPAN
195 CLASS="APPLICATION"
196 >Privoxy</SPAN
197 > sits between your web browser and the Internet, 
198  it can simply intercept requests for these addresses and answer them with its built-in
199  <SPAN
200 CLASS="QUOTE"
201 >"web server"</SPAN
202 >.</P
203 ><P
204 > This also makes for a good test for your browser configuration: If entering the
205  URL <A
206 HREF="http://config.privoxy.org/"
207 TARGET="_top"
208 >http://config.privoxy.org/</A
209 >
210  takes you to a page saying <SPAN
211 CLASS="QUOTE"
212 >"This is Privoxy ..."</SPAN
213 >, everything is OK.
214  If you get a page saying <SPAN
215 CLASS="QUOTE"
216 >"Privoxy is not working"</SPAN
217 > instead, then
218  your browser didn't use <SPAN
219 CLASS="APPLICATION"
220 >Privoxy</SPAN
221 > for the request,
222  hence it could not be intercepted, and you have accessed the <SPAN
223 CLASS="emphasis"
224 ><I
225 CLASS="EMPHASIS"
226 >real</I
227 ></SPAN
228 >
229  web site at config.privoxy.org.</P
230 ><P
231 > With recent versions of <SPAN
232 CLASS="APPLICATION"
233 >Privoxy</SPAN
234 > (version 2.9.x and
235  later), the user interface features information on the run time status, the
236  configuration, and even a built-in editor for the <A
237 HREF="../user-manual/actions-file.html"
238 TARGET="_top"
239 >actions files</A
240 >.</P
241 ><P
242 > Note that the built-in URLs from earlier versions of <SPAN
243 CLASS="APPLICATION"
244 >Junkbuster</SPAN
245 >
246  / <SPAN
247 CLASS="APPLICATION"
248 >Privoxy</SPAN
249 >, http://example.com/show-proxy-args and http://i.j.b/,
250  are no longer supported. If you still use such an old version, you should really consider
251  upgrading to 3.0.3.</P
252 ></DIV
253 ><DIV
254 CLASS="SECT2"
255 ><H3
256 CLASS="SECT2"
257 ><A
258 NAME="BLOCKLIST"
259 >4.4. Do you still maintain the blocklists?</A
260 ></H3
261 ><P
262 >  No. The patterns for blocking now reside (among other things) in the <A
263 HREF="../user-manual/actions-file.html"
264 TARGET="_top"
265 >actions files</A
266 >, which are 
267   actively maintained instead. See next question ...</P
268 ></DIV
269 ><DIV
270 CLASS="SECT2"
271 ><H3
272 CLASS="SECT2"
273 ><A
274 NAME="NEWADS"
275 >4.5. How can I submit new ads?</A
276 ></H3
277 ><P
278 >Yes, absolutely! Please see the <A
279 HREF="contact.html"
280 >Contact section</A
281 > for
282 how to do that. Please note that you (technically) need the latest
283 <SPAN
284 CLASS="APPLICATION"
285 >Privoxy</SPAN
286 > version for this to work.</P
287 ></DIV
288 ><DIV
289 CLASS="SECT2"
290 ><H3
291 CLASS="SECT2"
292 ><A
293 NAME="IP"
294 >4.6. How can I hide my IP address?</A
295 ></H3
296 ><P
297 > If you run both the browser and the proxy locally, you cannot hide your IP
298  address with <SPAN
299 CLASS="APPLICATION"
300 >Privoxy</SPAN
301 > or any other software. The
302  server needs to know your IP address to send the answers back to you. </P
303 ><P
304 > Fortunately there are many publicly usable anonymous proxies out there, which
305  solve the problem by providing a further level of indirection between you and
306  the web server, shared by many people, and thus letting your requests "drown"
307  in white noise of unrelated requests as far as user tracking is concerned.</P
308 ><P
309 > Most of them will, however, log your IP address and make it available to the
310  authorities in case you abuse that anonymity for criminal purposes. In fact
311  you can't even rule out that some of them only exist to *collect* information
312  on (those suspicious) people with a more than average preference for privacy.</P
313 ><P
314 > You can find a list of anonymous public proxies at <A
315 HREF="http://www.multiproxy.org/anon_list.htm"
316 TARGET="_top"
317 >multiproxy.org</A
318 > and many
319  more through Google. A particularly interesting project is the JAP service
320  offered by the Technical University of Dresden (<A
321 HREF="http://anon.inf.tu-dresden.de/index_en.html"
322 TARGET="_top"
323 >http://anon.inf.tu-dresden.de/index_en.html</A
324 >).</P
325 ><P
326 > There is, however, even in the single-machine case the possibility to make the
327  server believe that your machine is in fact a shared proxy serving a whole big
328  LAN, and we are looking into that.</P
329 ></DIV
330 ><DIV
331 CLASS="SECT2"
332 ><H3
333 CLASS="SECT2"
334 ><A
335 NAME="AEN598"
336 >4.7. Can <SPAN
337 CLASS="APPLICATION"
338 >Privoxy</SPAN
339 > guarantee I am anonymous?</A
340 ></H3
341 ><P
342 > No. Your chances of remaining anonymous are greatly improved, but unless you
343  are an expert on Internet security it would be safest to assume that
344  everything you do on the Web can be traced back to you.</P
345 ><P
346 > <SPAN
347 CLASS="APPLICATION"
348 >Privoxy</SPAN
349 > can remove various information about you,
350  and allows <SPAN
351 CLASS="emphasis"
352 ><I
353 CLASS="EMPHASIS"
354 >you</I
355 ></SPAN
356 > more freedom  to decide which sites 
357  you can trust, and what details you want to reveal. But it's still possible
358  that web sites can find out who you are. Here's one way this can happen.</P
359 ><P
360 > A few browsers disclose the user's email address in certain situations, such
361  as when transferring a file by FTP. <SPAN
362 CLASS="APPLICATION"
363 >Privoxy</SPAN
364 >
365  does not filter FTP. If you need this feature, or are concerned about the
366  mail handler of your browser disclosing your email address, you might
367  consider products such as <SPAN
368 CLASS="APPLICATION"
369 >NSClean</SPAN
370 >.</P
371 ><P
372 > Browsers available only as binaries could use non-standard headers to give
373  out any information they can have access to: see the manufacturer's license
374  agreement. It's impossible to anticipate and prevent every breach of privacy
375  that might occur. The professionally paranoid prefer browsers available as
376  source code, because anticipating their behavior is easier. Trust the source,
377  Luke!</P
378 ></DIV
379 ><DIV
380 CLASS="SECT2"
381 ><H3
382 CLASS="SECT2"
383 ><A
384 NAME="AEN609"
385 >4.8. Might some things break because header information or
386 content is being altered?</A
387 ></H3
388 ><P
389 > Definitely. More and more sites use HTTP header content to decide what to
390  display and how to display it. There is many ways that this can be handled, 
391  so having hard and fast rules, is tricky.</P
392 ><P
393 > <SPAN
394 CLASS="QUOTE"
395 >"User-Agent"</SPAN
396 > in particular is often used in this way to identify
397  the browser, and adjust content accordingly. Changing this now (at least not
398  further than removing the OS information) is not recommended, since so many
399  sites do look for it. You may get undesirable results by changing this.</P
400 ><P
401 > For instance, different browsers use different encodings of Russian and Czech
402  characters, certain web servers convert pages on-the-fly according to the
403  User Agent header. Giving a <SPAN
404 CLASS="QUOTE"
405 >"User Agent"</SPAN
406 > with the wrong
407  operating system or browser manufacturer causes some sites in these languages
408  to be garbled; Surfers to Eastern European sites should change it to
409  something closer. And then some page access counters work by looking at the
410  <SPAN
411 CLASS="QUOTE"
412 >"Referer"</SPAN
413 > header; they may fail or break if unavailable. The
414  weather maps of Intellicast have been blocked by their server when no
415  <SPAN
416 CLASS="QUOTE"
417 >"Referer"</SPAN
418 > or cookie is provided, is another example. (But you
419  can forge both headers without giving information away). There are
420  many other ways things can go wrong when trying to fool a web server.</P
421 ><P
422 > Similar thoughts apply to modifying JavaScript, and, to a lesser degree,
423  HTML elements.</P
424 ><P
425 > If you have problems with a site, you will have to adjust your configuration 
426  accordingly. Cookies are probably the most likely adjustment that may 
427  be required, but by no means the only one.</P
428 ></DIV
429 ><DIV
430 CLASS="SECT2"
431 ><H3
432 CLASS="SECT2"
433 ><A
434 NAME="AEN620"
435 >4.9. Can <SPAN
436 CLASS="APPLICATION"
437 >Privoxy</SPAN
438 > act as a <SPAN
439 CLASS="QUOTE"
440 >"caching"</SPAN
441 > proxy to 
442 speed up web browsing?</A
443 ></H3
444 ><P
445 > No, it does not have this ability at all. You want something like 
446  <A
447 HREF="http://www.squid-cache.org/"
448 TARGET="_top"
449 >Squid</A
450 > for this. And, yes, 
451  before you ask, <SPAN
452 CLASS="APPLICATION"
453 >Privoxy</SPAN
454 > can co-exist 
455  with other kinds of proxies like <SPAN
456 CLASS="APPLICATION"
457 >Squid</SPAN
458 >.
459  See the <A
460 HREF="../user-manual/config.html#FORWARDING"
461 TARGET="_top"
462 >forwarding
463  chapter</A
464 > in the <A
465 HREF="../user-manual/index.html"
466 TARGET="_top"
467 >user
468  manual</A
469 > for details.</P
470 ></DIV
471 ><DIV
472 CLASS="SECT2"
473 ><H3
474 CLASS="SECT2"
475 ><A
476 NAME="AEN630"
477 >4.10. What about as a firewall? Can <SPAN
478 CLASS="APPLICATION"
479 >Privoxy</SPAN
480 > protect me?</A
481 ></H3
482 ><P
483 > Not in the way you mean, or in the way a true firewall can. 
484  <SPAN
485 CLASS="APPLICATION"
486 >Privoxy</SPAN
487 > can help protect your privacy, but not
488  protect you from intrusion attempts. It is, of course, perfectly possible
489  and recommended to use <SPAN
490 CLASS="emphasis"
491 ><I
492 CLASS="EMPHASIS"
493 >both</I
494 ></SPAN
495 >.</P
496 ></DIV
497 ><DIV
498 CLASS="SECT2"
499 ><H3
500 CLASS="SECT2"
501 ><A
502 NAME="AEN636"
503 >4.11. I have large empty spaces / a checkerboard pattern now where
504 ads used to be. Why?</A
505 ></H3
506 ><P
507 > It would be technically possible eliminate the banners in a way that frees
508  their screen estate in many cases, by doing all banner blocking with filters,
509  i.e. eliminating the whole image references from the HTML pages instead
510  of letting them stay in, and blocking the resulting requests for the
511  banners themselves.</P
512 ><P
513 > But this would consume considerable CPU resources, would likely destroy
514  the layout of many web pages which rely on the banners consuming a certain
515  amount of screen space, and would fail in other cases, where the screen space
516  is reserved e.g. by tables anyway. Also, making the banners disappear without
517  a visual trace complicates troubleshooting.</P
518 ><P
519 > So we won't support this in the default configuration, but you can of course
520  define appropriate filters yourself.</P
521 ></DIV
522 ><DIV
523 CLASS="SECT2"
524 ><H3
525 CLASS="SECT2"
526 ><A
527 NAME="AEN641"
528 >4.12. How can <SPAN
529 CLASS="APPLICATION"
530 >Privoxy</SPAN
531 > filter Secure (HTTPS) URLs?</A
532 ></H3
533 ><P
534 > Since secure HTTP connections are encrypted SSL sessions between your browser
535  and the secure site, and are meant to be reliably <SPAN
536 CLASS="emphasis"
537 ><I
538 CLASS="EMPHASIS"
539 >secure</I
540 ></SPAN
541 >,
542  there is little that <SPAN
543 CLASS="APPLICATION"
544 >Privoxy</SPAN
545 > can do but hand the raw
546  gibberish data though from one end to the other unprocessed.</P
547 ><P
548 > The only exception to this is blocking by host patterns, as the client needs
549  to tell <SPAN
550 CLASS="APPLICATION"
551 >Privoxy</SPAN
552 > the name of the remote server,
553  so that <SPAN
554 CLASS="APPLICATION"
555 >Privoxy</SPAN
556 > can establish the connection.
557  If that name matches a host-only pattern, the connection will be blocked.</P
558 ><P
559 > As far as ad blocking is concerned, this is less of a restriction than it may
560  seem, since ad sources are often identifiable by the host name, and often
561  the banners to be placed in an encrypted page come unencrypted nonetheless
562  for efficiency reasons, which exposes them to the full power of 
563  <SPAN
564 CLASS="APPLICATION"
565 >Privoxy</SPAN
566 >'s ad blocking.</P
567 ><P
568 > <SPAN
569 CLASS="QUOTE"
570 >"Content cookies"</SPAN
571 > (those that are embedded in the actual HTML or
572  JS page content, see <VAR
573 CLASS="LITERAL"
574 ><A
575 HREF="../user-manual/actions-file.html#FILTER-CONTENT-COOKIES"
576 TARGET="_top"
577 >filter{content-cookies}</A
578 ></VAR
579 >), 
580  in an SSL transaction will be impossible to block under these conditions. 
581  Fortunately, this does not seem to be a very common scenario since most 
582  cookies come by traditional means.</P
583 ></DIV
584 ><DIV
585 CLASS="SECT2"
586 ><H3
587 CLASS="SECT2"
588 ><A
589 NAME="AEN656"
590 >4.13. <SPAN
591 CLASS="APPLICATION"
592 >Privoxy</SPAN
593 > runs as a <SPAN
594 CLASS="QUOTE"
595 >"server"</SPAN
596 >. How 
597 secure is it? Do I need to take any special precautions?</A
598 ></H3
599 ><P
600 > There are no known exploits that might affect
601  <SPAN
602 CLASS="APPLICATION"
603 >Privoxy</SPAN
604 >. On Unix-like systems, 
605  <SPAN
606 CLASS="APPLICATION"
607 >Privoxy</SPAN
608 > can run as a non-privileged 
609  user, which is how we recommend it be run. Also, by default 
610  <SPAN
611 CLASS="APPLICATION"
612 >Privoxy</SPAN
613 > only listens to requests 
614  from <SPAN
615 CLASS="QUOTE"
616 >"localhost"</SPAN
617 > only. The server aspect of
618  <SPAN
619 CLASS="APPLICATION"
620 >Privoxy</SPAN
621 > is not itself directly exposed to the
622  Internet in this configuration. If you want to have
623  <SPAN
624 CLASS="APPLICATION"
625 >Privoxy</SPAN
626 > serve as a LAN proxy, this will have to
627  be opened up to allow for LAN requests. In this case, we'd recommend
628  you specify only the LAN gateway address, e.g. 192.168.1.1, in the main 
629  <SPAN
630 CLASS="APPLICATION"
631 >Privoxy</SPAN
632 > configuration file and check all <A
633 HREF="../user-manual/config.html#ACCESS-CONTROL"
634 TARGET="_top"
635 >access control and security
636  options</A
637 >. All LAN hosts can then use this as their proxy address
638  in the browser proxy configuration, but <SPAN
639 CLASS="APPLICATION"
640 >Privoxy</SPAN
641 >
642  will not listen on any external interfaces. ACLs can be defined in addition,
643  and using a firewall is always good too. Better safe than sorry.</P
644 ></DIV
645 ><DIV
646 CLASS="SECT2"
647 ><H3
648 CLASS="SECT2"
649 ><A
650 NAME="TURNOFF"
651 >4.14. How can I temporarily disable <SPAN
652 CLASS="APPLICATION"
653 >Privoxy</SPAN
654 >?</A
655 ></H3
656 ><P
657 > The easiest way is to access <SPAN
658 CLASS="APPLICATION"
659 >Privoxy</SPAN
660 > with your 
661  browser by using the remote toggle URL: <A
662 HREF="http://config.privoxy.org/toggle"
663 TARGET="_top"
664 >http://config.privoxy.org/toggle</A
665 >.
666  See the <A
667 HREF="../user-manual/appendix.html#BOOKMARKLETS"
668 TARGET="_top"
669 >Bookmarklets section</A
670
671  of the <I
672 CLASS="CITETITLE"
673 >User Manual</I
674 > for an easy way to access this 
675  feature.</P
676 ></DIV
677 ><DIV
678 CLASS="SECT2"
679 ><H3
680 CLASS="SECT2"
681 ><A
682 NAME="REALLYOFF"
683 >4.15. When <SPAN
684 CLASS="QUOTE"
685 >"disabled"</SPAN
686 > is <SPAN
687 CLASS="APPLICATION"
688 >Privoxy</SPAN
689 > totally 
690 out of the picture?</A
691 ></H3
692 ><P
693 > No, this just means all filtering and actions are disabled.
694  <SPAN
695 CLASS="APPLICATION"
696 >Privoxy</SPAN
697 > is still acting as a proxy, but just not 
698  doing any of the things that <SPAN
699 CLASS="APPLICATION"
700 >Privoxy</SPAN
701 > would
702  normally be expected to do. It is still a <SPAN
703 CLASS="QUOTE"
704 >"middle-man"</SPAN
705 > in 
706  the interaction between your browser and web sites.</P
707 ></DIV
708 ><DIV
709 CLASS="SECT2"
710 ><H3
711 CLASS="SECT2"
712 ><A
713 NAME="CRUNCH"
714 >4.16. My logs show <SPAN
715 CLASS="APPLICATION"
716 >Privoxy</SPAN
717 > <SPAN
718 CLASS="QUOTE"
719 >"crunches"</SPAN
720
721 ads, but also its own CGI pages. What is a <SPAN
722 CLASS="QUOTE"
723 >"crunch"</SPAN
724 >?</A
725 ></H3
726 ><P
727 > A <SPAN
728 CLASS="QUOTE"
729 >"crunch"</SPAN
730 > simply means <SPAN
731 CLASS="APPLICATION"
732 >Privoxy</SPAN
733 > intercepted 
734  <SPAN
735 CLASS="emphasis"
736 ><I
737 CLASS="EMPHASIS"
738 >something</I
739 ></SPAN
740 >, nothing more. Often this is indeed ads or
741  banners, but <SPAN
742 CLASS="APPLICATION"
743 >Privoxy</SPAN
744 > uses the same mechanism for
745  trapping requests for its own internal pages. For instance, a request for
746  <SPAN
747 CLASS="APPLICATION"
748 >Privoxy's</SPAN
749 > configuration page at: <A
750 HREF="http://config.privoxy.org"
751 TARGET="_top"
752 >http://config.privoxy.org</A
753 >, is
754  intercepted (i.e. it does not go out to the 'net), and the familiar CGI
755  configuration is returned to the browser, and the log consequently will show
756  a <SPAN
757 CLASS="QUOTE"
758 >"crunch"</SPAN
759 >.</P
760 ></DIV
761 ><DIV
762 CLASS="SECT2"
763 ><H3
764 CLASS="SECT2"
765 ><A
766 NAME="DOWNLOADS"
767 >4.17. Can <SPAN
768 CLASS="APPLICATION"
769 >Privoxy</SPAN
770 > effect files that I download
771 from a webserver? FTP server?</A
772 ></H3
773 ><P
774 > From the webserver's perspective, there is no difference between
775  viewing a document (i.e. a page), and downloading a file. The same is true of
776  <SPAN
777 CLASS="APPLICATION"
778 >Privoxy</SPAN
779 >. If there is a match for a <VAR
780 CLASS="LITERAL"
781 ><A
782 HREF="../user-manual/actions-file.html#BLOCK"
783 TARGET="_top"
784 >block</A
785 ></VAR
786 > pattern,
787  it will still be blocked, and of course this is obvious. 
788  </P
789 ><P
790 > Filtering is potentially more of a concern since the results are not always
791  so obvious, and the effects of filtering are there whether the file is simply
792  viewed, or downloaded. And potentially whether the content is some obnoxious
793  advertizement, or Mr. Jimmy's latest/greatest source code jewel. Of course,
794  one of these presumably is <SPAN
795 CLASS="QUOTE"
796 >"bad"</SPAN
797 > content that we don't want, and
798  the other is <SPAN
799 CLASS="QUOTE"
800 >"good"</SPAN
801 > content that we do want.
802  <SPAN
803 CLASS="APPLICATION"
804 >Privoxy</SPAN
805 > is blind to the differences, and can only
806  distinguish <SPAN
807 CLASS="QUOTE"
808 >"good from bad"</SPAN
809 > by the configuration parameters
810  <SPAN
811 CLASS="emphasis"
812 ><I
813 CLASS="EMPHASIS"
814 >we</I
815 ></SPAN
816 > give it.</P
817 ><P
818 > <SPAN
819 CLASS="APPLICATION"
820 >Privoxy</SPAN
821 > knows the differences in files according
822  to the <SPAN
823 CLASS="QUOTE"
824 >"Document Type"</SPAN
825 > as reported by the webserver. If this is
826  reported accurately (e.g. <SPAN
827 CLASS="QUOTE"
828 >"application/zip"</SPAN
829 > for a zip archive),
830  then <SPAN
831 CLASS="APPLICATION"
832 >Privoxy</SPAN
833 > knows to ignore these where
834  appropriate. <SPAN
835 CLASS="APPLICATION"
836 >Privoxy</SPAN
837 > potentially can filter HTML
838  as well as plain text documents, subject to configuration parameters of
839  course. Also, documents that are of an unknown type (generally assumed to be
840  <SPAN
841 CLASS="QUOTE"
842 >"text/plain"</SPAN
843 >) can be filtered, as will those that might be
844  incorrectly reported by the webserver. If such a file is a downloaded file
845  that is intended to be saved to disk, then any content that might have been
846  altered by filtering, will be saved too, for these (probably rare) cases.</P
847 ><P
848 > Note that versions later than 3.0.2 do NOT filter document types of
849  <SPAN
850 CLASS="QUOTE"
851 >"text/plain"</SPAN
852 >. Prior to this, <SPAN
853 CLASS="APPLICATION"
854 >Privoxy</SPAN
855 >
856  did filter this document type.</P
857 ><P
858 > In short, filtering is <SPAN
859 CLASS="QUOTE"
860 >"ON"</SPAN
861 > if a) the Document Type as reported
862  by the webserver is appropriate <SPAN
863 CLASS="emphasis"
864 ><I
865 CLASS="EMPHASIS"
866 >and</I
867 ></SPAN
868 > b) the configuration
869  allows it (or at least does not disallow it). That's it. There is no magic
870  cookie anywhere to say this is <SPAN
871 CLASS="QUOTE"
872 >"good"</SPAN
873 > and this is
874  <SPAN
875 CLASS="QUOTE"
876 >"bad"</SPAN
877 >. It's the configuration that let's it all happen or not.</P
878 ><P
879 > If you download text files, you probably do not want these to be filtered,
880  particularly if the content is source code, or other critical content. Source
881  code sometimes might be mistaken for Javascript (i.e. the kind that might
882  open a pop-up window). It is recommended to turn off filtering for download
883  sites (particularly if the content may be plain text files and you are using
884  version 3.0.2 or earlier) in your <TT
885 CLASS="FILENAME"
886 >user.action</TT
887 > file. And
888  also, for any site or page where making <SPAN
889 CLASS="emphasis"
890 ><I
891 CLASS="EMPHASIS"
892 >any</I
893 ></SPAN
894 > changes at
895  all to the content is to be avoided.</P
896 ><P
897 > <SPAN
898 CLASS="APPLICATION"
899 >Privoxy</SPAN
900 > does not do FTP at all, only HTTP 
901   protocols, so please don't even try.</P
902 ></DIV
903 ><DIV
904 CLASS="SECT2"
905 ><H3
906 CLASS="SECT2"
907 ><A
908 NAME="DOWNLOADS2"
909 >4.18. I just downloaded a Perl script, and <SPAN
910 CLASS="APPLICATION"
911 >Privoxy</SPAN
912 >
913 altered it! Yikes, what is wrong!</A
914 ></H3
915 ><P
916 > Please read above.</P
917 ></DIV
918 ><DIV
919 CLASS="SECT2"
920 ><H3
921 CLASS="SECT2"
922 ><A
923 NAME="SEEALSO"
924 >4.19. Where can I find more information about <SPAN
925 CLASS="APPLICATION"
926 >Privoxy</SPAN
927 >
928 and related issues?</A
929 ></H3
930 ><P
931 > Other references and sites of interest to <SPAN
932 CLASS="APPLICATION"
933 >Privoxy</SPAN
934 >
935  users:</P
936 ><P
937 > <P
938 ></P
939 ><TABLE
940 BORDER="0"
941 ><TBODY
942 ><TR
943 ><TD
944 >   <A
945 HREF="http://www.privoxy.org/"
946 TARGET="_top"
947 >http://www.privoxy.org/</A
948 >, 
949    the <SPAN
950 CLASS="APPLICATION"
951 >Privoxy</SPAN
952 > Home page. 
953   </TD
954 ></TR
955 ></TBODY
956 ></TABLE
957 ><P
958 ></P
959 >
960  <P
961 ></P
962 ><TABLE
963 BORDER="0"
964 ><TBODY
965 ><TR
966 ><TD
967 >   <A
968 HREF="http://www.privoxy.org/faq/"
969 TARGET="_top"
970 >http://www.privoxy.org/faq/</A
971 >, 
972    the <SPAN
973 CLASS="APPLICATION"
974 >Privoxy</SPAN
975 > FAQ. 
976   </TD
977 ></TR
978 ></TBODY
979 ></TABLE
980 ><P
981 ></P
982 >
983  <P
984 ></P
985 ><TABLE
986 BORDER="0"
987 ><TBODY
988 ><TR
989 ><TD
990 >   <A
991 HREF="http://sourceforge.net/projects/ijbswa/"
992 TARGET="_top"
993 >http://sourceforge.net/projects/ijbswa/</A
994 >, 
995    the Project Page for <SPAN
996 CLASS="APPLICATION"
997 >Privoxy</SPAN
998 > on 
999    <A
1000 HREF="http://sourceforge.net"
1001 TARGET="_top"
1002 >SourceForge</A
1003 >.
1004   </TD
1005 ></TR
1006 ></TBODY
1007 ></TABLE
1008 ><P
1009 ></P
1010 >
1011  <P
1012 ></P
1013 ><TABLE
1014 BORDER="0"
1015 ><TBODY
1016 ><TR
1017 ><TD
1018 >   <A
1019 HREF="http://config.privoxy.org/"
1020 TARGET="_top"
1021 >http://config.privoxy.org/</A
1022 >,
1023    the web-based user interface. <SPAN
1024 CLASS="APPLICATION"
1025 >Privoxy</SPAN
1026 > must be
1027    running for this to work. Shortcut: <A
1028 HREF="http://p.p/"
1029 TARGET="_top"
1030 >http://p.p/</A
1031 >
1032   </TD
1033 ></TR
1034 ></TBODY
1035 ></TABLE
1036 ><P
1037 ></P
1038 >
1039  <P
1040 ></P
1041 ><TABLE
1042 BORDER="0"
1043 ><TBODY
1044 ><TR
1045 ><TD
1046 >   <A
1047 HREF="javascript:w=Math.floor(screen.width/2);h=Math.floor(screen.height*0.9);void(window.open('http://www.privoxy.org/actions','Feedback','screenx='+w+',width='+w+',height='+h+',scrollbars=yes,toolbar=no,location=no,directories=no,status=no,menubar=no,copyhistory=no').focus());"
1048 TARGET="_top"
1049 >http://www.privoxy.org/actions/</A
1050 >, to submit <SPAN
1051 CLASS="QUOTE"
1052 >"misses"</SPAN
1053 > to the developers. 
1054   </TD
1055 ></TR
1056 ></TBODY
1057 ></TABLE
1058 ><P
1059 ></P
1060 >
1061  <P
1062 ></P
1063 ><TABLE
1064 BORDER="0"
1065 ><TBODY
1066 ><TR
1067 ><TD
1068 >   <A
1069 HREF="http://cvs.sourceforge.net/cgi-bin/viewcvs.cgi/ijbswa/contrib/"
1070 TARGET="_top"
1071 >http://cvs.sourceforge.net/cgi-bin/viewcvs.cgi/ijbswa/contrib/</A
1072 >, cool
1073    and fun ideas from <SPAN
1074 CLASS="APPLICATION"
1075 >Privoxy</SPAN
1076 > users.
1077   </TD
1078 ></TR
1079 ></TBODY
1080 ></TABLE
1081 ><P
1082 ></P
1083 >
1084  <P
1085 ></P
1086 ><TABLE
1087 BORDER="0"
1088 ><TBODY
1089 ><TR
1090 ><TD
1091 >   <A
1092 HREF="http://www.junkbusters.com/ht/en/cookies.html"
1093 TARGET="_top"
1094 >http://www.junkbusters.com/ht/en/cookies.html</A
1095 >,
1096    an explanation how cookies are used to track web users.
1097   </TD
1098 ></TR
1099 ></TBODY
1100 ></TABLE
1101 ><P
1102 ></P
1103 >
1104  <P
1105 ></P
1106 ><TABLE
1107 BORDER="0"
1108 ><TBODY
1109 ><TR
1110 ><TD
1111 >   <A
1112 HREF="http://www.junkbusters.com/ijb.html"
1113 TARGET="_top"
1114 >http://www.junkbusters.com/ijb.html</A
1115 >,
1116    the original Internet Junkbuster.
1117   </TD
1118 ></TR
1119 ></TBODY
1120 ></TABLE
1121 ><P
1122 ></P
1123 >
1124  <P
1125 ></P
1126 ><TABLE
1127 BORDER="0"
1128 ><TBODY
1129 ><TR
1130 ><TD
1131 >   <A
1132 HREF="http://www.waldherr.org/junkbuster/"
1133 TARGET="_top"
1134 >http://www.waldherr.org/junkbuster/</A
1135 >,
1136    Stefan Waldherr's version of Junkbuster, from which <SPAN
1137 CLASS="APPLICATION"
1138 >Privoxy</SPAN
1139 > was
1140    derived.
1141   </TD
1142 ></TR
1143 ></TBODY
1144 ></TABLE
1145 ><P
1146 ></P
1147 >
1148  <P
1149 ></P
1150 ><TABLE
1151 BORDER="0"
1152 ><TBODY
1153 ><TR
1154 ><TD
1155 >   <A
1156 HREF="http://privacy.net/analyze/"
1157 TARGET="_top"
1158 >http://privacy.net/analyze/</A
1159 >, a useful site
1160    to check what information about you is leaked while you browse the web.
1161   </TD
1162 ></TR
1163 ></TBODY
1164 ></TABLE
1165 ><P
1166 ></P
1167 >
1168  <P
1169 ></P
1170 ><TABLE
1171 BORDER="0"
1172 ><TBODY
1173 ><TR
1174 ><TD
1175 >   <A
1176 HREF="http://www.squid-cache.org/"
1177 TARGET="_top"
1178 >http://www.squid-cache.org/</A
1179 >, a very popular
1180    caching proxy, which is often used together with <SPAN
1181 CLASS="APPLICATION"
1182 >Privoxy</SPAN
1183 >.
1184   </TD
1185 ></TR
1186 ></TBODY
1187 ></TABLE
1188 ><P
1189 ></P
1190 >
1191  <P
1192 ></P
1193 ><TABLE
1194 BORDER="0"
1195 ><TBODY
1196 ><TR
1197 ><TD
1198 >   <A
1199 HREF="http://www.privoxy.org/developer-manual/"
1200 TARGET="_top"
1201 >http://www.privoxy.org/developer-manual/</A
1202 >, 
1203    the <SPAN
1204 CLASS="APPLICATION"
1205 >Privoxy</SPAN
1206 > developer manual. 
1207   </TD
1208 ></TR
1209 ></TBODY
1210 ></TABLE
1211 ><P
1212 ></P
1213 ></P
1214 ></DIV
1215 ><DIV
1216 CLASS="SECT2"
1217 ><H3
1218 CLASS="SECT2"
1219 ><A
1220 NAME="MICROSUCK"
1221 >4.20. I've noticed that Privoxy changes <SPAN
1222 CLASS="QUOTE"
1223 >"Microsoft"</SPAN
1224 > to 
1225 <SPAN
1226 CLASS="QUOTE"
1227 >"MicroSuck"</SPAN
1228 >! Why are you manipulating my browsing?</A
1229 ></H3
1230 ><P
1231 > We're not. The text substitutions that you are seeing are disabled
1232  in the default configuration as shipped. You have either manually
1233  activated the <SPAN
1234 CLASS="QUOTE"
1235 >"<VAR
1236 CLASS="LITERAL"
1237 >fun</VAR
1238 >"</SPAN
1239 > filter which
1240  is clearly labeled <SPAN
1241 CLASS="QUOTE"
1242 >"Text replacements for subversive browsing
1243  fun!"</SPAN
1244 > or you have implicitly activated it by choosing the
1245  <SPAN
1246 CLASS="QUOTE"
1247 >"Adventuresome"</SPAN
1248 > profile in the web-based editor (formerly known 
1249  as the <SPAN
1250 CLASS="APPLICATION"
1251 >Advanced</SPAN
1252 > profile).</P
1253 ></DIV
1254 ></DIV
1255 ><DIV
1256 CLASS="NAVFOOTER"
1257 ><HR
1258 ALIGN="LEFT"
1259 WIDTH="100%"><TABLE
1260 SUMMARY="Footer navigation table"
1261 WIDTH="100%"
1262 BORDER="0"
1263 CELLPADDING="0"
1264 CELLSPACING="0"
1265 ><TR
1266 ><TD
1267 WIDTH="33%"
1268 ALIGN="left"
1269 VALIGN="top"
1270 ><A
1271 HREF="configuration.html"
1272 ACCESSKEY="P"
1273 >Prev</A
1274 ></TD
1275 ><TD
1276 WIDTH="34%"
1277 ALIGN="center"
1278 VALIGN="top"
1279 ><A
1280 HREF="index.html"
1281 ACCESSKEY="H"
1282 >Home</A
1283 ></TD
1284 ><TD
1285 WIDTH="33%"
1286 ALIGN="right"
1287 VALIGN="top"
1288 ><A
1289 HREF="trouble.html"
1290 ACCESSKEY="N"
1291 >Next</A
1292 ></TD
1293 ></TR
1294 ><TR
1295 ><TD
1296 WIDTH="33%"
1297 ALIGN="left"
1298 VALIGN="top"
1299 >Configuration</TD
1300 ><TD
1301 WIDTH="34%"
1302 ALIGN="center"
1303 VALIGN="top"
1304 >&nbsp;</TD
1305 ><TD
1306 WIDTH="33%"
1307 ALIGN="right"
1308 VALIGN="top"
1309 >Troubleshooting</TD
1310 ></TR
1311 ></TABLE
1312 ></DIV
1313 ></BODY
1314 ></HTML
1315 >