Add the ability to check jpeg images for invalid
[privoxy.git] / default.action.master
1 ######################################################################
2
3 #  File        :  $Source: /cvsroot/ijbswa/current/default.action.master,v $
4
5 #  $Id: default.action.master,v 1.8 2003/09/22 00:33:01 david__schmidt Exp $
6 #
7 #  Purpose     :  Default actions file, see
8 #                 http://www.privoxy.org/user-manual/actions-file.html
9 #
10 #  Copyright   :  Written by and Copyright
11 #                 Privoxy team. http://www.privoxy.org/
12 #
13 #                 Based on the Internet Junkbuster originally written
14 #                 by and Copyright (C) 1997 Anonymous Coders and
15 #                 Junkbusters Corporation.  http://www.junkbusters.com
16
17 # Note: Updated versions of this file will be made available from time
18 #       to time. Check http://sourceforge.net/project/showfiles.php?group_id=11118
19 #       for updates and/or subscribe to the announce mailing list
20 #       (http://lists.sourceforge.net/lists/listinfo/ijbswa-announce) if you
21 #       wish to receive an email notice whenever updates are released.
22 #
23 # We value your feedback. However, to provide you with the best support,
24 # please note:
25 #  
26 #  * Use the support forum to get help:
27 #    http://sourceforge.net/tracker/?group_id=11118&atid=211118
28 #  * Submit feedback for this actions file only through our
29 #    actions file feedback script: http://www.privoxy.org/actions
30 #  * Submit bugs only through our bug forum:
31 #    http://sourceforge.net/tracker/?group_id=11118&atid=111118 
32 #    Make sure that the bug has not already been submitted. Please try
33 #    to verify that it is a Privoxy bug, and not a browser or site
34 #    bug first. If you are using your own custom configuration, please
35 #    try the stock configs to see if the problem is a configuration
36 #    related bug. And if not using the latest development snapshot,
37 #    please try the latest one. Or even better, CVS sources.
38 #  * Submit feature requests only through our feature request forum:
39 #    http://sourceforge.net/tracker/?atid=361118&group_id=11118&func=browse
40 #      
41 # For any other issues, feel free to use the mailing lists:
42 # http://sourceforge.net/mail/?group_id=11118
43 #    
44 # Anyone interested in actively participating in development and related
45 # discussions can join the appropriate mailing list here:
46 # http://sourceforge.net/mail/?group_id=11118. Archives are available
47 # here too.
48
49 #############################################################################
50 # Syntax
51 #############################################################################
52
53 # To determine which actions apply to a request, the URL of the request is
54 # compared to all patterns in this file. Every time it matches, the list of
55 # applicable actions for this URL is incrementally updated. You can trace
56 # this process by visiting http://i.j.b/show-url-info
57 #
58 # There are 4 types of lines in this file: comments (like this line),
59 # actions, aliases and patterns, all of which are explained below.
60 #
61 #############################################################################
62 # Pattern Syntax
63 #############################################################################
64
65 # 1. On Domains and Paths
66 # -----------------------
67 #
68 # Generally, a pattern has the form <domain>/<path>, where both the <domain>
69 # and <path> part are optional. If you only specify a domain part, the "/"
70 # can be left out:
71
72 # www.example.com 
73 #   is a domain-only pattern and will match any request to www.yahoo.com
74
75 # www.example.com/
76 #   means exactly the same (but is slightly less efficient)
77
78 # www.example.com/index.html
79 #   matches only the document /index.html on www.example.com
80
81 # /index.html
82 #   matches the document /index.html, regardless of the domain
83
84 # index.html
85 #   matches nothing, since it would be interpreted as a domain name and
86 #   there is no top-level domain called ".html".
87
88 # 2. Domain Syntax
89 # ----------------
90
91 # The matching of the domain part offers some flexible options: If the
92 # domain starts or ends with a dot, it becomes unanchored at that end:
93
94 # www.example.com
95 #   matches only www.example.com
96
97 # .example.com
98 #   matches any domain that ENDS in .example.com
99
100 # www.
101 #   matches any domain that STARTS with www.
102 #
103 # .example.
104 #   matches any domain that CONTAINS example
105 #
106
107 # Additionally, there are wildcards that you can use in the domain names
108 # themselves. They work pretty similar to shell wildcards: "*" stands for
109 # zero or more arbitrary characters, "?" stands for one, and you can define
110 # charachter classes in square brackets and they can be freely mixed:
111
112 # ad*.example.com
113 #   matches adserver.example.com, ads.example.com, etc but not sfads.example.com
114
115 # *ad*.example.com
116 #   matches all of the above
117
118 # .?pix.com
119 #   matches www.ipix.com, pictures.epix.com, a.b.c.d.e.upix.com etc
120
121 # www[1-9a-ez].example.com
122 #   matches www1.example.com, www4.example.com, wwwd.example.com, 
123 #   wwwz.example.com etc, but not wwww.example.com
124
125 # You get the idea?
126
127 # 2. Path Syntax
128 # --------------
129
130 # Paths are specified as regular expressions. A comprehensive discussion of
131 # regular expressions wouldn't fit here, but (FIXME) someone should paste
132 # a concise intro to the regex language here.
133
134 # Perl compatible regular expressions are used. See the pcre/docs/ direcory or
135 # man perlre (also available on http://www.perldoc.com/perl5.6/pod/perlre.html)
136 # for details. The appendix to the user manual also has some detail.
137
138 # Please note that matching in the path is CASE INSENSITIVE by default, but
139 # you can switch to case sensitive by starting the pattern with the "(?-i)"
140 # switch:
141
142 # www.example.com/(?-i)PaTtErN.*
143 #   will match only documents whose path starts with PaTtErN in exactly this
144 #   capitalization.
145 #
146 # Partially case-sensetive and partially case-insensitive patterns are
147 # possible, but the rules about splitting them up are extremely complex
148 # - see the PCRE documentation for more information.
149
150 #############################################################################
151 # Action Syntax
152 #############################################################################
153 #
154 # There are 3 kinds of action:
155 #
156 # Boolean (e.g. "block"):
157 #   +name  # enable
158 #   -name  # disable
159 #
160 # Parameterized (e.g. "hide-user-agent"):
161 #   +name{param}  # enable and set parameter to "param"
162 #   -name         # disable
163 #
164 # Multi-value (e.g. "add-header", "send-wafer"):
165 #   +name{param}  # enable and add parameter "param"
166 #   -name{param}  # remove the parameter "param"
167 #   -name         # disable totally
168 #
169 # The default (if you don't specify anything in this file) is not to take
170 # any actions - i.e completely disabled, so Privoxy will just be a
171 # normal, non-blocking, non-anonymizing proxy.  You must specifically
172 # enable the privacy and blocking features you need (although the 
173 # provided default actions file will do that for you).
174 #
175 # Later actions always override earlier ones.  For multi-valued actions,
176 # the actions are applied in the order they are specified.
177 #
178 #############################################################################
179 # Valid actions are:
180 #############################################################################
181 #
182 # +add-header{Name: value}
183 #    Adds the specified HTTP header, which is not checked for validity.
184 #    You may specify this many times to specify many headers.
185 #
186 # +block
187 #    Block this URL
188 #
189 # +deanimate-gifs{last}
190 # +deanimate-gifs{first}
191 #    Deanimate all animated GIF images, i.e. reduce them to their last
192 #    frame. This will also shrink the images considerably. (In bytes,
193 #    not pixels!) 
194 #    If the option "first" is given, the first frame of the animation
195 #    is used as the replacement. If "last" is given, the last frame of
196 #    the animation is used instead, which propably makes more sense for
197 #    most banner animations, but also has the risk of not showing the
198 #    entire last frame (if it is only a delta to an earlier frame).
199 #
200 # +downgrade-http-version
201 #    Downgrade HTTP/1.1 client requests to HTTP/1.0 and downgrade the
202 #    responses as well. Use this action for servers that use HTTP/1.1
203 #    protocol features that Privoxy currently can't handle yet.
204 #
205 # +fast-redirects
206 #    Many sites, like yahoo.com, don't just link to other sites.
207 #    Instead, they will link to some script on their own server,
208 #    giving the destination as a parameter, which will then redirect
209 #    you to the final target. 
210 #
211 #    URLs resulting from this scheme typically look like:
212 #    http://some.place/some_script?http://some.where-else
213 #
214 #    Sometimes, there are even multiple consecutive redirects encoded
215 #    in the URL. These redirections via scripts make your web browing
216 #    more traceable, since the server from which you follow such a link
217 #    can see where you go to. Apart from that, valuable bandwidth and
218 #    time is wasted, while your browser aks the server for one redirect
219 #    after the other. Plus, it feeds the advertisers.
220 #
221 #    The +fast-redirects option enables interception of these requests
222 #    by Privoxy, who will cut off all but the last valid URL in the
223 #    request and send a local redirect back to your browser without
224 #    contacting the intermediate sites.
225 #
226 # +filter{name}
227 #    Filter the website through one or more regular expression filters.
228 #    Repeat for multiple filters.
229 #   
230 #    Filters predefined in the supplied default.action include:
231 #
232 #     js-annoyances:       Get rid of particularly annoying JavaScript abuse
233 #     html-annoyances:     Get rid of particularly annoying HTML abuse
234 #     content-cookies:     Kill cookies that come in the HTML or JS content
235 #     webbugs:             Squish WebBugs (1x1 invisible GIFs used for user tracking)
236 #     popups:              Kill all popups in JS and HTML
237 #     frameset-borders:    Give frames a border
238 #     refresh-tags:        Kill automatic refresh tags (for dial-on-demand setups)
239 #     img-reorder:         Reorder attributes in <img> tags to make the banners-by-* filters more effective
240 #     banners-by-size:     Kill banners by size (very efficient!)
241 #     banners-by-link:     Kill banners by their links to known clicktrackers 
242 #     fun:                 Text replacements  for subversive browsing fun!
243 #     nimda:               Remove Nimda (virus) code.
244 #     shockwave-flash:     Kill embedded Shockwave Flash objects
245 #     quicktime-kioskmode: Make Quicktime movies saveable
246 #     js-events:           Kill all JS event bindings (Radically destructive! Use only on real suckers)
247 #     crude-parental:      Kill all web pages that contain the words "sex" or "warez"
248 #
249 # +hide-forwarded-for-headers
250 #    Block any existing X-Forwarded-for header, and do not add a new one.
251 #
252 # +hide-from-header{block}
253 # +hide-from-header{spam@sittingduck.xqq}
254 #    If the browser sends a "From:" header containing your e-mail address, 
255 #    either completely removes the header ("block"), or change it to the
256 #    specified e-mail address.
257 #
258 # +hide-referer{block}
259 # +hide-referer{forge}
260 # +hide-referer{http://nowhere.com}
261 #    Don't send the "Referer:" (sic) header to the web site.  You can
262 #    block it, forge a URL to the same server as the request (which is
263 #    preferred because some sites will not send images otherwise) or
264 #    set it to a constant string.
265 #
266 # +hide-referrer{...}
267 #    Alternative spelling of +hide-referer.  Has the same parameters,
268 #    and can be freely mixed with, "+hide-referer".  ("referrer" is the 
269 #    correct English spelling, however the HTTP specification has a 
270 #    bug - it requires it to be spelt "referer").
271 #
272 # +hide-user-agent{browser-type}
273 #    Change the "User-Agent:" header so web servers can't tell your
274 #    browser type.  (Breaks many web sites).  Specify the user-agent
275 #    value you want - e.g., to pretend to be using Netscape on Linux:
276 #      +hide-user-agent{Mozilla (X11; I; Linux 2.0.32 i586)}
277 #    Or to identify yourself explicitly as a Privoxy user:
278 #      +hide-user-agent{Privoxy/1.0}
279 #    (Don't change the version number from 1.0 - after all, why tell them?)
280 #
281 # +handle-as-image
282 #    Treat this URL as an image.  This only matters if it's also "+block"ed,
283 #    in which case a "blocked" image can be sent rather than a HTML page.
284 #    See +set-image-blocker{} for the control over what is actually sent.
285 #
286 # +inspect-jpegs
287 #    Scan jpeg headers for malformed comment blocks and correct them.
288 #
289 # +set-image-blocker{blank}
290 # +set-image-blocker{pattern}
291 # +set-image-blocker{custom}
292 # +set-image-blocker{<URL>} with <url> being any valid image URL
293 #    Decides what to do with URLs that end up tagged with {+block +handle-as-image}.
294 #    There are 5 options:
295 #      * "-set-image-blocker" will send a HTML "blocked" page, usually
296 #         resulting in a "broken image" icon.
297 #      * "+set-image-blocker{blank}" will send a 1x1 transparent image
298 #      * "+set-image-blocker{pattern}" will send a 4x4 grey/white pattern
299 #        which is easier to recognize than the transparent one.
300 #      * "+set-image-blocker{custom}" will send an image file as specified
301 #        in the config file (see image-blocker-custom-file within config).
302 #      * "+set-image-blocker{<URL>}" will send a HTTP temporary redirect
303 #        to the specified image URL.
304 #
305 #
306 # +limit-connect{portlist}
307 #   The CONNECT methods exists in HTTP to allow access to secure websites
308 #   (https:// URLs) through proxies. It works very simply: The proxy
309 #   connects to the server on the specified port, and then short-circuits
310 #   its connections to the cliant and to the remote proxy.
311 #   This can be a big security hole, since CONNECT-enabled proxies can
312 #   be abused as TCP relays very easily.
313 #   By default, i.e. in the absence of a +limit-connect action, Privoxy
314 #   will only allow CONNECT requests to port 443, which is the standard port
315 #   for https.
316 #   If you want to allow CONNECT for more ports than that, or want to forbid
317 #   CONNECT altogether, you can specify a comma separated list of ports and port
318 #   ranges (the latter using dashes, with the minimum defaulting to 0 and max to 65K):
319 #
320 #   +limit-connect{443} # This is the default and need no be specified.
321 #   +limit-connect{80,443} # Ports 80 and 443 are OK.
322 #   +limit-connect{-3, 7, 20-100, 500-} # Port less than 3, 7, 20 to 100, and above 500 are OK.
323 #
324 # +prevent-compression
325 #    Prevent the website from compressing the data. Some websites do
326 #    that, which is a problem for Privoxy, since +filter, +kill-popups
327 #    and +gif-deanimate will not work on compressed data. Will slow down
328 #    connections to those websites, though.
329 #
330 # +prevent-keeping-cookies
331 # +session-cookies-only
332 #    If the website sets cookies, make sure they are erased when you exit
333 #    and restart your web browser.  This makes profiling cookies useless,
334 #    but won't break sites which require cookies so that you can log in
335 #    or for transactions.
336 #
337 # +crunch-outgoing-cookies
338 #    Prevent the website from reading cookies
339 #
340 # +crunch-incoming-cookies
341 #    Prevent the website from setting cookies
342 #
343 # +kill-popups
344 #    Filter the website through a built-in filter to disable
345 #    window.open() etc.  The two alternative spellings are
346 #    equivalent.
347 #
348 # +send-vanilla-wafer
349 #    This action only applies if you are using a jarfile.  It sends a
350 #    cookie to every site stating that you do not accept any copyright
351 #    on cookies sent to you, and asking them not to track you.  Of
352 #    course, this is a (relatively) unique header they could use to 
353 #    track you.
354 #
355 # +send-wafer{name=value}
356 #    This allows you to add an arbitrary cookie.  Specify it multiple
357 #    times in order to add several cookies.
358 #
359 #############################################################################
360
361 #############################################################################
362 # Settings -- Don't change.
363 #############################################################################
364 {{settings}}
365 #############################################################################
366 for-privoxy-version=3.0
367
368 #############################################################################
369 # Aliases
370 #############################################################################
371 {{alias}}
372 #############################################################################
373 #
374 # You can define a short form for a list of permissions - e.g., instead
375 # of "-crunch-incoming-cookies -crunch-outgoing-cookies -filter -fast-redirects",
376 # you can just write "shop". This is called an alias.
377 #
378 # Currently, an alias can contain any character except space, tab, '=', '{'
379 # or '}'.
380 # But please use only 'a'-'z', '0'-'9', '+', and '-'.
381 #
382 # Alias names are not case sensitive.
383 #
384 # Aliases beginning with '+' or '-' may be used for system action names 
385 # in future releases - so try to avoid alias names like this.  (e.g. 
386 # "+crunch-all-cookies" below is not a good name)
387 #
388 # Aliases must be defined before they are used.
389
390
391 # These aliases just save typing later:
392 #
393 +crunch-all-cookies = +crunch-incoming-cookies +crunch-outgoing-cookies
394 -crunch-all-cookies = -crunch-incoming-cookies -crunch-outgoing-cookies
395  allow-all-cookies  = -crunch-all-cookies -session-cookies-only
396  allow-popups       = -filter{popups} -kill-popups
397 +block-as-image     = +block +handle-as-image
398 -block-as-image     = -block
399
400 # These aliases define combinations of actions
401 # that are useful for certain types of sites:
402 #
403 fragile     = -block -crunch-all-cookies -filter -fast-redirects -hide-referer -kill-popups
404 shop        = -crunch-all-cookies allow-popups
405
406 # Your favourite blend of filters:
407 #
408 myfilters   = +filter{html-annoyances} +filter{js-annoyances} +filter{popups}\
409               +filter{webbugs} +filter{nimda} +filter{banners-by-size} #+filter{fun}
410
411 # Allow ads for selected useful free sites:
412 #
413 allow-ads   = -block -filter{banners-by-size} -filter{banners-by-link}
414 #... etc.  Customize to your heart's content.
415
416
417 #############################################################################
418 # Defaults
419 #############################################################################
420 { \
421 -add-header \
422 -block \
423 -crunch-outgoing-cookies \
424 -crunch-incoming-cookies \
425 +deanimate-gifs{last} \
426 -downgrade-http-version \
427 -fast-redirects \
428 +filter{js-annoyances} \
429 +filter{html-annoyances} \
430 +filter{content-cookies} \
431 +filter{webbugs} \
432 +filter{popups} \
433 -filter{frameset-borders} \
434 -filter{refresh-tags} \
435 -filter{img-reorder} \
436 +filter{banners-by-size} \
437 -filter{banners-by-link} \
438 -filter{fun} \
439 +filter{nimda} \
440 -filter{shockwave-flash} \
441 +filter{quicktime-kioskmode} \
442 -filter{js-events} \
443 -filter{crude-parental} \
444 -handle-as-image \
445 +hide-forwarded-for-headers \
446 +hide-from-header{block} \
447 +hide-referrer{forge} \
448 -hide-user-agent \
449 +inspect-jpegs \
450 -kill-popups \
451 -limit-connect \
452 +prevent-compression \
453 -send-vanilla-wafer \
454 -send-wafer \
455 +session-cookies-only \
456 +set-image-blocker{pattern} \
457 }
458 / # Match all URLs
459
460 #############################################################################
461 # Needed for automatic feedback evaluation; Please don't change or delete!
462 #############################################################################
463 {+add-header{X-Actions-File-Version: 1.5} -filter -kill-popups}
464 .privoxy.org
465 .oesterhelt.org/actions
466
467 #############################################################################
468 # These extensions belong to images:
469 #############################################################################
470 {+handle-as-image}
471 #############################################################################
472 /.*\.(gif|jpe?g|png|bmp|ico)($|\?)
473
474 #############################################################################
475 # Generic block patterns (the most effective!):
476 #############################################################################
477 {+block}
478 #MASTER# DONT-VERIFY (generic)
479
480 # By hostname:
481 #
482 ad*.
483 .*ads.
484 *banner*.
485 count*.
486
487 # By path:
488 #
489 /(.*/)?(ads(erver?|tream)?|.*?ads/|ad/|adv(iew|ert(s|enties|is(ing|e?ments)?)?)?|(ad|all|nn)?[-_]?banner(s|ads?|farm)?)
490 /(.*/)?(publicite|werbung|rekla(ma|me|am)|annonse|maino(kset|nta|s)?/)
491 /.*(count|track)(er|run)?\.(pl|cgi|exe|dll|asp|php[34]?)
492 /.*promo.gif
493
494 #############################################################################
495 # Site-specific block patterns;
496 #############################################################################
497
498 #MASTER# BLOCK-REFERRER: http://www.brooksbrothers.com/
499 #MASTER# BLOCK-REFERRER: http://www.autodesk.com/
500 .hitbox.com 
501 #MASTER# BLOCK-REFERRER: http://www.the-gadgeteer.com/palmos.html
502 www.the-gadgeteer.com/cgi-bin/getimage.cgi/
503 #MASTER# BLOCK-REFERRER: http://www.stern.de/
504 www.stern.de/bilder/poweredby
505 #MASTER# BLOCK-REFERRER: http://www.gmx.net/de/cgi/logoutpage?CN=sJywqKCElHw%3D%3D
506 images.gmx.net/images/bs/
507 #MASTER# BLOCK-REFERRER: http://www.max.de/
508 .akamaitech.net/.*/img/e-commerce
509 www.max.de/_teaser/partner/
510 #MASTER# BLOCK-REFERRER: http://search.atomz.com/search/?sp-k=&sp-p=any&sp-a=sp1001395b&sp-q=linux
511 search.atomz.com/search/i/tagw1c.gif
512 www.intelligentx.com/newsletters/.*\.gif
513 #MASTER# BLOCK-REFERRER: http://www.whowhere.lycos.com/ThreeD/explain.html
514 www.whowhere.lycos.com/images/ebay_bst.gif
515 www.whowhere.lycos.com/images/find_books.gif
516 www.whowhere.lycos.com/images/1800/advppl1.gif
517 #MASTER# BLOCK-REFERRER: http://realguide.real.com/games/
518 i.real.com/g/pics/games/gamepass_120x600_2.gif
519 #MASTER# BLOCK-REFERRER: http://www1.chathouse.com/roomplan.html
520 www*.chathouse.com/chatimages/whopersonal.gif
521 #MASTER# BLOCK-REFERRER: http://www.beseen.com/
522 www.beseen.com/images/website3.gif
523 #MASTER# BLOCK-REFERRER: http://www.planetspiele.de/
524 .planetspiele.de/gfx/partner
525 #MASTER# BLOCK-REFERRER: http://www.hot.ee/toptools/
526 #MASTER# REMARKS: Yes, block *all* their graphics.
527 www.hot.ee/.*\.(gif|jpe?g)
528 top.ultraseek.net/top_sit.*\.gif
529 #MASTER# BLOCK-REFERRER: http://kickme.to/FOSI
530 fosi.ural.net/.*\.jpg
531 #MASTER# BLOCK-REFERRER: http://www.tucows.com/
532 .tucows.com/images/dodi.gif
533 .tucows.com/images/elibrary_searchTop.gif
534 #MASTER# BLOCK-REFERRER: http://www.ix.de/
535 #MASTER# BLOCK-REFERRER: http://www.heise.de/
536 /icons/emedia_b.gif
537 #MASTER# BLOCK-REFERRER: http://dest.travelocity.com/DestGuides/geo_frontdoor/0,,TRAVELOCITY,00.html?HPTRACK=icon_dest
538 dest.travelocity.com/website/destinations/images/partner_frommers.gif
539 dest.travelocity.com/website/destinations/images/travelex_logo.gif
540 #MASTER# BLOCK-REFERRER: http://cobolreport.com/
541 cobolreport.com/images/canam1.gif
542 cobolreport.com/images/Acucorp1.gif
543 cobolreport.com/images/netcobol.jpg
544 cobolreport.com/images/NetCOBOL-banner.gif
545 objectz.com/images/Landmark%20120x240.gif
546 #MASTER# BLOCK-REFERRER: http://www.theregister.co.uk/
547 www.theregister.co.uk/media
548 #MASTER# BLOCK-REFERRER: http://www.dpreview.com/reviews/canons40/
549 tribalfusion.speedera.net
550 .tribalfusion.com/media/
551 #MASTER# BLOCK-REFERRER: http://www.portalofevil.com/
552 b*.portalofevil.com/shlv
553 #MASTER# BLOCK-REFERRER: http://us.imdb.com/Quotes?0110912
554 i.imdb.com/Vpics/
555 #MASTER# BLOCK-REFERRER: http://us.imdb.com/Title?0110912
556 i.imdb.com/Photos/CMSIcons
557 rcm.amazon.com
558 #MASTER# BLOCK-REFERRER: http://us.imdb.com/Trivia?0110116
559 i.imdb.com/Icons/apix/
560 #MASTER# BLOCK-REFERRER: http://www.nytimes.com/
561 .nytimes.com/adx/
562 #MASTER# BLOCK-REFERRER: http://www.salon.com/
563 www.salon.com/Creatives
564 images.salon.com/plus/gear/src/
565 #MASTER# BLOCK-REFERRER: http://www.sourceforge.net/
566 images.sourceforge.net/images/DB2powered.gif
567
568 #############################################################################
569 # Generic block-as-image patterns:
570 #############################################################################
571 {+block-as-image}
572 #MASTER# BLOCK-REFERRER: http://experts-exchange.com/os2gen/
573 /.*adimage\.(php|cgi)
574
575 #############################################################################
576 # Site-specific block-as-image patterns:
577 #############################################################################
578 #MASTER# BLOCK-REFERRER: http://www.cnn.com/
579 #MASTER# BLOCK-REFERRER: http://www.aol.com/
580 ar.atwola.com 
581 #MASTER# BLOCK-REFERRER: http://www.altavista.com/
582 #MASTER# BLOCK-REFERRER: http://www.tecchannel.de/
583 #MASTER# BLOCK-REFERRER: http://www.whowhere.lycos.com/
584 .[a-vx-z]*.doubleclick.net
585 #MASTER# BLOCK-REFERRER: http://www.theinquirer.net/
586 netcomm.spinbox.net
587 #MASTER# BLOCK-REFERRER: http://www.joecartoon.com/
588 servedby.advertising.com
589 #MASTER# BLOCK-REFERRER: http://hwww.yahoo.com/
590 .a.yimg.com/(?:(?!/i/).)*$
591 .a[0-9].yimg.com/(?:(?!/i/).)*$
592 .yimg.com/.*/a/
593 .yimg.com/.*/flash/promotions
594 #MASTER# BLOCK-REFERRER: http://www.kostenlos.de/
595 werbung.guj.de
596 #MASTER# DONT-VERIFY
597 bs*.gsanet.com
598 bs*.einets.com
599 #MASTER# DONT-VERIFY (Opera browser built-in ads)
600 .qkimg.net
601 /scripts/cms/xcms.asp
602 #MASTER# BLOCK-REFERRER: http://www.sevac.com/
603 .sexcounter.
604 #MASTER# BLOCK-REFERRER: http://www.asahi.com/
605 www.asahi.com/(.*/)?ad/
606 #MASTER# BLOCK-REFERRER: http://www.travelocity.com/Vacations/0,,TRAVELOCITY||Y,00.html?HPTRACK=mpc_vac
607 #MASTER# BLOCK-REFERRER: http://dest.travelocity.com/DestGuides/geo_frontdoor/0,,TRAVELOCITY,00.html?HPTRACK=icon_dest
608 .travelocity./Sponsor_gifs/
609 #MASTER# DONT-VERIFY
610 #MASTER# REMARKS: Bannerfarms used by grokster and others:
611 james.adbutler.de
612 gkas.de/affilinet
613 #MASTER# BLOCK-REFERRER: http://www.macaddict.com/
614 130.94.70.82
615 #MASTER# BLOCK-REFERRER: http://asitreff.6x.to/
616 cashformel.com/web-sponsor
617 www.cash4banner.com/web-sponsor
618 213.221.106.162
619 #MASTER# BLOCK-REFERRER: http://www.ebay.com
620 pics.ebay.com/aw/pics/homepage/big8
621 #MASTER# BLOCK-REFERRER: http://www.falk-online.de/index.jsp
622 #MASTER# REMARKS: ad*.adsolution.de
623 62.26.220.2
624 62.27.38.2
625 62.27.57.2
626 #MASTER# BLOCK-REFERRER: unknown
627 #MASTER# REMARKS: both exist and are banner farms
628 www.bannermania.nom.pl
629 magic.koti.com.pl/cgi-magic/banner_img.cgi
630 #MASTER# BLOCK-REFERRER: http://www.linuxdot.org/cgi-bin/columns.cgi?id=26
631 naturalismedicina.com/cgibin/linswap
632 #MASTER# BLOCK-REFERRER: http://www.dhtmlplanet.com/
633 statse.webtrendslive.com
634 #MASTER# BLOCK-REFERRER: http://www.versiontracker.com/
635 #MASTER# REMARKS: 1) Used on many sites 2) URLs don't _end_ in .gif, hence +imageblock
636 spinbox.versiontracker.com/.*\.gif
637 #MASTER# BLOCK-REFERRER: http://educ8search.tripod.com/hacksoft.html
638 #MASTER# REMARKS: Counter
639 .netscape.com/c\.cgi\?
640 #MASTER# BLOCK-REFERRER: http://privacy.net/analyze/
641 a.consumer.net
642 #MASTER# BLOCK-REFERRER: http://mycroft.mozdev.org/
643 #MASTER# REMARKS: Counter
644 m[0-9].nedstatbasic.net
645 #MASTER# BLOCK-REFERRER: http://salon.com/
646 #MASTER# REMARKS: Banner farms; just exclude their corp. info
647 [a-v,x-z]*.atdmt.com/
648 #MASTER# BLOCK-REFERRER: http://www.deviantart.com/
649 images.deviantart.com/affiliates/
650 images.deviantart.com/shared/(winzip|trillian)\.gif
651 #MASTER# DONT-VERIFY
652 #MASTER# REMARKS: Referenced from HTML-Emails
653 .weather.com/creatives/
654 .weather.com/web/services/email/
655
656 #############################################################################
657 # Generic unblockers to narrow the side effects of the generic blockers:
658 #############################################################################
659 {-block}
660 #MASTER# DONT-VERIFY (generic)
661
662 # By host:
663 #
664 adsl.
665 ad[ud]*.
666 advice.
667 .edu
668 .ac.uk
669 .uni-*.de
670 .*load*.
671
672 # By path:
673 #
674 /.*ad(sl|v(i[cs]|an|ertencia|entu)) # advice/advisories/advan*/advertencia (spanish)
675 /.*((up|down)lo|p?thre|he|d|gr|l|ro)ads
676 /.*account
677
678 #############################################################################
679 # Site-specific unblockers:
680 #############################################################################
681 #MASTER# UNBLOCK-REFERRER: http://bannerblind.mozdev.org/
682 bannerblind.mozdev.org
683 #MASTER# UNBLOCK-REFERRER: http://advogato.org/
684 advogato.org
685 #MASTER# UNBLOCK-REFERRER: http://www.handelsblatt.com/
686 ad*.vhb.de
687 #MASTER# UNBLOCK-REFERRER: http://www.ugu.com/
688 www.ugu.com/sui/ugu/adv
689 #MASTER# UNBLOCK-REFERRER: http://www.globalintersec.com/adv/sendtemp-2001021302.txt
690 www.globalintersec.com/adv
691 #MASTER# UNBLOCK-REFERRER: http://www.wunderground.com/geo/BannerPromo/US/NY/New_York.html
692 banners.wunderground.com/banner/
693 #MASTER# UNBLOCK-REFERRER: http://www.sueddeutsche.de/
694 www.sueddeutsche.de/.*banner
695 #MASTER# UNBLOCK-REFERRER: http://www.openoffice.org/
696 www.openoffice.org/banners/
697 #MASTER# UNBLOCK-REFERRER: http://capwiz.com/ieeeusa/home/
698 capwiz.com/ieee/images/banner.gif
699 #MASTER# UNBLOCK-REFERRER: http://security.greymagic.com/
700 sec*.greymagic.com/adv/
701 #MASTER# UNBLOCK-REFERRER: http://www.foxnews.com
702 .foxnews.com/images/banners/(sec|logo)
703 #MASTER# UNBLOCK-REFERRER: http://www.comdirect.de/
704 #MASTER# REMARKS: Used as link tracker on (needed) internal links
705 www.comdirect.de/stat/count.php
706 #MASTER# UNBLOCK-REFERRER: http://www.amazon.com/exec/obidos/tg/browse/-/130/ref=gw_br_dvd/102-9730978-3540926
707 #MASTER# REMARKS: Part of site decoration
708 .amazon.com/.*/banners/
709 #MASTER# UNBLOCK-REFERRER: http://www.washingtonpost.com/wp-dyn/articles/A43890-2002Aug4.html
710 #MASTER# REMARKS: Javascripts whose absence messes the page
711 .washingtonpost.com/wp-srv/
712 #MASTER# UNBLOCK-REFERRER: http://www.gnome.org/images/banner-gnomeis
713 www.gnome.org
714 #MASTER# UNBLOCK-REFERRER: http://www.nycsubway.org/
715 .nycsubway.org/img/banner
716 #MASTER# UNBLOCK-REFERRER: http://www.hellug.gr
717 ads.hellug.gr
718
719 #############################################################################
720 # Site-specific special rules:
721 #############################################################################
722
723 #----------------------------------------------------------------------------
724 # These sites are very complex (read: keen on your identity) and require
725 # minimal interference.
726 #----------------------------------------------------------------------------
727 {fragile}
728 .office.microsoft.com
729 .windowsupdate.microsoft.com
730
731 #----------------------------------------------------------------------------
732 # Shopping and banking sites - allow cookies and pop-ups
733 #----------------------------------------------------------------------------
734 {shop}
735 .quietpc.com
736 .worldpay.com   # for quietpc.com
737 .jungle.com
738 .scan.co.uk
739 .dabs.com
740 .overclockers.co.uk
741 .deutsche-bank-24.de
742 .db24.de
743 .ebay.
744 .mobile.de
745
746 #----------------------------------------------------------------------------
747 # These sites require pop-ups
748 #----------------------------------------------------------------------------
749 {allow-popups}
750 #MASTER# PROBLEM-URL: http://www.aprilbarrows.com/discography.html
751 www.aprilbarrows.com/discography\.html$
752 #MASTER# PROBLEM-URL: http://kevxml2a.infospace.com/info.metac/venshopping/index.htm
753 .infospace.com/.*/venshopping/
754 #MASTER# PROBLEM-URL: http://www.nvidia.com/view.asp?PAGE=windows2000
755 www.nvidia.com
756 #MASTER# PROBLEM-URL: http://www15.chathouse.com/games/
757 www*.chathouse.com/games/
758 #MASTER# PROBLEM-URL: http://www.tagesschau.de/
759 #MASTER# REMARKS: Search results come in a popup
760 www.tagesschau.de
761 #MASTER# PROBLEM-URL: http://www.reuters.com/
762 #MASTER# REMARKS: Printer friendly versions pop up
763 www.reuters.com/news_article.jhtml
764 #MASTER# PROBLEM-URL: http://www.xmms.org/skins.html?num=15&sort=daily_download&order=desc
765 www.xmms.org
766 #MASTER# PROBLEM-URL: http://www.bild.de/
767 .bild.t-online.de
768 #MASTER# PROBLEM-URL: http://klubwakacyjny.interia.pl/pytanie.html
769 klubwakacyjny.interia.pl/pytanie.html
770 #MASTER# PROBLEM-URL: http://www.m-w.com/cgi-bin/dictionary?book=Dictionary&va=cupel
771 www.m-w.com
772 #MASTER# PROBLEM-URL: http://www.pcbox.es/boxshop/catalogo/entrada.asp?centro=53
773 www.pcbox.es
774 #MASTER# PROBLEM-URL: http://www.hola.com/club/trajelegante/
775 www.hola.com/club/
776 #MASTER# PROBLEM-URL: http://www.infoempleo.com/
777 www.infoempleo.com
778 #MASTER# PROBLEM-URL: http://www.netflix.com/
779 www.netflix.com
780
781 ##----------------------------------------------------------------------------
782 # Sometimes (i.e. often!) fast-redirects catches things by mistake
783 #----------------------------------------------------------------------------
784 {-fast-redirects}
785 www.ukc.ac.uk/cgi-bin/wac\.cgi\?
786 #MASTER# PROBLEM-URL: http://www.google.com/search?q=foo
787 .google.com
788 #MASTER# PROBLEM-URL: http://de.altavista.com/q?pg=q&q=foo&kl=XX&search.x=28&search.y=8&what=web
789 .altavista.com/(.*(like|url|link):|trans.*urltext=)http
790 #MASTER# PROBLEM-URL: http://www.speedfind.de/cgi-bin/search?q=foo&t=STANDARD
791 .speedfind.de
792 #MASTER# PROBLEM-URL: http://www.nytimes.com/
793 .nytimes.com
794 #MASTER# PROBLEM-URL: http://groups.yahoo.com/
795 .yahoo.com/.*done=
796 #MASTER# PROBLEM-URL: http://validator.w3.org/check
797 .w3.org
798 #MASTER# PROBLEM-URL: http://www.ask.com/
799 .directhit.com
800 #MASTER# PROBLEM-URL: http://www.zagats.com/
801 .zagats.com
802 #MASTER# PROBLEM-URL: http://www.passport.com/Consumer/default.asp?lc=1033
803 #MASTER# PROBLEM-URL: http://www.msn.com/
804 my.msn.com/passport/pp(consent|set)\.ashx\?msnru=
805 www.passport.com/Consumer/default\.asp\?lc=[0-9]+&msppchlg=[01]&mspplogin=
806 login.passport.com/logout\.(asp|srf)\?
807 #MASTER# PROBLEM-URL: http://www.fileplanet.com
808 download.com.com/redir\?
809 www.fileplanet.com/redir\.asp\?
810 #MASTER# PROBLEM-URL: http://www.washingtonpost.com/
811 .washingtonpost.com
812
813 #----------------------------------------------------------------------------
814 # No filtering for sourcecode
815 #----------------------------------------------------------------------------
816 {-filter}
817 #MASTER# PROBLEM-URL: http://cvs.sourceforge.net/cgi-bin/viewcvs.cgi/ijbswa/current/
818 cvs.
819 #MASTER# PROBLEM-URL: http://liveupdate.symantec.com/ennlu.x86
820 liveupdate.symantec.com
821
822 #----------------------------------------------------------------------------
823 # These sites suffer from a bug in PHP < 4.2.3 (ob_gzhandler broken;
824 # workaround is to use zlib.output_compression):
825 #----------------------------------------------------------------------------
826 {-prevent-compression}
827 #MASTER# PROBLEM-URL: http://www.powie.de/
828 www.powie.de
829 #MASTER# PROBLEM-URL: http://www.phpcenter.de/
830 www.phpcenter.de
831 #MASTER# PROBLEM-URL: http://www.debianhelp.org/
832 www.debianhelp.org
833 #MASTER# PROBLEM-URL: http://www.timeanddate.com
834 www.timeanddate.com
835 #MASTER# PROBLEM-URL: http://www.pclinuxonline.com/
836 #MASTER# PROBLEM-URL: http://pclinuxonline.com/
837 .pclinuxonline.com
838 #MASTER# PROBLEM-URL: http://www.dhd24.com/
839 www.dhd24.com
840 #MASTER# PROBLEM-URL: http://www.linuxandmain.com/
841 .linuxandmain.com
842 #MASTER# PROBLEM-URL: http://www.ofb.biz/
843 .ofb.biz
844 #MASTER# PROBLEM-URL: http://www.dungeoncrawl.org/
845 .dungeoncrawl.org
846 #MASTER# PROBLEM-URL: http://www.deviantart.com/
847 .deviantart.com
848 #MASTER# PROBLEM-URL: http://www.planetspiele.de/wbboard/
849 www.planetspiele.de/wbboard/
850 #MASTER# PROBLEM-URL: http://www.digitalspy.co.uk/
851 www.digitalspy.co.uk
852 #MASTER# PROBLEM-URL: http://www.dealnews.com/
853 .dealnews.com   
854
855 #----------------------------------------------------------------------------
856 # The first frame of the gif animation is more useful here:
857 #----------------------------------------------------------------------------
858 {+deanimate-gifs{first}}
859 #MASTER# PROBLEM-URL: http://www.pricecontrast.com/
860 #MASTER# REMARKS: Animation shows phone number
861 .pricecontrast.com
862
863 #----------------------------------------------------------------------------
864 # Innocent images in standard banner sizes found here:
865 #----------------------------------------------------------------------------
866 {-filter{banners-by-size}}
867 #MASTER# PROBLEM-URL: http://www.max.de/ratgeber/
868 .max.de
869 #MASTER# PROBLEM-URL: http://www.unmuseum.org/pirate.htm
870 www.unmuseum.org
871
872 #----------------------------------------------------------------------------
873 # These don't work without the referrer information:
874 #----------------------------------------------------------------------------
875 {-hide-referrer}
876 #MASTER# PROBLEM-URL: http://kickme.to/FOSI
877 /cgi-bin/fosi.cgi
878 #MASTER# PROBLEM-URL: http://www.abcnews.com/
879 printerfriendly.abcnews.com
880 #MASTER# PROBLEM-URL: http://www.ask.com/
881 .ask.com
882 #MASTER# PROBLEM-URL: http://www.amazon.de/exec/obidos/ASIN/B000067CPX/028-5048678-2899722
883 www.amazon.de/exec/obidos/clipserve/
884 #MASTER# PROBLEM-URL: http://www.lufthansa.de/  http://www.lufthansa.com/  http://cms.lufthansa.com/ 
885 .lufthansa.
886
887 #----------------------------------------------------------------------------
888 # These animated gifs are either useful or nice:
889 #----------------------------------------------------------------------------
890 {-deanimate-gifs}
891 #MASTER# PROBLEM-URL: http://www.care2.com/
892 #MASTER# REMARKS: Wanted animations on ecards
893 .care2.com
894 .care-mail.com
895 #MASTER# PROBLEM-URL: http://www.ameritrade.com
896 #MASTER# REMARKS: Animated link texts
897 www.ameritrade.com
898
899 #----------------------------------------------------------------------------
900 # These sites are so abusive that we need to kill all JS event bindings (and
901 # probably a break a lot along the way)
902 #----------------------------------------------------------------------------
903 {+filter{js-events}}
904 #MASTER# PROBLEM-URL: http://www..planetspiele.de/
905 .planetspiele.de
906 216.12.219.40
907
908 #----------------------------------------------------------------------------
909 # Misc special rules:
910 #----------------------------------------------------------------------------
911 {-filter{content-cookies} -filter{webbugs}}
912 #MASTER# PROBLEM-URL: http://www.friendscout24.de/
913 #MASTER# REMARKS: Needs content-cookies for cookie test on index page; needs webbugs for storing profile(!)
914 www.friendscout24.de
915
916 {-deanimate-gifs -filter{popups} -kill-popups}
917 #MASTER# PROBLEM-URL: http://www.valueclick.com/html/
918 #MASTER# REMARKS: Know your enemy ;-)
919 www.valueclick.com
920 {-block}
921 www.valueclick.com/html/img/advertiser_top.gif
922
923 {-filter{banners-by-size} -deanimate-gifs}
924 #MASTER# PROBLEM-URL: http://realguide.real.com/games/
925 #MASTER# REMARKS: They use banner-sized animated images
926 realguide.real.com/games
927
928 {-handle-as-image}
929 #MASTER# PROBLEM-URL: http://www.linuxtoday.com/
930 #MASTER# REMARKS: /adi has HTML snipplets for use in IFRAMEs
931 .doubleclick.net/adi
932
933 {+block}
934 #MASTER# BLOCK-REFERRER: http://www.geocities.com/the_sockman1/index.html
935 #MASTER# REMARKS: ..and any other page on geocities. Source of the obnoxious Geocities drop-in menu.
936 www.geocities.com/js_source
937
938 {-filter{fun}}
939 #MASTER# PROBLEM-URL: http://www.privoxy.org/user-manual/filter-file.html
940 #MASTER# REMARKS: Don't change the filter code with itself ;-)
941 /(.*/)?user-manual/filter-file.html
942
943 {+filter{img-reorder} +filter{banners-by-link}}
944 #MASTER# PROBLEM-URL: http://www.dn.se/
945 #MASTER# REMARKS: Can't catch by size or location
946 www.dn.se