920b218df478214514bcd0a0a6ed6284775e46b7
[privoxy.git] / tools / privoxy-regression-test.pl
1 #!/usr/bin/perl
2
3 ############################################################################
4 #
5 # Privoxy-Regression-Test
6 #
7 # A regression test "framework" for Privoxy. For documentation see:
8 # perldoc privoxy-regression-test.pl
9 #
10 # $Id: privoxy-regression-test.pl,v 1.176 2009/05/27 20:26:59 fk Exp fk $
11 #
12 # Wish list:
13 #
14 # - Update documentation
15 # - Validate HTTP times.
16 # - Implement a HTTP_VERSION directive or allow to
17 #   specify whole request lines.
18 # - Support filter regression tests.
19 # - Document magic Expect Header values
20 # - Internal fuzz support?
21 #
22 # Copyright (c) 2007-2009 Fabian Keil <fk@fabiankeil.de>
23 #
24 # Permission to use, copy, modify, and distribute this software for any
25 # purpose with or without fee is hereby granted, provided that the above
26 # copyright notice and this permission notice appear in all copies.
27 #
28 # THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
29 # WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
30 # MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
31 # ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
32 # WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
33 # ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
34 # OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
35 #
36 ############################################################################
37
38 use warnings;
39 use strict;
40 use Getopt::Long;
41
42 use constant {
43     PRT_VERSION => 'Privoxy-Regression-Test 0.3',
44  
45     CURL => 'curl',
46
47     # CLI option defaults
48     CLI_RETRIES   => 1,
49     CLI_LOOPS     => 1,
50     CLI_MAX_TIME  => 5,
51     CLI_MIN_LEVEL => 0,
52     # XXX: why limit at all?
53     CLI_MAX_LEVEL => 100,
54     CLI_FORKS     => 0,
55
56     PRIVOXY_CGI_URL  => 'http://p.p/',
57     FELLATIO_URL     => 'http://127.0.0.1:8080/',
58     LEADING_LOG_DATE => 1,
59     LEADING_LOG_TIME => 1,
60
61     DEBUG_LEVEL_FILE_LOADING    => 0,
62     DEBUG_LEVEL_PAGE_FETCHING   => 0,
63     DEBUG_LEVEL_VERBOSE_FAILURE => 1,
64     # XXX: Only partly implemented and mostly useless.
65     DEBUG_LEVEL_VERBOSE_SUCCESS => 0,
66     DEBUG_LEVEL_STATUS          => 1,
67
68     VERBOSE_TEST_DESCRIPTION    => 1,
69
70     # Internal use, don't modify
71     # Available debug bits:
72     LL_ERROR            =>  1,
73     LL_VERBOSE_FAILURE  =>  2,
74     LL_PAGE_FETCHING    =>  4,
75     LL_FILE_LOADING     =>  8,
76     LL_VERBOSE_SUCCESS  => 16,
77     LL_STATUS           => 32,
78     LL_SOFT_ERROR       => 64,
79
80     CLIENT_HEADER_TEST  =>  1,
81     SERVER_HEADER_TEST  =>  2,
82     DUMB_FETCH_TEST     =>  3,
83     METHOD_TEST         =>  4,
84     STICKY_ACTIONS_TEST =>  5,
85     TRUSTED_CGI_REQUEST =>  6,
86     BLOCK_TEST          =>  7,
87 };
88
89 sub init_our_variables () {
90
91     our $leading_log_time = LEADING_LOG_TIME;
92     our $leading_log_date = LEADING_LOG_DATE;
93
94     our $privoxy_cgi_url  = PRIVOXY_CGI_URL;
95
96     our $verbose_test_description = VERBOSE_TEST_DESCRIPTION;
97
98     our $log_level = get_default_log_level();
99
100 }
101
102 sub get_default_log_level () {
103     
104     my $log_level = 0;
105
106     $log_level |= LL_FILE_LOADING    if DEBUG_LEVEL_FILE_LOADING;
107     $log_level |= LL_PAGE_FETCHING   if DEBUG_LEVEL_PAGE_FETCHING;
108     $log_level |= LL_VERBOSE_FAILURE if DEBUG_LEVEL_VERBOSE_FAILURE;
109     $log_level |= LL_VERBOSE_SUCCESS if DEBUG_LEVEL_VERBOSE_SUCCESS;
110     $log_level |= LL_STATUS          if DEBUG_LEVEL_STATUS;
111
112     # These are intended to be always on.
113     $log_level |= LL_SOFT_ERROR;
114     $log_level |= LL_ERROR;
115
116     return $log_level;
117 }
118
119 ############################################################################
120 #
121 # File loading functions
122 #
123 ############################################################################
124
125 sub parse_tag ($) {
126
127     my $tag = shift;
128
129     # Remove anchors
130     $tag =~ s@[\$\^]@@g;
131     # Unescape brackets and dots
132     $tag =~ s@\\(?=[{}().+])@@g;
133
134     # log_message("Parsed tag: " . $tag);
135
136     check_for_forbidden_characters($tag);
137
138     return $tag;
139 }
140
141 sub check_for_forbidden_characters ($) {
142
143     my $string = shift;
144     my $allowed = '[-=\dA-Za-z~{}:./();\s,+@"_%?&*^]';
145
146     unless ($string =~ m/^$allowed*$/o) {
147         my $forbidden = $string;
148         $forbidden =~ s@^$allowed*(.).*@$1@;
149
150         l(LL_ERROR, "'" . $string . "' contains character '" . $forbidden. "' which is unacceptable.");
151     }
152 }
153
154 sub load_regressions_tests () {
155
156     our $privoxy_cgi_url;
157     our @privoxy_config;
158     our %privoxy_features;
159     my @actionfiles;
160     my $curl_url = '';
161     my $file_number = 0;
162     my $feature;
163
164     $curl_url .= $privoxy_cgi_url;
165     $curl_url .= 'show-status';
166
167     l(LL_STATUS, "Asking Privoxy for the number of action files available ...");
168
169     foreach (@{get_cgi_page_or_else($curl_url)}) {
170
171         chomp;
172         if (/<td>(.*?)<\/td><td class=\"buttons\"><a href=\"\/show-status\?file=actions&amp;index=(\d+)\">/) {
173
174             my $url = $privoxy_cgi_url . 'show-status?file=actions&index=' . $2;
175             $actionfiles[$file_number++] = $url;
176
177         } elsif (m@config\.html#.*\">([^<]*)</a>\s+(.*)<br>@) {
178
179             my $directive = $1 . " " . $2;
180             push (@privoxy_config, $directive);
181
182         } elsif (m@<td><code>([^<]*)</code></td>@) {
183
184             $feature = $1;
185
186         } elsif (m@<td> (Yes|No) </td>@) {
187
188             $privoxy_features{$feature} = $1 if defined $feature;
189             $feature = undef;
190         }
191     }
192
193     l(LL_FILE_LOADING, "Recognized " . @actionfiles . " actions files");
194
195     load_action_files(\@actionfiles);
196 }
197
198 sub token_starts_new_test ($) {
199
200     my $token = shift;
201     my @new_test_directives = ('set header', 'fetch test',
202          'trusted cgi request', 'request header', 'method test',
203          'blocked url', 'url');
204
205     foreach my $new_test_directive (@new_test_directives) {
206         return 1 if $new_test_directive eq $token;
207     }
208
209     return 0;
210 }
211
212 sub tokenize ($) {
213
214     my ($token, $value) = (undef, undef);
215
216     # Remove leading and trailing white space.
217     s@^\s*@@;
218     s@\s*$@@;
219
220     # Reverse HTML-encoding
221     # XXX: Seriously imcomplete. 
222     s@&quot;@"@g;
223     s@&amp;@&@g;
224
225     # Tokenize
226     if (/^\#\s*([^=:#]*?)\s*[=]\s*([^#]+)$/) {
227
228         $token = $1;
229         $value = $2;
230
231         $token =~ s@\s\s+@ @g;
232         $token =~ tr/[A-Z]/[a-z]/;
233
234     } elsif (/^TAG\s*:(.*)$/) {
235
236         $token = 'tag';
237         $value = $1;
238     }
239
240     return ($token, $value);
241 }
242
243 sub enlist_new_test ($$$$$$) {
244
245     my ($regression_tests, $token, $value, $si, $ri, $number) = @_;
246     my $type;
247
248     if ($token eq 'set header') {
249
250         l(LL_FILE_LOADING, "Header to set: " . $value);
251         $type = CLIENT_HEADER_TEST;
252
253     } elsif ($token eq 'request header') {
254
255         l(LL_FILE_LOADING, "Header to request: " . $value);
256         $type = SERVER_HEADER_TEST;
257         $$regression_tests[$si][$ri]{'expected-status-code'} = 200;
258
259     } elsif ($token eq 'trusted cgi request') {
260
261         l(LL_FILE_LOADING, "CGI URL to test in a dumb way: " . $value);
262         $type = TRUSTED_CGI_REQUEST;
263         $$regression_tests[$si][$ri]{'expected-status-code'} = 200;
264
265     } elsif ($token eq 'fetch test') {
266
267         l(LL_FILE_LOADING, "URL to test in a dumb way: " . $value);
268         $type = DUMB_FETCH_TEST;
269         $$regression_tests[$si][$ri]{'expected-status-code'} = 200;
270
271     } elsif ($token eq 'method test') {
272
273         l(LL_FILE_LOADING, "Method to test: " . $value);
274         $type = METHOD_TEST;
275         $$regression_tests[$si][$ri]{'expected-status-code'} = 200;
276
277     } elsif ($token eq 'blocked url') {
278
279         l(LL_FILE_LOADING, "URL to block-test: " . $value);
280         $type = BLOCK_TEST;
281
282     } elsif ($token eq 'url') {
283
284         l(LL_FILE_LOADING, "Sticky URL to test: " . $value);
285         $type = STICKY_ACTIONS_TEST;
286
287     } else {
288
289         die "Incomplete '" . $token . "' support detected."; 
290     }
291
292     $$regression_tests[$si][$ri]{'type'} = $type;
293     $$regression_tests[$si][$ri]{'level'} = $type;
294
295     check_for_forbidden_characters($value);
296
297     $$regression_tests[$si][$ri]{'data'} = $value;
298
299     # For function that only get passed single tests
300     $$regression_tests[$si][$ri]{'section-id'} = $si;
301     $$regression_tests[$si][$ri]{'regression-test-id'} = $ri;
302     $$regression_tests[$si][$ri]{'number'} = $number - 1;
303     l(LL_FILE_LOADING,
304       "Regression test " . $number . " (section:" . $si . "):");
305 }
306
307 sub load_action_files ($) {
308
309     # initialized here
310     our %actions;
311     our @regression_tests;
312
313     my $actionfiles_ref = shift;
314     my @actionfiles = @{$actionfiles_ref};
315
316     my $si = 0;  # Section index
317     my $ri = -1; # Regression test index
318     my $count = 0;
319
320     my $ignored = 0;
321
322     l(LL_STATUS, "Gathering regression tests from " .
323       @actionfiles . " action file(s) delivered by Privoxy.");
324
325     for my $file_number (0 .. @actionfiles - 1) {
326
327         my $curl_url = ' "' . $actionfiles[$file_number] . '"';
328         my $actionfile = undef;
329         my $sticky_actions = undef;
330
331         foreach (@{get_cgi_page_or_else($curl_url)}) {
332
333             my $no_checks = 0;
334             chomp;
335
336             if (/<h2>Contents of Actions File (.*?)</) {
337                 $actionfile = $1;
338                 next;
339             }
340             next unless defined $actionfile;
341
342             last if (/<\/pre>/);
343
344             my ($token, $value) = tokenize($_);
345
346             next unless defined $token;
347
348             # Load regression tests
349
350             if (token_starts_new_test($token)) {
351
352                 # Beginning of new regression test.
353                 $ri++;
354                 $count++;
355                 enlist_new_test(\@regression_tests, $token, $value, $si, $ri, $count);
356             }
357
358             if ($token =~ /level\s+(\d+)/i) {
359
360                 my $level = $1;
361                 register_dependency($level, $value);
362             }
363
364             if ($token eq 'sticky actions') {
365
366                 # Will be used by each following Sticky URL.
367                 $sticky_actions = $value;
368                 if ($sticky_actions =~ /{[^}]*\s/) {
369                     l(LL_ERROR,
370                       "'Sticky Actions' with whitespace inside the " .
371                       "action parameters are currently unsupported.");
372                 }
373             }
374             
375             if ($si == -1 || $ri == -1) {
376                 # No beginning of a test detected yet,
377                 # so we don't care about any other test
378                 # attributes.
379                 next;
380             }
381
382             if ($token eq 'expect header') {
383
384                 l(LL_FILE_LOADING, "Detected expectation: " . $value);
385                 $regression_tests[$si][$ri]{'expect-header'} = $value;
386
387             } elsif ($token eq 'tag') {
388                 
389                 next if ($ri == -1);
390
391                 my $tag = parse_tag($value);
392
393                 # We already checked in parse_tag() after filtering
394                 $no_checks = 1;
395
396                 l(LL_FILE_LOADING, "Detected TAG: " . $tag);
397
398                 # Save tag for all tests in this section
399                 do {
400                     $regression_tests[$si][$ri]{'tag'} = $tag; 
401                 } while ($ri-- > 0);
402
403                 $si++;
404                 $ri = -1;
405
406             } elsif ($token eq 'ignore' && $value =~ /Yes/i) {
407
408                 l(LL_FILE_LOADING, "Ignoring section: " . test_content_as_string($regression_tests[$si][$ri]));
409                 $regression_tests[$si][$ri]{'ignore'} = 1;
410                 $ignored++;
411
412             } elsif ($token eq 'expect status code') {
413
414                 l(LL_FILE_LOADING, "Expecting status code: " . $value);
415                 $regression_tests[$si][$ri]{'expected-status-code'} = $value;
416
417             } elsif ($token eq 'level') { # XXX: stupid name
418
419                 $value =~ s@(\d+).*@$1@;
420                 l(LL_FILE_LOADING, "Level: " . $value);
421                 $regression_tests[$si][$ri]{'level'} = $value;
422
423             } elsif ($token eq 'method') {
424
425                 l(LL_FILE_LOADING, "Method: " . $value);
426                 $regression_tests[$si][$ri]{'method'} = $value;
427
428             } elsif ($token eq 'url') {
429
430                 if (defined $sticky_actions) {
431                     die "WTF? Attempted to overwrite Sticky Actions"
432                         if defined ($regression_tests[$si][$ri]{'sticky-actions'});
433
434                     l(LL_FILE_LOADING, "Sticky actions: " . $sticky_actions);
435                     $regression_tests[$si][$ri]{'sticky-actions'} = $sticky_actions;
436                 } else {
437                     l(LL_ERROR, "Sticky URL without Sticky Actions: $value");
438                 }
439
440             } else {
441
442                 # We don't use it, so we don't need
443                 $no_checks = 1;
444             }
445             # XXX: Neccessary?
446             check_for_forbidden_characters($value) unless $no_checks;
447             check_for_forbidden_characters($token);
448         }
449     }
450
451     l(LL_FILE_LOADING, "Done loading " . $count . " regression tests." 
452       . " Of which " . $ignored. " will be ignored)\n");
453 }
454
455 ############################################################################
456 #
457 # Regression test executing functions
458 #
459 ############################################################################
460
461 sub execute_regression_tests () {
462
463     our @regression_tests;
464     my $loops = get_cli_option('loops');
465     my $all_tests    = 0;
466     my $all_failures = 0;
467     my $all_successes = 0;
468
469     unless (@regression_tests) {
470
471         l(LL_STATUS, "No regression tests found.");
472         return;
473     }
474
475     l(LL_STATUS, "Executing regression tests ...");
476
477     while ($loops-- > 0) {
478
479         my $successes = 0;
480         my $tests = 0;
481         my $failures;
482         my $skipped = 0;
483
484         for my $s (0 .. @regression_tests - 1) {
485
486             my $r = 0;
487
488             while (defined $regression_tests[$s][$r]) {
489
490                 die "Section id mismatch" if ($s != $regression_tests[$s][$r]{'section-id'});
491                 die "Regression test id mismatch" if ($r != $regression_tests[$s][$r]{'regression-test-id'});
492
493                 my $number = $regression_tests[$s][$r]{'number'};
494                 my $skip_reason = undef;
495
496                 if ($regression_tests[$s][$r]{'ignore'}) {
497
498                     $skip_reason = "Ignore flag is set";
499
500                 } elsif (cli_option_is_set('test-number')
501                          and get_cli_option('test-number') != $number) {
502
503                     $skip_reason = "Only executing test " . get_cli_option('test-number');
504
505                 } else {
506
507                     $skip_reason = level_is_unacceptable($regression_tests[$s][$r]{'level'});
508                 }
509
510                 if (defined $skip_reason) {
511
512                     my $message = "Skipping test " . $number . ": " . $skip_reason . ".";
513                     log_message($message) if (cli_option_is_set('show-skipped-tests'));
514                     $skipped++;
515
516                 } else {
517
518                     my $result = execute_regression_test($regression_tests[$s][$r]);
519
520                     log_result($regression_tests[$s][$r], $result, $tests);
521
522                     $successes += $result;
523                     $tests++;
524                 }
525                 $r++;
526             }
527         }
528         $failures = $tests - $successes;
529
530         log_message("Executed " . $tests . " regression tests. " .
531             'Skipped ' . $skipped . '. ' . 
532             $successes . " successes, " . $failures . " failures.");
533
534         $all_tests     += $tests;
535         $all_failures  += $failures;
536         $all_successes += $successes;
537     }
538
539     if (get_cli_option('loops') > 1) {
540         log_message("Total: Executed " . $all_tests . " regression tests. " .
541             $all_successes . " successes, " . $all_failures . " failures.");
542     }
543 }
544
545 sub level_is_unacceptable ($) {
546     my $level = shift;
547     my $min_level = get_cli_option('min-level');
548     my $max_level = get_cli_option('max-level');
549     my $required_level = cli_option_is_set('level') ?
550         get_cli_option('level') : $level;
551     my $reason = undef;
552
553     if ($required_level != $level) {
554
555         $reason = "Level doesn't match (" . $level .
556                   " != " . $required_level . ")"
557
558     } elsif ($level < $min_level) {
559
560         $reason = "Level to low (" . $level . " < " . $min_level . ")";
561
562     } elsif ($level > $max_level) {
563
564         $reason = "Level to high (" . $level . " > " . $max_level . ")";
565
566     } else {
567
568         $reason = dependency_unsatisfied($level);
569     }
570
571     return $reason;
572 }
573
574 sub dependency_unsatisfied ($) {
575
576     my $level = shift;
577     our %dependencies;
578     our @privoxy_config;
579     our %privoxy_features;
580
581     my $dependency_problem = undef;
582
583     if (defined ($dependencies{$level}{'config line'})) {
584
585         my $dependency = $dependencies{$level}{'config line'};
586         $dependency_problem = "depends on config line matching: '" . $dependency . "'";
587
588         foreach (@privoxy_config) {
589
590             if (/$dependency/) {
591                 $dependency_problem = undef;
592                 last;
593             }
594         }
595
596     } elsif (defined ($dependencies{$level}{'feature status'})) {
597
598         my $dependency = $dependencies{$level}{'feature status'};
599         my ($feature, $status) = $dependency =~ /([^\s]*)\s+(Yes|No)/;
600
601         unless (defined($privoxy_features{$feature})
602                 and ($privoxy_features{$feature} eq $status))
603         {
604             $dependency_problem = "depends on '" . $feature .
605                 "' being set to '" . $status . "'";
606         }
607     }
608
609     return $dependency_problem;
610 }
611
612 sub register_dependency ($$) {
613
614     my $level = shift;
615     my $dependency = shift;
616     our %dependencies;
617
618     if ($dependency =~ /config line\s+(.*)/) {
619
620         $dependencies{$level}{'config line'} = $1;
621
622     } elsif ($dependency =~ /feature status\s+(.*)/) {
623
624         $dependencies{$level}{'feature status'} = $1;
625     }
626 }
627
628 # XXX: somewhat misleading name
629 sub execute_regression_test ($) {
630
631     my $test_ref = shift;
632     my %test = %{$test_ref};
633     my $result = 0;
634
635     if ($test{'type'} == CLIENT_HEADER_TEST) {
636
637         $result = execute_client_header_regression_test($test_ref);
638
639     } elsif ($test{'type'} == SERVER_HEADER_TEST) {
640
641         $result = execute_server_header_regression_test($test_ref);
642
643     } elsif ($test{'type'} == DUMB_FETCH_TEST
644           or $test{'type'} == TRUSTED_CGI_REQUEST) {
645
646         $result = execute_dumb_fetch_test($test_ref);
647
648     } elsif ($test{'type'} == METHOD_TEST) {
649
650         $result = execute_method_test($test_ref);
651
652     } elsif ($test{'type'} == BLOCK_TEST) {
653
654         $result = execute_block_test($test_ref);
655
656     } elsif ($test{'type'} == STICKY_ACTIONS_TEST) {
657
658         $result = execute_sticky_actions_test($test_ref);
659
660     } else {
661
662         die "Unsupported test type detected: " . $test{'type'};
663     }
664
665     return $result;
666 }
667
668 sub execute_method_test ($) {
669
670     my $test_ref = shift;
671     my %test = %{$test_ref};
672     my $buffer_ref;
673     my $status_code;
674     my $method = $test{'data'};
675
676     my $curl_parameters = '';
677     my $expected_status_code = $test{'expected-status-code'};
678
679     $curl_parameters .= '--request ' . $method . ' ';
680     # Don't complain about the 'missing' body
681     $curl_parameters .= '--head ' if ($method =~ /^HEAD$/i);
682
683     $curl_parameters .= PRIVOXY_CGI_URL;
684
685     $buffer_ref = get_page_with_curl($curl_parameters);
686     $status_code = get_status_code($buffer_ref);
687
688     return check_status_code_result($status_code, $expected_status_code);
689 }
690
691 sub execute_dumb_fetch_test ($) {
692
693     my $test_ref = shift;
694     my %test = %{$test_ref};
695     my $buffer_ref;
696     my $status_code;
697
698     my $curl_parameters = '';
699     my $expected_status_code = $test{'expected-status-code'};
700
701     if (defined $test{method}) {
702         $curl_parameters .= '--request ' . $test{method} . ' ';
703     }
704     if ($test{type} == TRUSTED_CGI_REQUEST) {
705         $curl_parameters .= '--referer ' . PRIVOXY_CGI_URL . ' ';
706     }
707
708     $curl_parameters .= $test{'data'};
709
710     $buffer_ref = get_page_with_curl($curl_parameters);
711     $status_code = get_status_code($buffer_ref);
712
713     return check_status_code_result($status_code, $expected_status_code);
714 }
715
716 sub execute_block_test ($) {
717
718     my $test = shift;
719     my $url = $test->{'data'};
720     my $final_results = get_final_results($url);
721
722     return defined $final_results->{'+block'};
723 }
724
725 sub execute_sticky_actions_test ($) {
726
727     my $test = shift;
728     my $url = $test->{'data'};
729     my $verified_actions = 0;
730     # XXX: splitting currently doesn't work for actions whose parameters contain spaces.
731     my @sticky_actions = split(/\s+/, $test->{'sticky-actions'});
732     my $final_results = get_final_results($url);
733
734     foreach my $sticky_action (@sticky_actions) {
735
736         if (defined $final_results->{$sticky_action}) {
737             # Exact match
738             $verified_actions++;
739
740         } elsif ($sticky_action =~ /-.*\{/) {
741
742             # Disabled multi actions aren't explicitly listed as
743             # disabled and thus have to be checked by verifying
744             # that they aren't enabled.
745             $verified_actions++;
746
747         } else {
748             l(LL_VERBOSE_FAILURE,
749               "Ooops. '$sticky_action' is not among the final results.");
750         }
751     }
752
753     return $verified_actions == @sticky_actions;
754 }
755
756 sub get_final_results ($) {
757
758     my $url = shift;
759     my $curl_parameters = '';
760     my %final_results = ();
761     my $final_results_reached = 0;
762
763     die "Unacceptable characters in $url" if $url =~ m@[\\'"]@;
764     # XXX: should be URL-encoded properly
765     $url =~ s@%@%25@g;
766     $url =~ s@\s@%20@g;
767     $url =~ s@&@%26@g;
768     $url =~ s@:@%3A@g;
769     $url =~ s@/@%2F@g;
770
771     $curl_parameters .= quote(PRIVOXY_CGI_URL . 'show-url-info?url=' . $url);
772
773     foreach (@{get_cgi_page_or_else($curl_parameters)}) {
774
775         $final_results_reached = 1 if (m@<h2>Final results:</h2>@);
776
777         next unless ($final_results_reached);
778         last if (m@</td>@);
779
780         if (m@<br>([-+])<a.*>([^>]*)</a>(?: (\{.*\}))?@) {
781             my $action = $1.$2;
782             my $parameter = $3;
783             
784             if (defined $parameter) {
785                 # In case the caller needs to check
786                 # the action and its parameter
787                 $final_results{$action . $parameter} = 1;
788             }
789             # In case the action doesn't have parameters
790             # or the caller doesn't care for the parameter.
791             $final_results{$action} = 1;
792         }
793     }
794
795     return \%final_results;
796 }
797
798 sub check_status_code_result ($$) {
799
800     my $status_code = shift;
801     my $expected_status_code = shift;
802     my $result = 0;
803
804     unless (defined $status_code) {
805
806         # XXX: should probably be caught earlier.
807         l(LL_VERBOSE_FAILURE,
808           "Ooops. We expected status code " . $expected_status_code . ", but didn't get any status code at all.");
809
810     } elsif ($expected_status_code == $status_code) {
811
812         $result = 1;
813         l(LL_VERBOSE_SUCCESS,
814           "Yay. We expected status code " . $expected_status_code . ", and received: " . $status_code . '.');
815
816     } elsif (cli_option_is_set('fuzzer-feeding') and $status_code == 123) {
817
818         l(LL_VERBOSE_FAILURE,
819           "Oh well. Status code lost while fuzzing. Can't check if it was " . $expected_status_code . '.');
820
821     } else {
822
823         l(LL_VERBOSE_FAILURE,
824           "Ooops. We expected status code " . $expected_status_code . ", but received: " . $status_code . '.');
825     }
826     
827     return $result;
828 }
829
830 sub execute_client_header_regression_test ($) {
831
832     my $test_ref = shift;
833     my $buffer_ref;
834     my $header;
835
836     $buffer_ref = get_show_request_with_curl($test_ref);
837
838     $header = get_header($buffer_ref, $test_ref);
839
840     return check_header_result($test_ref, $header);
841 }
842
843 sub execute_server_header_regression_test ($) {
844
845     my $test_ref = shift;
846     my $buffer_ref;
847     my $header;
848
849     $buffer_ref = get_head_with_curl($test_ref);
850
851     $header = get_server_header($buffer_ref, $test_ref);
852
853     return check_header_result($test_ref, $header);
854 }
855
856 sub interpret_result ($) {
857     my $success = shift;
858     return $success ? "Success" : "Failure";
859 }
860
861 sub check_header_result ($$) {
862
863     my $test_ref = shift;
864     my $header = shift;
865
866     my %test = %{$test_ref};
867     my $expect_header = $test{'expect-header'};
868     my $success = 0;
869
870     if ($expect_header eq 'NO CHANGE') {
871
872         if (defined($header) and $header eq $test{'data'}) {
873
874             $success = 1;
875
876         } else {
877
878             $header = "REMOVAL" unless defined $header;
879             l(LL_VERBOSE_FAILURE,
880               "Ooops. Got: '" . $header . "' while expecting: '" . $expect_header . "'");
881         }
882
883     } elsif ($expect_header eq 'REMOVAL') {
884
885         if (defined($header) and $header eq $test{'data'}) {
886
887             l(LL_VERBOSE_FAILURE,
888               "Ooops. Expected removal but: '" . $header . "' is still there.");
889
890         } else {
891
892             # XXX: Use more reliable check here and make sure
893             # the header has a different name.
894             $success = 1;
895         }
896
897     } elsif ($expect_header eq 'SOME CHANGE') {
898
899         if (defined($header) and not $header eq $test{'data'}) {
900
901             $success = 1;
902
903         } else {
904
905             $header = "REMOVAL" unless defined $header;
906             l(LL_VERBOSE_FAILURE,
907               "Ooops. Got: '" . $header . "' while expecting: SOME CHANGE");
908         }
909
910     } else {
911
912         if (defined($header) and $header eq $expect_header) {
913
914             $success = 1;
915
916         } else {
917
918             $header = "'No matching header'" unless defined $header; # XXX: No header detected to be precise
919             l(LL_VERBOSE_FAILURE,
920               "Ooops. Got: '" . $header . "' while expecting: '" . $expect_header . "'");
921         }
922     }
923     return $success;
924 }
925
926 sub get_header_name ($) {
927
928     my $header = shift;
929
930     $header =~ s@(.*?: ).*@$1@;
931
932     return $header;
933 }
934
935 sub get_header ($$) {
936
937     our $filtered_request = '';
938
939     my $buffer_ref = shift;
940     my $test_ref = shift;
941
942     my %test = %{$test_ref};
943     my @buffer = @{$buffer_ref};
944
945     my $expect_header = $test{'expect-header'};
946
947     die "get_header called with no expect header" unless defined $expect_header;
948
949     my $line;
950     my $processed_request_reached = 0;
951     my $read_header = 0;
952     my $processed_request = '';
953     my $header;
954     my $header_to_get;
955
956     if ($expect_header eq 'REMOVAL'
957      or $expect_header eq 'NO CHANGE'
958      or  $expect_header eq 'SOME CHANGE') {
959
960         $expect_header = $test{'data'};
961     }
962
963     $header_to_get = get_header_name($expect_header);
964
965     foreach (@buffer) {
966
967         # Skip everything before the Processed request
968         if (/Processed Request/) {
969             $processed_request_reached = 1;
970             next;
971         }
972         next unless $processed_request_reached;
973
974         # End loop after the Processed request
975         last if (/<\/pre>/);
976
977         # Ditch tags and leading/trailing white space.
978         s@^\s*<.*?>@@g;
979         s@\s*$@@g;
980
981         # Decode characters we care about. 
982         s@&quot;@"@g;
983
984         $filtered_request .=  "\n" . $_;
985          
986         if (/^$header_to_get/) {
987             $read_header = 1;
988             $header = $_;
989             last;
990         }
991     }
992
993     return $header;
994 }
995
996 sub get_server_header ($$) {
997
998     my $buffer_ref = shift;
999     my $test_ref = shift;
1000
1001     my %test = %{$test_ref};
1002     my @buffer = @{$buffer_ref};
1003
1004     my $expect_header = $test{'expect-header'};
1005     my $header;
1006     my $header_to_get;
1007
1008     # XXX: Should be caught before starting to test.
1009     l(LL_ERROR, "No expect header for test " . $test{'number'})
1010         unless defined $expect_header;
1011
1012     if ($expect_header eq 'REMOVAL'
1013      or $expect_header eq 'NO CHANGE'
1014      or $expect_header eq 'SOME CHANGE') {
1015
1016         $expect_header = $test{'data'};
1017     }
1018
1019     $header_to_get = get_header_name($expect_header);
1020
1021     foreach (@buffer) {
1022
1023         # XXX: should probably verify that the request
1024         # was actually answered by Fellatio.
1025         if (/^$header_to_get/) {
1026             $header = $_;
1027             $header =~ s@\s*$@@g;
1028             last;
1029         }
1030     }
1031
1032     return $header;
1033 }
1034
1035 sub get_status_code ($) {
1036
1037     my $buffer_ref = shift;
1038     my @buffer = @{$buffer_ref}; 
1039
1040     foreach (@buffer) {
1041
1042         if (/^HTTP\/\d\.\d (\d{3})/) {
1043
1044             return $1;
1045
1046         } else {
1047
1048             return '123' if cli_option_is_set('fuzzer-feeding');
1049             chomp;
1050             l(LL_ERROR, 'Unexpected buffer line: "' . $_ . '"');
1051         }
1052     }
1053 }
1054
1055 sub get_test_keys () {
1056     return ('tag', 'data', 'expect-header', 'ignore');
1057 }
1058
1059 # XXX: incomplete
1060 sub test_content_as_string ($) {
1061
1062     my $test_ref = shift;
1063     my %test = %{$test_ref};
1064
1065     my $s = "\n\t";
1066
1067     foreach my $key (get_test_keys()) {
1068         $test{$key} = 'Not set' unless (defined $test{$key});
1069     }
1070
1071     $s .= 'Tag: ' . $test{'tag'};
1072     $s .= "\n\t";
1073     $s .= 'Set header: ' . $test{'data'}; # XXX: adjust for other test types
1074     $s .= "\n\t";
1075     $s .= 'Expected header: ' . $test{'expect-header'};
1076     $s .= "\n\t";
1077     $s .= 'Ignore: ' . $test{'ignore'};
1078
1079     return $s;
1080 }
1081
1082 sub fuzz_header($) {
1083     my $header = shift;
1084     my $white_space = int(rand(2)) - 1 ? " " : "\t";
1085
1086     $white_space = $white_space x (1 + int(rand(5)));
1087
1088     # Only fuzz white space before the first quoted token.
1089     # (Privoxy doesn't touch white space inside quoted tokens
1090     # and modifying it would cause the tests to fail).
1091     $header =~ s@(^[^"]*?)\s@$1$white_space@g;
1092
1093     return $header;
1094 }
1095
1096 ############################################################################
1097 #
1098 # HTTP fetch functions
1099 #
1100 ############################################################################
1101
1102 sub check_for_curl () {
1103     my $curl = CURL;
1104     l(LL_ERROR, "No curl found.") unless (`which $curl`);
1105 }
1106
1107 sub get_cgi_page_or_else ($) {
1108
1109     my $cgi_url = shift;
1110     my $content_ref = get_page_with_curl($cgi_url);
1111     my $status_code = get_status_code($content_ref);
1112
1113     if (200 != $status_code) {
1114
1115         my $log_message = "Failed to fetch Privoxy CGI Page. " .
1116                           "Received status code ". $status_code .
1117                           " while only 200 is acceptable.";
1118
1119         if (cli_option_is_set('fuzzer-feeding')) {
1120
1121             $log_message .= " Ignored due to fuzzer feeding.";
1122             l(LL_SOFT_ERROR, $log_message)
1123
1124         } else {
1125
1126             l(LL_ERROR, $log_message);
1127         }
1128     }
1129     
1130     return $content_ref;
1131 }
1132
1133 # XXX: misleading name
1134 sub get_show_request_with_curl ($) {
1135
1136     our $privoxy_cgi_url;
1137     my $test_ref = shift;
1138     my %test = %{$test_ref};
1139
1140     my $curl_parameters = ' ';
1141     my $header = $test{'data'};
1142
1143     if (cli_option_is_set('header-fuzzing')) {
1144         $header = fuzz_header($header);
1145     }
1146
1147     # Enable the action to test
1148     $curl_parameters .= '-H \'X-Privoxy-Control: ' . $test{'tag'} . '\' ';
1149     # The header to filter
1150     $curl_parameters .= '-H \'' . $header . '\' ';
1151
1152     $curl_parameters .= ' ';
1153     $curl_parameters .= $privoxy_cgi_url;
1154     $curl_parameters .= 'show-request';
1155
1156     return get_cgi_page_or_else($curl_parameters);
1157 }
1158
1159 sub get_head_with_curl ($) {
1160
1161     our $fellatio_url = FELLATIO_URL;
1162     my $test_ref = shift;
1163     my %test = %{$test_ref};
1164
1165     my $curl_parameters = ' ';
1166
1167     # Enable the action to test
1168     $curl_parameters .= '-H \'X-Privoxy-Control: ' . $test{'tag'} . '\' ';
1169     # The header to filter
1170     $curl_parameters .= '-H \'X-Gimme-Head-With: ' . $test{'data'} . '\' ';
1171     $curl_parameters .= '--head ';
1172
1173     $curl_parameters .= ' ';
1174     $curl_parameters .= $fellatio_url;
1175
1176     return get_page_with_curl($curl_parameters);
1177 }
1178
1179 sub get_page_with_curl ($) {
1180
1181     our $proxy;
1182
1183     my $parameters = shift;
1184     my @buffer;
1185     my $curl_line = CURL;
1186     my $retries_left = get_cli_option('retries') + 1;
1187     my $failure_reason;
1188
1189     $curl_line .= ' --proxy ' . $proxy if (defined $proxy);
1190
1191     # We want to see the HTTP status code
1192     $curl_line .= " --include ";
1193     # Let Privoxy emit two log messages less.
1194     $curl_line .= ' -H \'Proxy-Connection:\' ' unless $parameters =~ /Proxy-Connection:/;
1195     $curl_line .= ' -H \'Connection: close\' ' unless $parameters =~ /Connection:/;
1196     # We don't care about fetch statistic.
1197     $curl_line .= " -s ";
1198     # We do care about the failure reason if any.
1199     $curl_line .= " -S ";
1200     # We want to advertise ourselves
1201     $curl_line .= " --user-agent '" . PRT_VERSION . "' ";
1202     # We aren't too patient
1203     $curl_line .= " --max-time '" . get_cli_option('max-time') . "' ";
1204
1205     $curl_line .= $parameters;
1206     # XXX: still necessary?
1207     $curl_line .= ' 2>&1';
1208
1209     l(LL_PAGE_FETCHING, "Executing: " . $curl_line);
1210
1211     do {
1212         @buffer = `$curl_line`;
1213
1214         if ($?) {
1215             $failure_reason = array_as_string(\@buffer);
1216             chomp $failure_reason;
1217             l(LL_SOFT_ERROR, "Fetch failure: '" . $failure_reason . $! ."'");
1218         }
1219     } while ($? && --$retries_left);
1220
1221     unless ($retries_left) {
1222         l(LL_ERROR,
1223           "Running curl failed " . get_cli_option('retries') .
1224           " times in a row. Last error: '" . $failure_reason . "'.");
1225     }
1226
1227     return \@buffer;
1228 }
1229
1230
1231 ############################################################################
1232 #
1233 # Log functions
1234 #
1235 ############################################################################
1236
1237 sub array_as_string ($) {
1238     my $array_ref = shift;
1239     my $string = '';
1240
1241     foreach (@{$array_ref}) {
1242         $string .= $_;
1243     }
1244
1245     return $string;
1246 }
1247
1248 sub show_test ($) {
1249     my $test_ref = shift;
1250     log_message('Test is:' . test_content_as_string($test_ref));
1251 }
1252
1253 # Conditional log
1254 sub l ($$) {
1255     our $log_level;
1256     my $this_level = shift;
1257     my $message = shift;
1258
1259     return unless ($log_level & $this_level);
1260
1261     if (LL_ERROR & $this_level) {
1262         $message = 'Oh noes. ' . $message . ' Fatal error. Exiting.';
1263     }
1264
1265     log_message($message);
1266
1267     if (LL_ERROR & $this_level) {
1268         exit;
1269     }
1270 }
1271
1272 sub log_message ($) {
1273
1274     my $message = shift;
1275
1276     our $logfile;
1277     our $no_logging;
1278     our $leading_log_date;
1279     our $leading_log_time;
1280
1281     my $time_stamp = '';
1282     my ( $sec, $min, $hour, $mday, $mon, $year, $wday, $yday, $isdst ) = localtime time;
1283
1284     if ($leading_log_date || $leading_log_time) {
1285
1286         if ($leading_log_date) {
1287             $year += 1900;
1288             $mon  += 1;
1289             $time_stamp = sprintf("%i/%.2i/%.2i", $year, $mon, $mday);
1290         }
1291
1292         if ($leading_log_time) {
1293             $time_stamp .= ' ' if $leading_log_date;
1294             $time_stamp.= sprintf("%.2i:%.2i:%.2i", $hour, $min, $sec);
1295         }
1296         
1297         $message = $time_stamp . ": " . $message;
1298     }
1299
1300     printf(STDERR "%s\n", $message);
1301 }
1302
1303 sub log_result ($$) {
1304
1305     our $verbose_test_description;
1306     our $filtered_request;
1307
1308     my $test_ref = shift;
1309     my $result = shift;
1310     my $number = shift;
1311
1312     my %test = %{$test_ref};
1313     my $message = '';
1314
1315     $message .= interpret_result($result);
1316     $message .= " for test ";
1317     $message .= $number;
1318     $message .= '/';
1319     $message .= $test{'number'};
1320     $message .= '/';
1321     $message .= $test{'section-id'};
1322     $message .= '/';
1323     $message .= $test{'regression-test-id'};
1324     $message .= '.';
1325
1326     if ($verbose_test_description) {
1327
1328         if ($test{'type'} == CLIENT_HEADER_TEST) {
1329
1330             $message .= ' Header ';
1331             $message .= quote($test{'data'});
1332             $message .= ' and tag ';
1333             $message .= quote($test{'tag'});
1334
1335         } elsif ($test{'type'} == SERVER_HEADER_TEST) {
1336
1337             $message .= ' Request Header ';
1338             $message .= quote($test{'data'});
1339             $message .= ' and tag ';
1340             $message .= quote($test{'tag'});
1341
1342         } elsif ($test{'type'} == DUMB_FETCH_TEST) {
1343
1344             $message .= ' URL ';
1345             $message .= quote($test{'data'});
1346             $message .= ' and expected status code ';
1347             $message .= quote($test{'expected-status-code'});
1348
1349         } elsif ($test{'type'} == TRUSTED_CGI_REQUEST) {
1350
1351             $message .= ' CGI URL ';
1352             $message .= quote($test{'data'});
1353             $message .= ' and expected status code ';
1354             $message .= quote($test{'expected-status-code'});
1355
1356         } elsif ($test{'type'} == METHOD_TEST) {
1357
1358             $message .= ' HTTP method ';
1359             $message .= quote($test{'data'});
1360             $message .= ' and expected status code ';
1361             $message .= quote($test{'expected-status-code'});
1362
1363         } elsif ($test{'type'} == BLOCK_TEST) {
1364
1365             $message .= ' Supposedly-blocked URL: ';
1366             $message .= quote($test{'data'});
1367
1368         } elsif ($test{'type'} == STICKY_ACTIONS_TEST) {
1369
1370             $message .= ' Sticky Actions: ';
1371             $message .= quote($test{'sticky-actions'});
1372             $message .= ' and URL: ';
1373             $message .= quote($test{'data'});
1374
1375         } else {
1376
1377             die "Incomplete support for test type " . $test{'type'} .  " detected.";
1378         }
1379     }
1380
1381     log_message($message) if (!$result or cli_option_is_set('verbose'));
1382 }
1383
1384 sub quote ($) {
1385     my $s = shift;
1386     return '\'' . $s . '\'';
1387 }
1388
1389 sub print_version () {
1390     printf PRT_VERSION . "\n" . 'Copyright (C) 2007-2009 Fabian Keil <fk@fabiankeil.de>' . "\n";
1391 }
1392
1393 sub help () {
1394
1395     our %cli_options;
1396
1397     print_version();
1398
1399     print << "    EOF"
1400
1401 Options and their default values if they have any:
1402     [--debug $cli_options{'debug'}]
1403     [--forks $cli_options{'forks'}]
1404     [--fuzzer-address]
1405     [--fuzzer-feeding]
1406     [--help]
1407     [--header-fuzzing]
1408     [--level]
1409     [--loops $cli_options{'loops'}]
1410     [--max-level $cli_options{'max-level'}]
1411     [--max-time $cli_options{'max-time'}]
1412     [--min-level $cli_options{'min-level'}]
1413     [--privoxy-address]
1414     [--retries $cli_options{'retries'}]
1415     [--show-skipped-tests]
1416     [--test-number]
1417     [--verbose]
1418     [--version]
1419 see "perldoc $0" for more information
1420     EOF
1421     ;
1422     exit(0);
1423 }
1424
1425 sub init_cli_options () {
1426
1427     our %cli_options;
1428     our $log_level;
1429
1430     $cli_options{'debug'}     = $log_level;
1431     $cli_options{'forks'}     = CLI_FORKS;
1432     $cli_options{'loops'}     = CLI_LOOPS;
1433     $cli_options{'max-level'} = CLI_MAX_LEVEL;
1434     $cli_options{'max-time'}  = CLI_MAX_TIME;
1435     $cli_options{'min-level'} = CLI_MIN_LEVEL;
1436     $cli_options{'retries'}   = CLI_RETRIES;
1437 }
1438
1439 sub parse_cli_options () {
1440
1441     our %cli_options;
1442     our $log_level;
1443
1444     init_cli_options();
1445
1446     GetOptions (
1447         'debug=s'            => \$cli_options{'debug'},
1448         'forks=s'            => \$cli_options{'forks'},
1449         'fuzzer-address=s'   => \$cli_options{'fuzzer-address'},
1450         'fuzzer-feeding'     => \$cli_options{'fuzzer-feeding'},
1451         'header-fuzzing'     => \$cli_options{'header-fuzzing'},
1452         'help'               => sub {help},
1453         'level=s'            => \$cli_options{'level'},
1454         'loops=s'            => \$cli_options{'loops'},
1455         'max-level=s'        => \$cli_options{'max-level'},
1456         'max-time=s'         => \$cli_options{'max-time'},
1457         'min-level=s'        => \$cli_options{'min-level'},
1458         'privoxy-address=s'  => \$cli_options{'privoxy-address'},
1459         'retries=s'          => \$cli_options{'retries'},
1460         'show-skipped-tests' => \$cli_options{'show-skipped-tests'},
1461         'test-number=s'      => \$cli_options{'test-number'},
1462         'verbose'            => \$cli_options{'verbose'},
1463         'version'            => sub {print_version && exit(0)}
1464     );
1465     $log_level |= $cli_options{'debug'};
1466 }
1467
1468 sub cli_option_is_set ($) {
1469
1470     our %cli_options;
1471     my $cli_option = shift;
1472
1473     return defined $cli_options{$cli_option};
1474 }
1475
1476 sub get_cli_option ($) {
1477
1478     our %cli_options;
1479     my $cli_option = shift;
1480
1481     die "Unknown CLI option: $cli_option" unless defined $cli_options{$cli_option};
1482
1483     return $cli_options{$cli_option};
1484 }
1485
1486 sub init_proxy_settings($) {
1487
1488     my $choice = shift;
1489     our $proxy = undef;
1490
1491     if (($choice eq 'fuzz-proxy') and cli_option_is_set('fuzzer-address')) {
1492         $proxy = get_cli_option('fuzzer-address');
1493     }
1494
1495     if ((not defined $proxy) or ($choice eq 'vanilla-proxy')) {
1496
1497         if (cli_option_is_set('privoxy-address')) {
1498             $proxy .=  get_cli_option('privoxy-address');
1499         }
1500     }
1501 }
1502
1503 sub start_forks($) {
1504     my $forks = shift;
1505
1506     l(LL_ERROR, "Invalid --fork value: " . $forks . ".") if ($forks < 0); 
1507
1508     foreach my $fork (1 .. $forks) {
1509         log_message("Starting fork $fork");
1510         my $pid = fork();
1511         if (defined $pid && !$pid) {
1512             return;
1513         }
1514     }
1515 }
1516
1517 sub main () {
1518
1519     init_our_variables();
1520     parse_cli_options();
1521     check_for_curl();
1522     init_proxy_settings('vanilla-proxy');
1523     load_regressions_tests();
1524     init_proxy_settings('fuzz-proxy');
1525     start_forks(get_cli_option('forks')) if cli_option_is_set('forks');
1526     execute_regression_tests();
1527 }
1528
1529 main();
1530
1531 =head1 NAME
1532
1533 B<privoxy-regression-test> - A regression test "framework" for Privoxy.
1534
1535 =head1 SYNOPSIS
1536
1537 B<privoxy-regression-test> [B<--debug bitmask>] [B<--forks> forks]
1538 [B<--fuzzer-feeding>] [B<--fuzzer-feeding>] [B<--help>] [B<--level level>]
1539 [B<--loops count>] [B<--max-level max-level>] [B<--max-time max-time>]
1540 [B<--min-level min-level>] B<--privoxy-address proxy-address>
1541 [B<--retries retries>] [B<--test-number test-number>]
1542 [B<--show-skipped-tests>] [B<--verbose>]
1543 [B<--version>]
1544
1545 =head1 DESCRIPTION
1546
1547 Privoxy-Regression-Test is supposed to one day become
1548 a regression test suite for Privoxy. It's not quite there
1549 yet, however, and can currently only test header actions,
1550 check the returned status code for requests to arbitrary
1551 URLs and verify which actions are applied to them.
1552
1553 Client header actions are tested by requesting
1554 B<http://p.p/show-request> and checking whether
1555 or not Privoxy modified the original request as expected.
1556
1557 The original request contains both the header the action-to-be-tested
1558 acts upon and an additional tagger-triggering header that enables
1559 the action to test.
1560
1561 Applied actions are checked through B<http://p.p/show-url-info>.
1562
1563 =head1 CONFIGURATION FILE SYNTAX
1564
1565 Privoxy-Regression-Test's configuration is embedded in
1566 Privoxy action files and loaded through Privoxy's web interface.
1567
1568 It makes testing a Privoxy version running on a remote system easier
1569 and should prevent you from updating your tests without updating Privoxy's
1570 configuration accordingly.
1571
1572 A client-header-action test section looks like this:
1573
1574     # Set Header    = Referer: http://www.example.org.zwiebelsuppe.exit/
1575     # Expect Header = Referer: http://www.example.org/
1576     {+client-header-filter{hide-tor-exit-notation} -hide-referer}
1577     TAG:^client-header-filter\{hide-tor-exit-notation\}$
1578
1579 The example above causes Privoxy-Regression-Test to set
1580 the header B<Referer: http://www.example.org.zwiebelsuppe.exit/>
1581 and to expect it to be modified to
1582 B<Referer: http://www.example.org/>.
1583
1584 When testing this section, Privoxy-Regression-Test will set the header
1585 B<X-Privoxy-Control: client-header-filter{hide-tor-exit-notation}>
1586 causing the B<privoxy-control> tagger to create the tag
1587 B<client-header-filter{hide-tor-exit-notation}> which will finally
1588 cause Privoxy to enable the action section.
1589
1590 Note that the actions itself are only used by Privoxy,
1591 Privoxy-Regression-Test ignores them and will be happy
1592 as long as the expectations are satisfied.
1593
1594 A fetch test looks like this:
1595
1596     # Fetch Test = http://p.p/user-manual
1597     # Expect Status Code = 302
1598
1599 It tells Privoxy-Regression-Test to request B<http://p.p/user-manual>
1600 and to expect a response with the HTTP status code B<302>. Obviously that's
1601 not a very thorough test and mainly useful to get some code coverage
1602 for Valgrind or to verify that the templates are installed correctly.
1603
1604 If you want to test CGI pages that require a trusted
1605 referer, you can use:
1606
1607     # Trusted CGI Request = http://p.p/edit-actions
1608
1609 It works like ordinary fetch tests, but sets the referer
1610 header to a trusted value.
1611
1612 If no explicit status code expectation is set, B<200> is used.
1613
1614 To verify that a URL is blocked, use:
1615
1616     # Blocked URL = http://www.example.com/blocked
1617
1618 To verify that a specific set of actions is applied to an URL, use:
1619
1620     # Sticky Actions = +block{foo} +handle-as-empty-document -handle-as-image
1621     # URL = http://www.example.org/my-first-url
1622
1623 The sticky actions will be checked for all URLs below it
1624 until the next sticky actions directive.
1625
1626 =head1 TEST LEVELS
1627
1628 All tests have test levels to let the user
1629 control which ones to execute (see I<OPTIONS> below). 
1630 Test levels are either set with the B<Level> directive,
1631 or implicitly through the test type.
1632
1633 Block tests default to level 7, fetch tests to level 6,
1634 "Sticky Actions" tests default to level 5, tests for trusted CGI
1635 requests to level 3 and client-header-action tests to level 1.
1636
1637 =head1 OPTIONS
1638
1639 B<--debug bitmask> Add the bitmask provided as integer
1640 to the debug settings.
1641
1642 B<--forks forks> Number of forks to start before executing
1643 the regression tests. This is mainly useful for stress-testing.
1644
1645 B<--fuzzer-address> Listening address used when executing
1646 the regression tests. Useful to make sure that the requests
1647 to load the regression tests don't fail due to fuzzing.
1648
1649 B<--fuzzer-feeding> Ignore some errors that would otherwise
1650 cause Privoxy-Regression-Test to abort the test because
1651 they shouldn't happen in normal operation. This option is
1652 intended to be used if Privoxy-Regression-Test is only
1653 used to feed a fuzzer in which case there's a high chance
1654 that Privoxy gets an invalid request and returns an error
1655 message.
1656
1657 B<--help> Shows available command line options.
1658
1659 B<--header-fuzzing> Modifies linear white space in
1660 headers in a way that should not affect the test result.
1661
1662 B<--level level> Only execute tests with the specified B<level>. 
1663
1664 B<--loop count> Loop through the regression tests B<count> times. 
1665 Useful to feed a fuzzer, or when doing stress tests with
1666 several Privoxy-Regression-Test instances running at the same
1667 time.
1668
1669 B<--max-level max-level> Only execute tests with a B<level>
1670 below or equal to the numerical B<max-level>.
1671
1672 B<--max-time max-time> Give Privoxy B<max-time> seconds
1673 to return data. Increasing the default may make sense when
1674 Privoxy is run through Valgrind, decreasing the default may
1675 make sense when Privoxy-Regression-Test is used to feed
1676 a fuzzer.
1677
1678 B<--min-level min-level> Only execute tests with a B<level>
1679 above or equal to the numerical B<min-level>.
1680
1681 B<--privoxy-address proxy-address> Privoxy's listening address.
1682 If it's not set, the value of the environment variable http_proxy
1683 will be used. B<proxy-address> has to be specified in http_proxy
1684 syntax.
1685
1686 B<--retries retries> Retry B<retries> times.
1687
1688 B<--test-number test-number> Only run the test with the specified
1689 number.
1690
1691 B<--show-skipped-tests> Log skipped tests even if verbose mode is off.
1692
1693 B<--verbose> Log succesful tests as well. By default only
1694 the failures are logged.
1695
1696 B<--version> Print version and exit.
1697
1698 The second dash is optional, options can be shortened,
1699 as long as there are no ambiguities.
1700
1701 =head1 PRIVOXY CONFIGURATION
1702
1703 Privoxy-Regression-Test is shipped with B<regression-tests.action>
1704 which aims to test all official client-header modifying actions
1705 and can be used to verify that the templates and the user manual
1706 files are installed correctly.
1707
1708 To use it, it has to be copied in Privoxy's configuration
1709 directory, and afterwards referenced in Privoxy's configuration
1710 file with the line:
1711
1712     actionsfile regression-tests.action
1713
1714 In general, its tests are supposed to work without changing
1715 any other action files, unless you already added lots of
1716 taggers yourself. If you are using taggers that cause problems,
1717 you might have to temporary disable them for Privoxy's CGI pages.
1718
1719 Some of the regression tests rely on Privoxy features that
1720 may be disabled in your configuration. Tests with a level below
1721 7 are supposed to work with all Privoxy configurations (provided
1722 you didn't build with FEATURE_GRACEFUL_TERMINATION).
1723
1724 Tests with level 9 require Privoxy to deliver the User Manual,
1725 tests with level 12 require the CGI editor to be enabled.
1726
1727 =head1 CAVEATS
1728
1729 Expect the configuration file syntax to change with future releases.
1730
1731 =head1 LIMITATIONS
1732
1733 As Privoxy's B<show-request> page only shows client headers,
1734 Privoxy-Regression-Test can't use it to test Privoxy actions
1735 that modify server headers.
1736
1737 As Privoxy-Regression-Test relies on Privoxy's tag feature to
1738 control the actions to test, it currently only works with
1739 Privoxy 3.0.7 or later.
1740
1741 At the moment Privoxy-Regression-Test fetches Privoxy's
1742 configuration page through I<curl>(1), therefore you have to
1743 have I<curl> installed, otherwise you won't be able to run
1744 Privoxy-Regression-Test in a meaningful way.
1745
1746 =head1 SEE ALSO
1747
1748 privoxy(1) curl(1)
1749
1750 =head1 AUTHOR
1751
1752 Fabian Keil <fk@fabiankeil.de>
1753
1754 =cut