Allow https:// URLs
[privoxy.git] / doc / webserver / actions / step2.php
index 0a4d36b..bdc08cd 100644 (file)
+<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
+<html>
+ <!--
+
+  File :  $Source: /cvsroot/ijbswa/current/doc/webserver/actions/step2.php,v $
+
+  Purpose  :  Submit form for actions file feedback (step 2)
+              This file belongs in
+              ijbswa.sourceforge.net:/home/groups/i/ij/ijbswa/htdocs/
+
+  $Id: step2.php,v 1.13 2002/04/09 13:08:21 oes Exp $
+
+  $Log: step2.php,v $
+  Revision 1.13  2002/04/09 13:08:21  oes
+  declare script type
+
+  Revision 1.12  2002/04/08 17:04:05  oes
+  Adapt to unified stylesheet
+
+  Revision 1.11  2002/04/07 15:00:20  oes
+  Descand into framesets to harvest all image URLs
+
+  Revision 1.10  2002/04/06 15:19:35  oes
+  Cosmetics   Clean-up, smarter handling of unreachable URLs
+
+  Revision 1.9  2002/04/06 11:34:44  oes
+  Reactivating the scripts ,-)   Cosmetics
+
+  Revision 1.7  2002/04/03 19:36:04  swa
+  consistent look
+
+  Revision 1.6  2002/04/02 07:22:19  oes
+  Elimnating duplicate images; using relative link for step3
+
+  Revision 1.5  2002/04/02 06:14:47  oes
+  Follow redirects  
+
+  Revision 1.4  2002/04/01 19:13:47  oes (based on 1.2)
+  Extended, fixed bugs, beefed up design, made IE-safe
+
+  Revision 1.3  2002/03/30 20:44:46  swa
+  have consistent look and feel. part 2.
+  use correct urls. 
+
+  Revision 1.2  2002/03/30 19:49:34  swa
+  have consistent look and feel
+
+  Revision 1.1  2002/03/30 03:20:30  oes
+  Added Feedback mechanism for actions file
+
+
+  Copyright (C) 2002 the SourceForge Privoxy team.
+  http://www.privoxy.org/
+
+  Written by Andreas Oesterhelt
+
+  This program is free software; you can redistribute it
+  and/or modify it under the terms of the GNU General
+  Public License as published by the Free Software
+  Foundation; either version 2 of the License, or (at
+  your option) any later version.
+
+  This program is distributed in the hope that it will
+  be useful, but WITHOUT ANY WARRANTY; without even the
+  implied warranty of MERCHANTABILITY or FITNESS FOR A
+  PARTICULAR PURPOSE.  See the GNU General Public
+  License for more details.
+
+  The GNU General Public License should be included with
+  this file.  If not, you can view it at
+  http://www.gnu.org/copyleft/gpl.html
+  or write to the Free Software Foundation, Inc., 59
+  Temple Place - Suite 330, Boston, MA  02111-1307, USA.
+
+ -->
+
+ <head>
+  <meta http-equiv="Content-Style-Type" content="text/css">
+  <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">
+  <meta http-equiv="Content-Script-Type" content="text/javascript">
+  <link rel="stylesheet" type="text/css" href="../privoxy.css">
+  <link rel="stylesheet" type="text/css" href="../p_feedback.css">
+
+  <script language="javascript" type="text/javascript">
+  <!--
+   //
+   // Could be as easy as style="max-wdith: 300px; max-height..." inside the
+   // <img> tag, but IE doesn't understand that. Setting the values directly also
+   // screws IE for some weird reason. All praise MS.
+   //
+
+   function prettyscale(image)
+   {
+      newwidth = 0
+      newheight = 0
+
+      if (image.width > 300)
+      {
+         newwidth = 300
+      }
+
+      if (image.height > 50)
+      {
+         newheight = 50
+      }
+
+      if (image.width < 20)
+      {
+         newwidth = 20
+      }
+
+      if (image.height < 20)
+      {
+         newheight = 20
+      }
+
+      if (newwidth != 0)
+      {
+         image.width = newwidth
+      }
+
+      if (newheight != 0)
+      {
+         image.height = newheight
+      }
+   }
+  //-->
+  </script>
+
 <?php
 
+/*
+ * For testing: 
+ */
+//phpinfo();
+//error_reporting(E_ALL);
 error_reporting(E_NONE);
-#error_reporting(E_ALL);
-
-
-//  File :  $Source: /cvsroot/ijbswa/current/doc/webserver/actions/step2.php,v $
-//
-//  Purpose  :  Submit form for actions file feedback (step 2)
-//              This file belongs in
-//              ijbswa.sourceforge.net:/home/groups/i/ij/ijbswa/htdocs/
-//
-//  $Id: step2.php,v 1.1 2002/03/30 03:20:30 oes Exp $
-//
-//  $Log: step2.php,v $
-//  Revision 1.1  2002/03/30 03:20:30  oes
-//  Added Feedback mechanism for actions file
-//
-//
-//  Written by and Copyright (C) 2001 the SourceForge
-//  Privoxy team. http://www.privoxy.org/
-//
-//  Based on the Internet Junkbuster originally written
-//  by and Copyright (C) 1997 Anonymous Coders and
-//  Junkbusters Corporation.  http://www.junkbusters.com
-//
-//  This program is free software; you can redistribute it
-//  and/or modify it under the terms of the GNU General
-//  Public License as published by the Free Software
-//  Foundation; either version 2 of the License, or (at
-//  your option) any later version.
-//
-//  This program is distributed in the hope that it will
-//  be useful, but WITHOUT ANY WARRANTY; without even the
-//  implied warranty of MERCHANTABILITY or FITNESS FOR A
-//  PARTICULAR PURPOSE.  See the GNU General Public
-//  License for more details.
-//
-//  The GNU General Public License should be included with
-//  this file.  If not, you can view it at
-//  http://www.gnu.org/copyleft/gpl.html
-//  or write to the Free Software Foundation, Inc., 59
-//  Temple Place - Suite 330, Boston, MA  02111-1307, USA.
-//
-//
 
 /*
- * For testing: 
+ * Function: link_to_absolute
+ * Purpose:  Make $link from $base absolute
+ */
+function link_to_absolute($base, $link)
+{
+   /*
+    * If $link already is absolute, we're done:
+    */
+   if (!strncmp("http://", $link, 7) || !strncmp("https://", $link, 8))
+   {
+      return $link;
+   }
+
+   /*
+    * Cut the base to it's proto://host/ or to its proto://host/dir/,
+    * depending whether $link is host-relative or path-relative.
+    */
+   if ($link{0} == "/")
+   {
+      /*
+       * host-relative:
+       */
+       preg_match('|^(https?://[^/]+)|i', $base, $results);
+       $base = $results[1];
+   }
+   else
+   {
+      /*
+       * path-relative:
+       */
+      if (strpos($base, '/') != strlen($base))
+      {
+         preg_match('|(.*/)|i', $base, $results);
+         $base = $results[1];
+      }
+   }
+   return $base.$link;
+}
+
+
+/*
+ * Function: slurp_page
+ *
+ * Purpose:  Retrieve a URL with curl, and return the contents
+ *           or "FAILED" if it fails.
  */
-#$base_url = "http://www.oesterhelt.org/actions";
-$base_url = "http://www.privoxy.org/actions";
+
+function slurp_page($url)
+{
+   $ch = curl_init ($url);
+
+   curl_setopt ($ch, CURLOPT_HEADER, 0);
+   curl_setopt ($ch, CURLOPT_FAILONERROR, 1);
+   curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1);
+   curl_setopt ($ch, CURLOPT_TIMEOUT, 20);            
+
+   ob_start();
+   $success = curl_exec ($ch);
+   $page = ob_get_contents();
+   ob_end_clean();
+
+   curl_close ($ch);
+
+   return $success ? $page : "FAILED";
+}
+
+/*
+ * Function: get_image_urls_sp
+ * 
+ * Purpose:  Return the image URLs from a single page
+ */
+function get_image_urls_sp($page, $url)
+{
+   preg_match_all('|<img\s+[^>]*?src=[\'"]?(.*?)[\'" >]|i', $page, $matches);
+   
+   foreach (array_unique($matches[1]) as $image_link)
+   {
+      $result[] = link_to_absolute($url, $image_link); 
+   }
+
+   return count($result) ? $result : 0;
+}
+
+/*
+ * Function: get_image_urls
+ * 
+ * Purpose:  If the page is a frameset, rerurn the image URLs from all
+ *           its frame SRCes, else from the page itself.
+ */
+function get_image_urls($page, $url)
+{
+
+   preg_match_all('|<frame\s+[^>]*?src=[\'"]?(.*?)[\'" >]|i', $page, $matches);
+
+   if (count($matches[1]))
+   {
+      foreach(array_unique($matches[1]) as $frame_link)
+      {
+         $framebuf = slurp_page(link_to_absolute($url, $frame_link));
+         $result = array_merge($result, get_image_urls_sp($framebuf, link_to_absolute($url, $frame_link)));
+      }
+   }
+   else
+   {
+      $result = get_image_urls_sp($page, $url);
+   }
+
+   return array_values(array_unique($result));
+}
+
+
+/*
+ * Function: error_abort
+ * Purpose:  Return an error page with $title and $message
+ */
+function error_abort($title, $message)
+{
+   if ($title == "invalid") /* shortcut */
+   {
+      $title = "Invalid Feedback Submission";
+   }
+
+   echo ("  <title>Privoxy: $title</title>
+           </head>
+           <body>
+            <div class=\"title\">
+             <h1>
+              <a href=\"http://www.privoxy.org/\">Privoxy</a>: $title
+              </h1>
+             </div>
+            <center>
+             <div class=\"warning\">
+              $message
+             </div>
+            </center>
+            <p>Valid <a href=\"http://validator.w3.org/\">HTML 4.01 Transitional</a></p>
+           </body>
+          </html>\n");
+   exit; 
+}
 
 /* 
  * Cannot start with step 2:
  */
 if (!isset($referrer_url))
 {
-     echo ("<html><head><title>Invalid Feedback Submission</title>
-           <link rel=\"stylesheet\" type=\"text/css\" href=\"../p_web.css\">
-               </head>
-                <body><h2>Invalid Feedback Submission</h2>
-                      <p>When submitting your feedback please start with
-                         <a href=\"index.php\">step 1</a>.</p>
-                 </body>
-          </html>");
-   exit; 
+   error_abort("invalid", "When submitting your feedback please start with
+                <a href=\"index.php\">step 1</a>.");
 }
 
+
 /* 
  * Cannot work on unknown problem:
  */
 if (!isset($problem) || $problem == "INVALID")
 {
-     echo ("<html><head><title>Invalid Feedback Submission</title>
-           <link rel=\"stylesheet\" type=\"text/css\" href=\"../p_web.css\">
-               </head>
-                <body><h2>Invalid Feedback Submission</h2>
-                      <p>You need to select the nature of the problem in
-                         <a href=\"javascript:back()\">step 1</a>.</p>
-                 </body>
-          </html>");
-   exit; 
+   error_abort("invalid", "You need to select the nature of the problem in
+                <a href=\"javascript:history.back();\">step 1</a>.");
 }
 
 
 /*
- * Check if URL really exists and buffer its contents:
+ * If the protocol is missing from $referrer_url, prepend "http://"
  */
+if (!preg_match('|^https?://|i', $referrer_url, $dummy))
+{
+   $referrer_url = "http://" . $referrer_url;
+}
 
-$ch = curl_init ($referrer_url);
-curl_setopt ($ch, CURLOPT_HEADER, 0);
-curl_setopt ($ch, CURLOPT_FAILONERROR, 1);
-
-ob_start();
-$success = curl_exec ($ch);
-$page = ob_get_contents();
-ob_end_clean();
-
-curl_close ($ch);
 
-if (!$success)
+/*
+ * Check if URL really exists and buffer its contents:
+ */
+if (($page = slurp_page($referrer_url)) == "FAILED")
 {
-   echo ("<html><head><title>Invalid Feedback Submission</title>
-           <link rel=\"stylesheet\" type=\"text/css\" href=\"../p_web.css\">
-               </head>
-                <body><h2>Invalid Feedback Submission</h2>
-                      <p>The URL that you entered (<a href=\"$referrer_url\">$referrer_url</a>)
-                         <br>could not be retrieved.</p>
-                         <p>Make sure the URL is correct and publicly accessible.</p>
-                         <p><a href=\"javascript:back()\">Back to step 1</a></p>
-                         
-                 </body>
-          </html>");
-   exit; 
+   $url_confirm = "
+     <dt>
+      <p><b>Confirm the URL:</b></p>
+     </dt>
+     <dd>
+      <p>
+       The URL that you entered could not be retrieved. Please make sure that
+      </p>
+      <p class=\"important\">
+       <a href=\"$referrer_url\">$referrer_url</a>
+      </p>
+      <p>
+       is correct and publicly accssible.
+      </p>
+      <p>
+       <input type=\"checkbox\" name=\"url_confirmed\" value=\"user\"> Yes, I'm sure.
+      </p>
+     </dd>";
+}
+else
+{
+   $url_confirm = "<input type=\"hidden\" name=\"url_confirmed\" value=\"automatic\">";
 }
 
 /* 
@@ -129,118 +351,168 @@ switch($problem)
 
 ?>
 
-<html>
-  <head>
-    <title>Privoxy Action List Feedback - Step 2 of 2</title>
-    <link rel="stylesheet" type="text/css" href="../p_web.css">
-</head>
-
-<h2><a href="http://www.privoxy.org" target="_blank">Privoxy</a> Action List Feedback - Step 2 of 2</h2>
-<p>
-You are about to report that <?php echo ($problem_description) ?>
-<br>on <a href="<?php echo ($referrer_url) ?>"><?php echo ($referrer_url) ?></a>.
-</p>
+  <title>Privoxy Action List Feedback - Step 2 of 2</title>
+ </head>
+ <body>
 
+  <div class="title">
+   <h1>
+     <a href="http://www.privoxy.org" target="_blank">Privoxy</a> Action List Feedback - Step 2 of 2
+   </h1>
+  </div>
 
-<p>
-<form action="<?php echo($base_url); ?>/step3.php" method="post">
+  <div class="box">
+   <b>You are about to report that <?php echo ($problem_description) ?> on
+   <a href="<?php echo ($referrer_url) ?>"><?php echo ($referrer_url) ?></a>.</b>
+  </div>
 
-<input type="hidden" name="problem" value="<?php echo ($problem) ?>">
-<input type="hidden" name="referrer_url" value="<?php echo ($referrer_url) ?>">
+  <div class="box">
+   <form action="step3.php" method="post">
+    <p>
+     <input type="hidden" name="problem" value="<?php echo ($problem) ?>">
+     <input type="hidden" name="referrer_url" value="<?php echo ($referrer_url) ?>">
+    </p>
 
-<dl>
+    <dl>
 
 <?php
 
+/*
+ * Include the confirmation for an unretrievable URL if
+ * necessary
+ */
+echo ($url_confirm);
+
+/*
+ * Create / suppress form elements depending on type of
+ * problem
+ */
 if ($problem != "P1")
 {
    echo ("<!--");
 }
 else
 {
-   preg_match_all('|<img\s+[^>]*?src=[\'"]?(.*?)[\'" >]|i', $page, $matches);
-   $count = count($matches[0]);
+   $image_urls = get_image_urls($page, $referrer_url);
+   $count = count($image_urls);
+
    if ($count > 0)
    {
-      $referrer_base = substr($referrer_url, 0, -strpos(strrev($referrer_url), '/'));
-      $referrer_host = "http://".strrev(strrchr(strrev(substr($referrer_url, 7)), "/"));
-
-      echo ("<dt><b>Choose the images to be blocked from the following list:</b></dt><dd><p>\n");
-      echo ("<input type=\"hidden\" name=\"num_images\" value=\"$count\">\n");
-      echo ("<table border=\"0\" cellpadding=\"0\" cellspacing=\"4\">\n");
-      for ($i=0; $i< $count; $i++) {
-         $image_url = $matches[1][$i];
-         if (strncmp("http://", $image_url, 7))
-         {
-            if ($image_url{0} == "/")
-            {
-               $image_url = $referrer_host.$image_url;
-            }
-            else
-            {
-               $image_url = $referrer_base.$image_url;
-            }
-         }
-         echo ("<tr><td rowspan=2><input type=\"checkbox\" name=\"block_image[$i]\" value=\"off\"></td>\n");
-         echo ("<td><a href=\"$image_url\">$image_url</a>:</td>\n");
-         echo ("<td><input type=\"hidden\" name=\"image_url[$i]\" value=\"$image_url\"></td></tr>\n");
-         echo ("<tr><td><img style=\"max-width: 300; max-height: 50; min-width: 20; min-height: 20\" src=\"$image_url\"></td></tr>\n");
+      /*
+       * Open section in <dl>; Open table:
+       */
+      echo ("     <dt><b>Choose the images you want blocked from the following list:</b></dt>
+                  <dd>
+                   <p>
+                    <input type=\"hidden\" name=\"num_images\" value=\"$count\">
+                    <table border=\"0\" cellpadding=\"0\" cellspacing=\"4\">\n");
+      /*
+       * Print one table row for each image found:
+       */
+      for ($i=0; $i< $count; $i++)
+      {
+         $image_url = link_to_absolute($referrer_url, $image_urls[$i]);
+
+         /*
+          * Print the row(s):
+          */
+         echo ("       <tr>
+                        <td rowspan=\"2\">
+                         <input type=\"checkbox\" name=\"block_image[$i]\" value=\"off\">
+                        </td>
+                        <td>
+                         <a href=\"$image_url\">$image_url</a>:
+                        </td>
+                        <td>
+                         <input type=\"hidden\" name=\"image_url[$i]\" value=\"$image_url\">
+                        </td>
+                       </tr>
+                       <tr>
+                        <td>
+                         <img onload=\"prettyscale(this);\" src=\"$image_url\" alt=\"banner or not?\">
+                        </td>
+                       </tr>\n");
       }
-      echo ("</table></p></dd><dt><b>If the banner that you saw is not listed above, enter the URL here</b>\n");
+      echo ("      </table>
+                  </dd>
+
+                  <dt>
+                   <b>If the banner that you saw is not listed above, enter the URL here</b>\n");
    }
    else
    {
-      echo ("<dt><b>URL of the advertisment image:</b>\n");
+      echo ("     <dt>
+                   <b>URL of the advertisment image:</b>\n");
    }
 }
 
 ?>
 
-<br><i>Hint: right-click the image, select "Copy image location" and paste the URL here.</i></dt>
-<dd>
-<p><input name="manual_image_url" type="text" size="45" maxlength="255"></p>
-</dd>
+      <br><i>Hint: right-click the image, select "Copy image location" and paste the URL here.</i>
+     </dt>
+     <dd>
+      <p>
+       <input name="manual_image_url" type="text" size="45" maxlength="255">
+      </p>
+     </dd>
+
 <?php if($problem != "P1") echo ("-->") ?>
 
 <?php if($problem != "P2") echo ("<!--") ?>
-<dt><b>URL of the innocent image:</b>
-<br><i>Hint: right-click the image, select "Copy image location" and paste the URL here.
-<br>This may not work if the image was blocked by size or if +image-blocker is set to redirect.</i></dt>
-<dd>
-<p><input name="image_url" value="unknown" type="text" size="45" maxlength="255"></p>
-</dd>
-<?php if($problem != "P2") echo ("-->") ?>
 
+     <dt>
+      <p><b>URL of the innocent image:</b>
+       <br><i>Hint: right-click the image, select "Copy image location" and paste the URL here.
+       <br>This may not work if the image was blocked by size or if +image-blocker is set to redirect.</i>
+      </p>
+     </dt>
+     <dd>
+      <p>
+       <input name="image_url" value="unknown" type="text" size="45" maxlength="255">
+      </p>
+     </dd>
+
+<?php if($problem != "P2") echo ("-->") ?>
 
-<dt><b>Severity:</b></dt>
-<dd>
-<p>
-<select name="severity">
-<option value="3">drives me crazy</option>
-<option selected value="2">vanilla banner</option>
-<option value="1">cosmetic</option>
-</select>
-</p>
-</dd>
-
-<dt><b>Remarks:</b> <i>(optional)</i></dt>
-<dd>
-<p><textarea name="remarks" cols="35" rows="3">None.</textarea></p>
-</dd>
-
-<dt><b>Your Name:</b> <i>(optional)</i></dt>
-<dd>
-<p><input name="name" size="45"></p>
-</dd>
-
-<dt>&nbsp;</dt>
-<dd>
-<input type=submit value="Submit">
-</dd>
-
-</dl>
-</form>
-</p>
-
-</body>
+     <dt><b>Severity:</b></dt>
+     <dd>
+      <p>
+       <select name="severity">
+        <option value="3">drives me crazy</option>
+        <option selected value="2">normal</option>
+        <option value="1">cosmetic</option>
+       </select>
+      </p>
+     </dd>
+
+     <dt>
+      <b>Remarks:</b> <i>(optional)</i>
+     </dt>
+     <dd>
+      <p>
+       <textarea wrap="hard" style="font-size: 10px" name="remarks" cols="35" rows="3">None.</textarea>
+      </p>
+     </dd>
+
+     <dt>
+      <b>Your Name:</b> <i>(optional, public)</i>
+     </dt>
+     <dd>
+      <p>
+       <input name="name" size="45">
+      </p>
+     </dd>
+
+     <dt>&nbsp;</dt>
+     <dd>
+      <input type="submit" value="Submit">
+     </dd>
+
+    </dl>
+   </form>
+  </div>
+
+  <p>Valid <a href="http://validator.w3.org/">HTML 4.01 Transitional</a></p>
+
+ </body>
 </html>