The host parameter to connect_to() is now const.
[privoxy.git] / filters.c
index 8f0d376..e43ad99 100644 (file)
--- a/filters.c
+++ b/filters.c
@@ -1,4 +1,4 @@
-const char filters_rcs[] = "$Id: filters.c,v 1.9 2001/05/27 22:17:04 oes Exp $";
+const char filters_rcs[] = "$Id: filters.c,v 1.15 2001/06/03 11:03:48 oes Exp $";
 /*********************************************************************
  *
  * File        :  $Source: /cvsroot/ijbswa/current/filters.c,v $
@@ -6,7 +6,7 @@ const char filters_rcs[] = "$Id: filters.c,v 1.9 2001/05/27 22:17:04 oes Exp $";
  * Purpose     :  Declares functions to parse/crunch headers and pages.
  *                Functions declared include:
  *                   `acl_addr', `add_stats', `block_acl', `block_imageurl',
- *                   `block_url', `url_permissions', `domaincmp', `dsplit',
+ *                   `block_url', `url_actions', `domaincmp', `dsplit',
  *                   `filter_popups', `forward_url', 'redirect_url',
  *                   `ij_untrusted_url', `intercept_url', `re_process_buffer',
  *                   `show_proxy_args', 'ijb_send_banner', and `trust_url'
@@ -38,6 +38,100 @@ const char filters_rcs[] = "$Id: filters.c,v 1.9 2001/05/27 22:17:04 oes Exp $";
  *
  * Revisions   :
  *    $Log: filters.c,v $
+ *    Revision 1.15  2001/06/03 11:03:48  oes
+ *    Makefile/in
+ *
+ *    introduced cgi.c
+ *
+ *    actions.c:
+ *
+ *    adapted to new enlist_unique arg format
+ *
+ *    conf loadcfg.c
+ *
+ *    introduced confdir option
+ *
+ *    filters.c filtrers.h
+ *
+ *     extracted-CGI relevant stuff
+ *
+ *    jbsockets.c
+ *
+ *     filled comment
+ *
+ *    jcc.c
+ *
+ *     support for new cgi mechansim
+ *
+ *    list.c list.h
+ *
+ *    functions for new list type: "map"
+ *    extended enlist_unique
+ *
+ *    miscutil.c .h
+ *    introduced bindup()
+ *
+ *    parsers.c parsers.h
+ *
+ *    deleted const struct interceptors
+ *
+ *    pcrs.c
+ *    added FIXME
+ *
+ *    project.h
+ *
+ *    added struct map
+ *    added struct http_response
+ *    changes struct interceptors to struct cgi_dispatcher
+ *    moved HTML stuff to cgi.h
+ *
+ *    re_filterfile:
+ *
+ *    changed
+ *
+ *    showargs.c
+ *    NO TIME LEFT
+ *
+ *    Revision 1.14  2001/06/01 10:30:55  oes
+ *    Added optional left-anchoring to domaincmp
+ *
+ *    Revision 1.13  2001/05/31 21:21:30  jongfoster
+ *    Permissionsfile / actions file changes:
+ *    - Changed "permission" to "action" throughout
+ *    - changes to file format to allow string parameters
+ *    - Moved helper functions to actions.c
+ *
+ *    Revision 1.12  2001/05/31 17:35:20  oes
+ *
+ *     - Enhanced domain part globbing with infix and prefix asterisk
+ *       matching and optional unanchored operation
+ *
+ *    Revision 1.11  2001/05/29 11:53:23  oes
+ *    "See why" link added to "blocked" page
+ *
+ *    Revision 1.10  2001/05/29 09:50:24  jongfoster
+ *    Unified blocklist/imagelist/permissionslist.
+ *    File format is still under discussion, but the internal changes
+ *    are (mostly) done.
+ *
+ *    Also modified interceptor behaviour:
+ *    - We now intercept all URLs beginning with one of the following
+ *      prefixes (and *only* these prefixes):
+ *        * http://i.j.b/
+ *        * http://ijbswa.sf.net/config/
+ *        * http://ijbswa.sourceforge.net/config/
+ *    - New interceptors "home page" - go to http://i.j.b/ to see it.
+ *    - Internal changes so that intercepted and fast redirect pages
+ *      are not replaced with an image.
+ *    - Interceptors now have the option to send a binary page direct
+ *      to the client. (i.e. ijb-send-banner uses this)
+ *    - Implemented show-url-info interceptor.  (Which is why I needed
+ *      the above interceptors changes - a typical URL is
+ *      "http://i.j.b/show-url-info?url=www.somesite.com/banner.gif".
+ *      The previous mechanism would not have intercepted that, and
+ *      if it had been intercepted then it then it would have replaced
+ *      it with an image.)
+ *
  *    Revision 1.9  2001/05/27 22:17:04  oes
  *
  *    - re_process_buffer no longer writes the modified buffer
@@ -162,6 +256,8 @@ const char filters_rcs[] = "$Id: filters.c,v 1.9 2001/05/27 22:17:04 oes Exp $";
 #include "errlog.h"
 #include "jbsockets.h"
 #include "miscutil.h"
+#include "actions.h"
+#include "cgi.h"
 
 #ifdef _WIN32
 #include "win32.h"
@@ -179,60 +275,6 @@ const char filters_h_rcs[] = FILTERS_H_VERSION;
 #define ijb_isdigit(__X) isdigit((int)(unsigned char)(__X))
 
 
-static const char CBLOCK[] = 
-#ifdef AMIGA 
-       "HTTP/1.0 403 Request for blocked URL\n" 
-#else /* ifndef AMIGA */
-       "HTTP/1.0 202 Request for blocked URL\n"
-#endif /* ndef AMIGA */
-       "Pragma: no-cache\n"
-       "Last-Modified: Thu Jul 31, 1997 07:42:22 pm GMT\n"
-       "Expires:       Thu Jul 31, 1997 07:42:22 pm GMT\n"
-       "Content-Type: text/html\n\n"
-       "<html>\n"
-       "<head>\n"
-       "<title>Internet Junkbuster: Request for blocked URL</title>\n"
-       "</head>\n"
-       WHITEBG
-       "<center><h1>"
-       BANNER
-       "</h1></center>\n"
-      "<p align=center>Your request for <b>%s%s</b><br>\n"
-      "was blocked."
-#ifdef FORCE_LOAD
-       "  <a href=\"http://%s" FORCE_PREFIX "%s\">"
-       "Go there anyway.</a>"
-#endif /* def FORCE_LOAD */
-      "</p>\n"
-      "</body>\n"
-      "</html>\n";
-
-#ifdef TRUST_FILES
-static const char CTRUST[] =
-#ifdef AMIGA 
-       "HTTP/1.0 403 Request for untrusted URL\n"
-#else /* ifndef AMIGA */
-       "HTTP/1.0 202 Request for untrusted URL\n"
-#endif /* ndef AMIGA */
-       "Pragma: no-cache\n"
-       "Last-Modified: Thu Jul 31, 1997 07:42:22 pm GMT\n"
-       "Expires:       Thu Jul 31, 1997 07:42:22 pm GMT\n"
-       "Content-Type: text/html\n\n"
-       "<html>\n"
-       "<head>\n"
-       "<title>Internet Junkbuster: Request for untrusted URL</title>\n"
-       "</head>\n"
-       WHITEBG
-       "<center>"
-       "<a href=http://i.j.b/ij-untrusted-url?%s+%s+%s>"
-       BANNER
-       "</a>"
-       "</center>"
-       "</body>\n"
-       "</html>\n";
-#endif /* def TRUST_FILES */
-
-
 #ifdef ACL_FILES
 /*********************************************************************
  *
@@ -389,27 +431,29 @@ char *block_url(struct http_request *http, struct client_state *csp)
 {
    char *p;
    int n;
+   int factor = 2;
 
-   if ((csp->permissions & PERMIT_BLOCK) == 0)
+   if ((csp->action->flags & ACTION_BLOCK) == 0)
    {
       return(NULL);
    }
    else
    {
-      n  = strlen(CBLOCK);
-      n += strlen(http->hostport);
-      n += strlen(http->path);
 #ifdef FORCE_LOAD
-      n += strlen(http->hostport);
-      n += strlen(http->path);
+      factor++;
 #endif /* def FORCE_LOAD */
 
+      n  = strlen(CBLOCK);
+      n += factor * strlen(http->hostport);
+      n += factor * strlen(http->path);
+
       p = (char *)malloc(n);
 
 #ifdef FORCE_LOAD
-      sprintf(p, CBLOCK, http->hostport, http->path, http->hostport, http->path);
+      sprintf(p, CBLOCK, http->hostport, http->path, http->hostport, http->path,
+              http->hostport, http->path);
 #else
-      sprintf(p, CBLOCK, http->hostport, http->path);
+      sprintf(p, CBLOCK, http->hostport, http->path, http->hostport, http->path);
 #endif /* def FORCE_LOAD */
 
       return(p);
@@ -450,75 +494,11 @@ int block_imageurl(struct http_request *http, struct client_state *csp)
    }
 #endif
 
-   return ((csp->permissions & PERMIT_IMAGE) != 0);
+   return ((csp->action->flags & ACTION_IMAGE) != 0);
 }
 #endif /* def IMAGE_BLOCKING */
 
 
-#ifdef PCRS
-/*********************************************************************
- *
- * Function    :  re_process_buffer
- *
- * Description :  Apply all jobs from the joblist (aka. Perl regexp's) to
- *                the text buffer that's been accumulated in csp->iob->buf
- *                and set csp->content_length to the modified size.
- *
- * Parameters  :
- *          1  :  csp = Current client state (buffers, headers, etc...)
- *
- * Returns     :  a pointer to the (newly allocated) modified buffer.
- *                
- *
- *********************************************************************/
-char *re_process_buffer(struct client_state *csp)
-{
-   int hits=0;
-   int size = csp->iob->eod - csp->iob->cur;
-   char *old=csp->iob->cur, *new = NULL;
-   pcrs_job *job, *joblist;
-
-   struct file_list *fl;
-   struct re_filterfile_spec *b;
-
-   /* Sanity first ;-) */
-   if (size <= 0)
-   {
-      return(strdup(""));
-   }
-
-   if ( ( NULL == (fl = csp->rlist) ) || ( NULL == (b = fl->f) ) )
-   {
-      log_error(LOG_LEVEL_ERROR, "Unable to get current state of regexp filtering.");
-      return(strdup(""));
-   }
-
-   joblist = b->joblist;
-
-
-   log_error(LOG_LEVEL_RE_FILTER, "re_filtering %s%s (size %d) ...",
-              csp->http->hostport, csp->http->path, size);
-
-   /* Apply all jobs from the joblist */
-   for (job = joblist; NULL != job; job = job->next)
-   {
-      hits += pcrs_exec_substitution(job, old, size, &new, &size);
-      if (old != csp->iob->cur) free(old);
-      old=new;
-   }
-
-   log_error(LOG_LEVEL_RE_FILTER, " produced %d hits (new size %d).", hits, size);
-
-   csp->content_length = size;
-
-   /* fwiw, reset the iob */
-   IOB_RESET(csp);
-   return(new);
-
-}
-#endif /* def PCRS */
-
-
 #ifdef TRUST_FILES
 /*********************************************************************
  *
@@ -729,177 +709,124 @@ trust_url_not_trusted:
 #endif /* def TRUST_FILES */
 
 
-static const char C_HOME_PAGE[] =
-   "HTTP/1.0 200 OK\n"
-   "Pragma: no-cache\n"
-   "Expires: Thu Jul 31, 1997 07:42:22 pm GMT\n"
-   "Content-Type: text/html\n\n"
-   "<html>\n"
-   "<head>\n"
-   "<title>Internet Junkbuster: Information</title>\n"
-   "</head>\n"
-   BODY
-   "<h1><center>"
-   BANNER
-   "</h1></center>\n"
-   "<p><a href=\"" HOME_PAGE_URL "\">JunkBuster web site</a></p>\n"
-   "<p><a href=\"http://i.j.b/show-proxy-arg\">Proxy configuration</a></p>\n"
-   "<p><a href=\"http://i.j.b/show-url-info\">Look up a URL</a></p>\n"
-   "</body>\n"
-   "</html>\n";
-
-
+#ifdef PCRS
 /*********************************************************************
  *
- * Function    :  intercept_url
+ * Function    :  re_process_buffer
  *
- * Description :  checks the URL `basename' against a list of URLs to
- *                snarf. If it matches, it calls the associated function
- *                which returns an HTML page to send back to the client.
- *                Right now, we snarf:
- *                      "show-proxy-args", and
- *                      "ij-untrusted-url" (optional w/TRUST_FILES)
+ * Description :  Apply all jobs from the joblist (aka. Perl regexp's) to
+ *                the text buffer that's been accumulated in csp->iob->buf
+ *                and set csp->content_length to the modified size.
  *
  * Parameters  :
- *          1  :  http = http_request request, check `basename's of blocklist
- *          2  :  csp = Current client state (buffers, headers, etc...)
+ *          1  :  csp = Current client state (buffers, headers, etc...)
  *
- * Returns     :  1 if it intercepts & handles the request.
+ * Returns     :  a pointer to the (newly allocated) modified buffer.
+ *                
  *
  *********************************************************************/
-int intercept_url(struct http_request *http, struct client_state *csp)
+char *re_process_buffer(struct client_state *csp)
 {
-   char *basename = NULL;
-   const struct interceptors *v;
+   int hits=0;
+   int size = csp->iob->eod - csp->iob->cur;
+   char *old=csp->iob->cur, *new = NULL;
+   pcrs_job *job, *joblist;
 
-   if (0 == strcmpic(http->host,"i.j.b"))
-   {
-      /*
-       * Catch http://i.j.b/...
-       */
-      basename = http->path;
-   }
-   else if ( ( (0 == strcmpic(http->host,"ijbswa.sourceforge.net"))
-            || (0 == strcmpic(http->host,"ijbswa.sf.net")) )
-            && (0 == strncmpic(http->path,"/config", 7))
-            && ((http->path[7] == '/') || (http->path[7] == '\0')))
+   struct file_list *fl;
+   struct re_filterfile_spec *b;
+
+   /* Sanity first ;-) */
+   if (size <= 0)
    {
-      /*
-       * Catch http://ijbswa.sourceforge.net/config/...
-       * and   http://ijbswa.sf.net/config/...
-       */
-      basename = http->path + 7;
+      return(strdup(""));
    }
 
-   if (!basename)
+   if ( ( NULL == (fl = csp->rlist) ) || ( NULL == (b = fl->f) ) )
    {
-      /* Don't want to intercept */
-      return(0);
+      log_error(LOG_LEVEL_ERROR, "Unable to get current state of regexp filtering.");
+      return(strdup(""));
    }
 
-   /* We have intercepted it. */
+   joblist = b->joblist;
 
-   /* remove any leading slash */
-   if (*basename == '/')
-   {
-      basename++;
-   }
 
-   log_error(LOG_LEVEL_GPC, "%s%s intercepted!", http->hostport, http->path);
-   log_error(LOG_LEVEL_CLF, "%s - - [%T] \"%s\" 200 3", 
-                            csp->ip_addr_str, http->cmd); 
+   log_error(LOG_LEVEL_RE_FILTER, "re_filtering %s%s (size %d) ...",
+              csp->http->hostport, csp->http->path, size);
 
-   for (v = intercept_patterns; v->str; v++)
+   /* Apply all jobs from the joblist */
+   for (job = joblist; NULL != job; job = job->next)
    {
-      if (strncmp(basename, v->str, v->len) == 0)
-      {
-         char * p = ((v->interceptor)(http, csp));
+      hits += pcrs_exec_substitution(job, old, size, &new, &size);
+      if (old != csp->iob->cur) free(old);
+      old=new;
+   }
 
-         if (p != NULL)
-         {
-            /* Send HTML redirection result */
-            write_socket(csp->cfd, p, strlen(p));
+   log_error(LOG_LEVEL_RE_FILTER, " produced %d hits (new size %d).", hits, size);
 
-            freez(p);
-         }
-         return(1);
-      }
-   }
+   csp->content_length = size;
 
-   write_socket(csp->cfd, C_HOME_PAGE, strlen(C_HOME_PAGE));
+   /* fwiw, reset the iob */
+   IOB_RESET(csp);
+   return(new);
 
-   return(1);
 }
+#endif /* def PCRS */
+
 
-#ifdef FAST_REDIRECTS
 /*********************************************************************
  *
- * Function    :  redirect_url
+ * Function    :  url_actions
  *
- * Description :  Checks for redirection URLs and returns a HTTP redirect
- *                to the destination URL.
+ * Description :  Gets the actions for this URL.
  *
  * Parameters  :
- *          1  :  http = http_request request, check `basename's of blocklist
+ *          1  :  http = http_request request for blocked URLs
  *          2  :  csp = Current client state (buffers, headers, etc...)
  *
- * Returns     :  NULL if URL was clean, HTTP redirect otherwise.
+ * Returns     :  N/A
  *
  *********************************************************************/
-char *redirect_url(struct http_request *http, struct client_state *csp)
+void url_actions(struct http_request *http, 
+                 struct client_state *csp)
 {
-   char *p, *q;
-
-   p = q = csp->http->path;
-   log_error(LOG_LEVEL_REDIRECTS, "checking path: %s", p);
-
-   /* find the last URL encoded in the request */
-   while (p = strstr(p, "http://"))
-   {
-      q = p++;
-   }
+   struct file_list *fl;
+   struct url_actions *b;
 
-   /* if there was any, generate and return a HTTP redirect */
-   if (q != csp->http->path)
-   {
-      log_error(LOG_LEVEL_REDIRECTS, "redirecting to: %s", q);
+   init_current_action(csp->action);
 
-      p = (char *)malloc(strlen(HTTP_REDIRECT_TEMPLATE) + strlen(q));
-      sprintf(p, HTTP_REDIRECT_TEMPLATE, q);
-      return(p);
-   }
-   else
+   if (((fl = csp->actions_list) == NULL) || ((b = fl->f) == NULL))
    {
-      return(NULL);
+      return;
    }
 
+   apply_url_actions(csp->action, http, b);
 }
-#endif /* def FAST_REDIRECTS */
+
 
 /*********************************************************************
  *
- * Function    :  url_permissions
+ * Function    :  apply_url_actions
  *
- * Description :  Gets the permissions for this URL.
+ * Description :  Applies a list of URL actions.
  *
  * Parameters  :
- *          1  :  http = http_request request for blocked URLs
- *          2  :  csp = Current client state (buffers, headers, etc...)
+ *          1  :  action = Destination.
+ *          2  :  http = Current URL
+ *          3  :  b = list of URL actions to apply
  *
- * Returns     :  permissions bitmask specifiying what this URL can do.
- *                If not on list, will be default_permissions.
+ * Returns     :  N/A
  *
  *********************************************************************/
-int url_permissions(struct http_request *http, struct client_state *csp)
+void apply_url_actions(struct current_action_spec *action, 
+                       struct http_request *http, 
+                       struct url_actions *b)
 {
-   struct file_list *fl;
-   struct permissions_spec *b;
    struct url_spec url[1];
-   int permissions = csp->config->default_permissions;
 
-   if (((fl = csp->permissions_list) == NULL) || ((b = fl->f) == NULL))
+   if (b == NULL)
    {
-      return(permissions);
+      /* Should never happen */
+      return;
    }
 
    *url = dsplit(http->host);
@@ -907,7 +834,7 @@ int url_permissions(struct http_request *http, struct client_state *csp)
    /* if splitting the domain fails, punt */
    if (url->dbuf == NULL)
    {
-      return(permissions);
+      return;
    }
 
    for (b = b->next; NULL != b; b = b->next)
@@ -924,8 +851,7 @@ int url_permissions(struct http_request *http, struct client_state *csp)
 #endif
             )
             {
-               permissions &= b->mask;
-               permissions |= b->add;
+               merge_current_action(action, b->action);
             }
          }
       }
@@ -933,8 +859,6 @@ int url_permissions(struct http_request *http, struct client_state *csp)
 
    freez(url->dbuf);
    freez(url->dvec);
-   return(permissions);
-
 }
 
 
@@ -1020,13 +944,14 @@ struct url_spec dsplit(char *domain)
 
    memset(ret, '\0', sizeof(*ret));
 
-   if ((p = strrchr(domain, '.')))
+   if (domain[strlen(domain) - 1] == '.')
    {
-      if (*(++p) == '\0')
-      {
-         ret->toplevel = 1;
-      }
-   }
+         ret->unanchored |= ANCHOR_RIGHT;
+       }
+       if (domain[0] == '.')
+   {
+         ret->unanchored |= ANCHOR_LEFT;
+       }
 
    ret->dbuf = strdup(domain);
 
@@ -1050,6 +975,7 @@ struct url_spec dsplit(char *domain)
       memcpy(ret->dvec, v, size);
    }
 
+
    return(*ret);
 
 }
@@ -1059,11 +985,11 @@ struct url_spec dsplit(char *domain)
  *
  * Function    :  domaincmp
  *
- * Description :  Compare domain names.
- *                domaincmp("a.b.c" , "a.b.c")  => 0 (MATCH)
- *                domaincmp("a*.b.c", "a.b.c")  => 0 (MATCH)
- *                domaincmp("b.c"   , "a.b.c")  => 0 (MATCH)
- *                domaincmp(""      , "a.b.c")  => 0 (MATCH)
+ * Description :  Domain-wise Compare fqdn's. Governed by the bimap in
+ *                pattern->unachored, the comparison is un-, left-,
+ *                right-anchored, or both.
+ *                The individual domain names are compared with
+ *                trivialmatch().
  *
  * Parameters  :
  *          1  :  pattern = a domain that may contain a '*' as a wildcard.
@@ -1079,701 +1005,33 @@ int domaincmp(struct url_spec *pattern, struct url_spec *fqdn)
    char  *p,   *f;   /* chars    */
 
    pv = pattern->dvec;
-   pn = pattern->dcnt;
-
    fv = fqdn->dvec;
-   fn = fqdn->dcnt;
-
-   while ((pn > 0) && (fn > 0))
-   {
-      p = pv[--pn];
-      f = fv[--fn];
-
-      while (*p && *f && (*p == tolower(*f)))
-      {
-         p++, f++;
-      }
-
-      if ((*p != tolower(*f)) && (*p != '*')) return(1);
-   }
-
-   if (pn > 0) return(1);
-
-   return(0);
-
-}
-
+   fn = pn = 0;
 
-/* intercept functions */
-
-/*********************************************************************
- *
- * Function    :  show_proxy_args
- *
- * Description :  This "crunch"es "http:/any.thing/show-proxy-args" and
- *                returns a web page describing the current status of IJB.
- *
- * Parameters  :
- *          1  :  http = ignored
- *          2  :  csp = Current client state (buffers, headers, etc...)
- *
- * Returns     :  A string that contains the current status of IJB.
- *
- *********************************************************************/
-char *show_proxy_args(struct http_request *http, struct client_state *csp)
-{
-   char *s = NULL;
-
-#ifdef SPLIT_PROXY_ARGS
-   FILE * fp;
-   char buf[BUFSIZ];
-   char * p;
-   const char * filename = NULL;
-   const char * file_description = NULL;
-   char * query_string = strrchr(http->path, '?');
-   char which_file = '\0';
-
-
-   if (query_string != NULL)
+   while (fn < fqdn->dcnt && pn < pattern->dcnt)
    {
-      /* first char past the last '?' (maybe '\0')*/
-      which_file = query_string[1];
-   }
-   switch (which_file)
-   {
-   case 'p':
-      if (csp->permissions_list)
-      {
-         filename = csp->permissions_list->filename;
-         file_description = "Permissions List";
-      }
-      break;
-   case 'f':
-      if (csp->flist)
-      {
-         filename = csp->flist->filename;
-         file_description = "Forward List";
-      }
-      break;
-
-#ifdef ACL_FILES
-   case 'a':
-      if (csp->alist)
-      {
-         filename = csp->alist->filename;
-         file_description = "Access Control List";
-      }
-      break;
-#endif /* def ACL_FILES */
-
-#ifdef PCRS
-   case 'r':
-      if (csp->rlist)
-      {
-         filename = csp->rlist->filename;
-         file_description = "RE Filter List";
-      }
-      break;
-#endif /* def PCRS */
+      p = pv[pn];
+      f = fv[fn];
 
-#ifdef TRUST_FILES
-   case 't':
-      if (csp->tlist)
+      if (simplematch(p, f))
       {
-         filename = csp->tlist->filename;
-         file_description = "Trust List";
-      }
-      break;
-#endif /* def TRUST_FILES */
-   }
-
-   if (filename)
-   {
-      /* Display specified file */
-      /* FIXME: Add HTTP headers so this isn't cached */
-      s = strsav(s,
-         "HTTP/1.0 200 OK\n"
-         "Server: IJ/" VERSION "\n"
-         "Content-type: text/html\n"
-         "Pragma: no-cache\n"
-         "Last-Modified: Thu Jul 31, 1997 07:42:22 pm GMT\n"
-         "Expires:       Thu Jul 31, 1997 07:42:22 pm GMT\n"
-         "\n"
-
-         "<html>"
-         "<head>"
-         "<title>Internet Junkbuster Proxy Status - ");
-      s = strsav(s, file_description);
-      s = strsav(s, 
-         "</title>"
-         "</head>\n"
-         "<body bgcolor=\"#f8f8f0\" link=\"#000078\" alink=\"#ff0022\" vlink=\"#787878\">\n"
-         "<center>\n"
-         "<h1>" BANNER "\n");
-      s = strsav(s, file_description);
-      s = strsav(s, 
-         "</h1></center>\n"
-         "<p><a href=\"show-proxy-args\">Back to proxy status</a></p>\n"
-         "<h2>");
-      s = strsav(s, file_description);
-      s = strsav(s,
-         "</h2>\n"
-         "Contents of file &quot;<code>");
-      p = html_encode(filename);
-      s = strsav(s, p);
-      freez(p);
-      s = strsav(s,
-         "</code>&quot;:<br>\n"
-         "</p>\n"
-         "<pre>");
-      
-      if ((fp = fopen(filename, "r")) == NULL)
-      {
-         s = strsav(s, "</pre><h1>ERROR OPENING FILE!</h1><pre>");
-      }
-      else
-      {
-         while (fgets(buf, sizeof(buf), fp))
+                 if(pn || !(pattern->unanchored & ANCHOR_LEFT))
          {
-            p = html_encode(buf);
-            if (p)
-            {
-               s = strsav(s, p);
-               freez(p);
-               s = strsav(s, "<br>");
-            }
+            return 1;
          }
-         fclose(fp);
-      }
-
-      s = strsav(s,
-         "</pre>\n"
-         "<br>\n"
-         "<p><a href=\"show-proxy-args\">Back to proxy status</a></p>\n"
-         "<br>\n"
-         "<small><small><p>\n"
-         "The " BANNER " Proxy - \n"
-         "<a href=\"" HOME_PAGE_URL "\">" HOME_PAGE_URL "</a>\n"
-         "</small></small>"
-         "</body></html>\n");
-      return(s);
-   }
-#endif /* def SPLIT_PROXY_ARGS */
-   
-   s = strsav(s, csp->config->proxy_args_header);
-   s = strsav(s, csp->config->proxy_args_invocation);
-#ifdef STATISTICS
-   s = add_stats(s);
-#endif /* def STATISTICS */
-   s = strsav(s, csp->config->proxy_args_gateways);
-
-#ifdef SPLIT_PROXY_ARGS
-   s = strsav(s, 
-      "<h2>The following files are in use:</h2>\n"
-      "<p>(Click a filename to view it)</p>\n"
-      "<ul>\n");
-
-   if (csp->permissions_list)
-   {
-      s = strsav(s, "<li>Permissions List: <a href=\"show-proxy-args?permit\"><code>");
-      s = strsav(s, csp->permissions_list->filename);
-      s = strsav(s, "</code></a></li>\n");
-   }
-
-   if (csp->flist)
-   {
-      s = strsav(s, "<li>Forward List: <a href=\"show-proxy-args?forward\"><code>");
-      s = strsav(s, csp->flist->filename);
-      s = strsav(s, "</code></a></li>\n");
-   }
-
-#ifdef ACL_FILES
-   if (csp->alist)
-   {
-      s = strsav(s, "<li>Access Control List: <a href=\"show-proxy-args?acl\"><code>");
-      s = strsav(s, csp->alist->filename);
-      s = strsav(s, "</code></a></li>\n");
-   }
-#endif /* def ACL_FILES */
-
-#ifdef PCRS
-   if (csp->rlist)
-   {
-      s = strsav(s, "<li>RE Filter List: <a href=\"show-proxy-args?re\"><code>");
-      s = strsav(s, csp->rlist->filename);
-      s = strsav(s, "</code></a></li>\n");
-   }
-#endif /* def PCRS */
-
-#ifdef TRUST_FILES
-   if (csp->tlist)
-   {
-      s = strsav(s, "<li>Trust List: <a href=\"show-proxy-args?trust\"><code>");
-      s = strsav(s, csp->tlist->filename);
-      s = strsav(s, "</code></a></li>\n");
-   }
-#endif /* def TRUST_FILES */
-
-   s = strsav(s, "</ul>");
-
-#else /* ifndef SPLIT_PROXY_ARGS */
-   if (csp->clist)
-   {
-      s = strsav(s, csp->clist->proxy_args);
-   }
-
-   if (csp->flist)
-   {
-      s = strsav(s, csp->flist->proxy_args);
-   }
-
-#ifdef ACL_FILES
-   if (csp->alist)
-   {
-      s = strsav(s, csp->alist->proxy_args);
-   }
-#endif /* def ACL_FILES */
-
-#ifdef PCRS
-   if (csp->rlist)
-   {
-      s = strsav(s, csp->rlist->proxy_args);
-   }
-#endif /* def PCRS */
-
-#ifdef TRUST_FILES
-   if (csp->tlist)
-   {
-      s = strsav(s, csp->tlist->proxy_args);
-   }
-#endif /* def TRUST_FILES */
-
-#endif /* ndef SPLIT_PROXY_ARGS */
-
-   s = strsav(s, csp->config->proxy_args_trailer);
-
-   return(s);
-
-}
-
-
-static const char C_URL_INFO_HEADER[] =
-   "HTTP/1.0 200 OK\n"
-   "Pragma: no-cache\n"
-   "Expires:       Thu Jul 31, 1997 07:42:22 pm GMT\n"
-   "Content-Type: text/html\n\n"
-   "<html>\n"
-   "<head>\n"
-   "<title>Internet Junkbuster: URL Info</title>\n"
-   "</head>\n"
-   BODY
-   "<h1><center>"
-   BANNER
-   "</h1></center>\n"
-   "<p>Information for: <a href=\"http://%s\">http://%s</a></p>\n";
-static const char C_URL_INFO_FOOTER[] =
-   "\n</p>\n"
-   "</body>\n"
-   "</html>\n";
-
-static const char C_URL_INFO_FORM[] =
-   "HTTP/1.0 200 OK\n"
-   "Pragma: no-cache\n"
-   "Expires:       Thu Jul 31, 1997 07:42:22 pm GMT\n"
-   "Content-Type: text/html\n\n"
-   "<html>\n"
-   "<head>\n"
-   "<title>Internet Junkbuster: URL Info</title>\n"
-   "</head>\n"
-   BODY
-   "<h1><center>"
-   BANNER
-   "</h1></center>\n"
-   "<form method=\"GET\" action=\"http://i.j.b/show-url-info\">\n"
-   "<p>Please enter a URL, without the leading &quot;http:&quot;:</p>"
-   "<p><input type=\"text\" name=\"url\" size=\"80\">"
-   "<input type=\"submit\" value=\"Info\"></p>\n"
-   "</form>\n"
-   "</body>\n"
-   "</html>\n";
-
-
-/*********************************************************************
- *
- * Function    :  permissions_to_text
- *
- * Description :  Converts a permissionsfil entry from numeric form
- *                ("mask" and "add") to text.
- *
- * Parameters  :
- *          1  :  mask = As from struct permissions_spec
- *          2  :  add  = As from struct permissions_spec
- *
- * Returns     :  A string.  Caller must free it.
- *
- *********************************************************************/
-char * permissions_to_text(unsigned mask, unsigned add)
-{
-   char * result = strdup("");
-
-   /* sanity - prevents "-feature +feature" */
-   mask |= add;
-
-#define PERMISSION_TO_TEXT(__bit, __name)   \
-   if (!(mask & __bit))                     \
-   {                                        \
-      result = strsav(result, " -" __name); \
-   }                                        \
-   else if (add & __bit)                    \
-   {                                        \
-      result = strsav(result, " +" __name); \
-   }
-
-   PERMISSION_TO_TEXT(PERMIT_COOKIE_SET, "cookies-set");
-   PERMISSION_TO_TEXT(PERMIT_COOKIE_READ, "cookies-read");
-   PERMISSION_TO_TEXT(PERMIT_RE_FILTER, "filter");
-   PERMISSION_TO_TEXT(PERMIT_POPUPS, "popup");
-   PERMISSION_TO_TEXT(PERMIT_REFERER, "referer");
-   PERMISSION_TO_TEXT(PERMIT_FAST_REDIRECTS, "fast-redirects");
-   PERMISSION_TO_TEXT(PERMIT_BLOCK, "block");
-   PERMISSION_TO_TEXT(PERMIT_IMAGE, "image");
-
-   return result;
-}
-
-
- /*********************************************************************
- *
- * Function    :  ijb_show_url_info
- *
- * Description :  (please fill me in)
- *
- * Parameters  :
- *          1  :  http = http_request request for crunched URL
- *          2  :  csp = Current client state (buffers, headers, etc...)
- *
- * Returns     :  ???FIXME
- *
- *********************************************************************/
-char *ijb_show_url_info(struct http_request *http, struct client_state *csp)
-{
-   char * query_string = strchr(http->path, '?');
-   char * host = NULL;
-   
-   if (query_string != NULL)
-   {
-      query_string = url_decode(query_string + 1);
-      if (strncmpic(query_string, "url=", 4) == 0)
-      {
-         host = strdup(query_string + 4);
-      }
-      freez(query_string);
-   }
-   if (host != NULL)
-   {
-      char * result;
-      char * path;
-      char * s;
-      int port = 80;
-      struct file_list *fl;
-      struct permissions_spec *b;
-      struct url_spec url[1];
-      int permissions = csp->config->default_permissions;
-
-      result = (char *)malloc(sizeof(C_URL_INFO_HEADER) + 2 * strlen(host));
-      sprintf(result, C_URL_INFO_HEADER, host, host);
-
-      s = permissions_to_text(permissions, permissions);
-      result = strsav(result, "<h3>Defaults:</h3>\n<p><b>{");
-      result = strsav(result, s);
-      result = strsav(result, " }</b></p>\n<h3>Patterns affecting the URL:</h3>\n<p>\n");
-      freez(s);
-
-      s = strchr(host, '/');
-      if (s != NULL)
-      {
-         path = strdup(s);
-         *s = '\0';
       }
       else
       {
-         path = strdup("");
-      }
-      s = strchr(host, ':');
-      if (s != NULL)
-      {
-         *s++ = '\0';
-         port = atoi(s);
-      }
-
-      if (((fl = csp->permissions_list) == NULL) || ((b = fl->f) == NULL))
-      {
-         freez(host);
-         freez(path);
-         result = strsav(result, C_URL_INFO_FOOTER);
-         return result;
-      }
-
-      *url = dsplit(host);
-
-      /* if splitting the domain fails, punt */
-      if (url->dbuf == NULL)
-      {
-         freez(host);
-         freez(path);
-         result = strsav(result, C_URL_INFO_FOOTER);
-         return result;
-      }
-
-      for (b = b->next; NULL != b; b = b->next)
-      {
-         if ((b->url->port == 0) || (b->url->port == port))
-         {
-            if ((b->url->domain[0] == '\0') || (domaincmp(b->url, url) == 0))
-            {
-               if ((b->url->path == NULL) ||
-#ifdef REGEX
-                  (regexec(b->url->preg, path, 0, NULL, 0) == 0)
-#else
-                  (strncmp(b->url->path, path, b->url->pathlen) == 0)
-#endif
-               )
-               {
-                  s = permissions_to_text(b->mask, b->add);
-                  result = strsav(result, "<b>{");
-                  result = strsav(result, s);
-                  result = strsav(result, " }</b><br>\n<code>");
-                  result = strsav(result, b->url->spec);
-                  result = strsav(result, "</code><br>\n<br>\n");
-                  freez(s);
-                  permissions &= b->mask;
-                  permissions |= b->add;
-               }
-            }
-         }
-      }
-
-      freez(url->dbuf);
-      freez(url->dvec);
-
-      freez(host);
-      freez(path);
-
-      s = permissions_to_text(permissions, permissions);
-      result = strsav(result, "</p>\n<h2>Final Results:</h2>\n<p><b>{");
-      result = strsav(result, s);
-      result = strsav(result, " }</b><br>\n<br>\n");
-      freez(s);
-
-      result = strsav(result, C_URL_INFO_FOOTER);
-      return result;
-   }
-   else
-   {
-      return strdup(C_URL_INFO_FORM);
-   }
-}
-
-
-/*********************************************************************
- *
- * Function    :  ijb_send_banner
- *
- * Description :  This "crunch"es "http://i.j.b/ijb-send-banner and
- *                sends the image.
- *
- * Parameters  :
- *          1  :  http = http_request request for crunched URL
- *          2  :  csp = Current client state (buffers, headers, etc...)
- *
- * Returns     :  NULL, indicating that it has already sent the data.
- *
- *********************************************************************/
-char *ijb_send_banner(struct http_request *http, struct client_state *csp)
-{
-   write_socket(csp->cfd, JBGIF, sizeof(JBGIF)-1);
-   
-   return(NULL);
-}
-
-#ifdef TRUST_FILES
-/*********************************************************************
- *
- * Function    :  ij_untrusted_url
- *
- * Description :  This "crunch"es "http:/any.thing/ij-untrusted-url" and
- *                returns a web page describing why it was untrusted.
- *
- * Parameters  :
- *          1  :  http = http_request request for crunched URL
- *          2  :  csp = Current client state (buffers, headers, etc...)
- *
- * Returns     :  A string that contains why this was untrusted.
- *
- *********************************************************************/
-char *ij_untrusted_url(struct http_request *http, struct client_state *csp)
-{
-   int n;
-   char *hostport, *path, *refer, *p, *v[9];
-   char buf[BUFSIZ];
-   struct url_spec **tl, *t;
-
-
-   static const char format[] =
-      "HTTP/1.0 200 OK\r\n"
-      "Pragma: no-cache\n"
-      "Last-Modified: Thu Jul 31, 1997 07:42:22 pm GMT\n"
-      "Expires:       Thu Jul 31, 1997 07:42:22 pm GMT\n"
-      "Content-Type: text/html\n\n"
-      "<html>\n"
-      "<head>\n"
-      "<title>Internet Junkbuster: Request for untrusted URL</title>\n"
-      "</head>\n"
-      BODY
-      "<center><h1>"
-      BANNER
-      "</h1></center>"
-      "The " BANNER " Proxy "
-      "<A href=\"" HOME_PAGE_URL "\">"
-      "(" HOME_PAGE_URL ") </A>"
-      "intercepted the request for %s%s\n"
-      "because the URL is not trusted.\n"
-      "<br><br>\n";
-
-   if ((n = ssplit(http->path, "?+", v, SZ(v), 0, 0)) == 4)
-   {
-      hostport = url_decode(v[1]);
-      path     = url_decode(v[2]);
-      refer    = url_decode(v[3]);
-   }
-   else
-   {
-      hostport = strdup("undefined_host");
-      path     = strdup("/undefined_path");
-      refer    = strdup("undefined");
-   }
-
-   n  = sizeof(format);
-   n += strlen(hostport);
-   n += strlen(path    );
-
-   if ((p = (char *)malloc(n)))
-   {
-      sprintf(p, format, hostport, path);
-   }
-
-   strsav(p, "The referrer in this request was <strong>");
-   strsav(p, refer);
-   strsav(p, "</strong><br>\n");
-
-   freez(hostport);
-   freez(path    );
-   freez(refer   );
-
-   p = strsav(p, "<h3>The following referrers are trusted</h3>\n");
-
-   for (tl = csp->config->trust_list; (t = *tl) ; tl++)
-   {
-      sprintf(buf, "%s<br>\n", t->spec);
-      p = strsav(p, buf);
-   }
-
-   if (csp->config->trust_info->next)
-   {
-      struct list *l;
-
-      strcpy(buf,
-         "<p>"
-         "You can learn more about what this means "
-         "and what you may be able to do about it by "
-         "reading the following documents:<br>\n"
-         "<ol>\n"
-      );
-
-      p = strsav(p, buf);
-
-      for (l = csp->config->trust_info->next; l ; l = l->next)
-      {
-         sprintf(buf,
-            "<li> <a href=%s>%s</a><br>\n",
-               l->str, l->str);
-         p = strsav(p, buf);
+         pn++;
       }
-
-      p = strsav(p, "</ol>\n");
+      fn++;
    }
 
-   p = strsav(p, "</body>\n" "</html>\n");
-
-   return(p);
+   return ((pn < pattern->dcnt) || ((fn < fqdn->dcnt) && !(pattern->unanchored & ANCHOR_RIGHT)));
 
 }
-#endif /* def TRUST_FILES */
 
 
-#ifdef STATISTICS
-/*********************************************************************
- *
- * Function    :  add_stats
- *
- * Description :  Statistics function of JB.  Called by `show_proxy_args'.
- *
- * Parameters  :
- *          1  :  s = string that holds the proxy args description page
- *
- * Returns     :  A pointer to the descriptive status web page.
- *
- *********************************************************************/
-char *add_stats(char *s)
-{
-   /*
-    * Output details of the number of requests rejected and
-    * accepted. This is switchable in the junkbuster config.
-    * Does nothing if this option is not enabled.
-    */
-
-   float perc_rej;   /* Percentage of http requests rejected */
-   char out_str[81];
-   int local_urls_read     = urls_read;
-   int local_urls_rejected = urls_rejected;
-
-   /*
-    * Need to alter the stats not to include the fetch of this
-    * page.
-    *
-    * Can't do following thread safely! doh!
-    *
-    * urls_read--;
-    * urls_rejected--; * This will be incremented subsequently *
-    */
-
-   s = strsav(s,"<h2>Statistics for this " BANNER ":</h2>\n");
-
-   if (local_urls_read == 0)
-   {
-
-      s = strsav(s,"No activity so far!\n");
-
-   }
-   else
-   {
-
-      perc_rej = (float)local_urls_rejected * 100.0F /
-            (float)local_urls_read;
-
-      sprintf(out_str,
-         "%d requests received, %d filtered "
-         "(%6.2f %%).",
-         local_urls_read, 
-         local_urls_rejected, perc_rej);
-
-      s = strsav(s,out_str);
-   }
-
-   return(s);
-}
-#endif /* def STATISTICS */
-
 
 /*
   Local Variables: